F検定(F-test)とF分布(F-distribution):統計学の仮説検定
統計学的処理によってある仮説(hypothesis)が正しいかどうかを調べたり、ある薬剤や治療法に十分なエビデンス(科学的根拠・統計学的根拠)があるのかを検証する為には、対立仮説と帰無仮説(Null hypothesis)を設定して『仮説検定』を行う必要がある。正当性や妥当性を証明しようとしている仮説のことを『対立仮説』といい、その対立仮説の正しさ(確からしさ)を棄却(否定)する仮設のことを『帰無仮説』というが、証明しようとする対立仮説が正しいのであれば帰無仮説のほうが棄却されることになる。
統計学的な有意性は、実験群と対照群(統制群)を用いた比較試験などで検証されるが、二つの群の間に見られる差に意味があるのか偶然であるのかは『有意水準(危険率)』を指標にして判断される。有意水準(危険率)とは、帰無仮説を支持する標本(サンプル)が母集団から抽出される確率であり、通常、有意水準α=0.05(5%)、α=0.01(1%)が設定される。
帰無仮説を支持する標本(サンプル)が抽出される確率が、設定されたp(有意水準・危険率)よりも高ければ、対立仮説が間違っている可能性が高くなる。反対に、帰無仮説を支持する標本が出てくる確率が、αよりも小さければ帰無仮説を棄却することができ、証明しようとしている対立仮説が確率論的(統計学的)に確からしい(正しい)と考えることが出来る。統計学的解析による対立仮説の証明は、最終的に、帰無仮説を棄却することを目標とすることになる。
統計学で最も平均的な分布は、ガウス分布とも呼ばれる釣鐘型の正規分布(normal-distribution)であるが、F分布(F-distribution)とは正規分布曲線を描かない分布の一つである。正規分布をする母集団から2つの標本(サンプル)を抽出して、そのばらつき(不偏分散)の分散比Fを測定すると、その分布はF分布になっている。母集団から抽出した2つの標本をb1,b2とする時、分散比Fは自由度(b1-1, b2-1)を持ち、f(F)の関数表記をすることが可能で、F分布はF検定に用いられる。
F検定(F-test)というのは、2つの正規母集団のばらつき(母分散)に差があるかどうかを検定する統計学的な検定法である。2つの正規母集団から抽出する標本の数は違っていても良いが、正規母集団の分散の平均は既知のものとしてF検定を実施する。つまり、F検定における帰無仮説は、『2つの正規母集団の分散の平均は等しい』というものになる。
2つの正規母集団から抽出される標本の大きさをb1,b2とし、標準偏差をσ1,σ2とするならば、F値は、“F=b1σ1^2/(b1-1)”÷“b2σ2^2/(n2-1)”ただしσ1>σ2 という公式で求めることが出来る。ウェブ上では公式を表現しにくいが、実際には、÷の前の式を分子、÷の後ろの式を分母とする形となる。対立仮説は、両側検定と片側検定が考えられるが、両側検定の場合は有意水準(危険率)を2/αとし、片側検定の場合は有意水準をαに設定する。
F検定では、自由度を(b1-1, b2-1)として、仮説の棄却限界値F(α,σ)を求めるが、上記の公式から導かれる統計量Fが棄却限界値よりも大きければ、対立仮説は確からしいと判断でき、帰無仮説を棄却することができる。