統計学的な仮説検定(test)と帰無仮説・対立仮説
「サンプリング調査(標本調査)における無作為抽出法(random sampling)と有意抽出法」では、統計学のサンプリング(標本抽出)の基礎について解説したが、サンプリングは各種の統計学的な「検定(test)」のために実施されるものである。検定(test)は“Hypothesis testing”とも呼ばれるように、ある仮説が真であるか偽であるかを確認するための数理的な方法のことである。比較対照試験では、A群とB群といった複数の集団の間に「有意差」があるかないかを検定するが、有意差の基準として“p”や“α”などの記号で示される「危険率(有意水準)」が通常用いられている。
仮説の真偽を検証する「仮説検定(hypothesis testing)」では、実験研究(experiment study)や調査研究(research study)によって集めたデータから作り上げた「対立仮説(alternative hypothesis)」の正しさを証明することをとりあえずの目的とする。その目的を達成するために、対立仮説の正当性を否定する「帰無仮説(null hypothesis)」を立てて、帰無仮説(きむかせつ)を棄却することで対立仮説の正しさを統計学的に証明するのである。故に、統計学的検定の直接的な対象となるのは帰無仮説であり、危険率(有意水準)として設定される“α=0.05(5%)”に“偶発的な誤差の範囲”が収まっていれば、「対立仮説は統計学的に有意である」といってよい。
しかし、統計学的な仮説検定の妥当性や信頼性を高めるためには、「十分な母集団の大きさ」と「無作為抽出によるサンプリング」が必要であり、サンプルを抽出する母集団が小さすぎたり、サンプリングの対象となる標本が偏り過ぎたりしていると、有効な仮説検定を行うことは出来ない。統計学で慣例的に用いられている危険率α=0.05に実証的な納得のいく根拠がないという批判もあるが、偶発的に起こり得る誤差の範囲が5%以内に収まるというのは経験的に確からしいとは言えるだろうし、統計学的な推測の前提として有用性が高いものである。統計学の仮説検定で起こり得るエラーには、以下の3種類があり危険率(有意水準)とは「第一種の過誤」が起こる確率のことである。
第一種の過誤(Type T error)……帰無仮説が正しいのに、間違って棄却してしまうというエラー。
第二種の過誤(Type U error)……帰無仮説が間違っているのに、間違って採用してしまうというエラー。
第三種の過誤(Type V error)……目的を達成するための検定方法の選択の時点で間違ってしまっているというエラー。
母集団の分布パターンについて仮説を設けるパラメトリックな検定には、F検定やt検定、回帰分析があり、母集団の分布パターンについて仮説を設けない