ウェブとブログの検索

カスタム検索





2012年06月20日

不偏分散(unbiased variance)

不偏分散(unbiased variance)

F検定を実施して、2つの正規分布する母集団のばらつき(母分散)に違いがあるか否かを調べる時に参照するのが 『不偏分散(unbiased variance)』である。2つの母集団から標本を抽出して『標本分散(sample variance)』のばらつきを求める公式は以下のようになっている。

n個のデータx1,x2,…,x{n-1},x{n}からなる標本があって、yをそのデータの相加平均とした場合に、(y-x{i})^2の相加平均として表されるのが『標本分散(sample variance)』であり、公式は“S^2=1/nΣ(y-x{i})^2”(Σはi=1からnまでの総和)となる。標本分散は統計学の理論的には、『2乗した各サンプルの相加平均』から『相加平均を2乗したもの』を引いた値と同値になる。公式は“S^2=1/nΣx{i}^2-y^2=x^2の相加平均-y^2”(Σはi=1からnまでの総和)となり、Sというのは『標準偏差(SD:Standard Deviation)』を表している。

つまり、標準偏差を2乗すると『分散(V:variance)』に等しくなるということである。サンプル数が十分に大きくない時には、標本分散はその期待値が母分散(母集団の分散)よりも少し小さくなる事が知られている。そこで期待値が母分散に等しくなるようにするために、“n-1”『有限補正(finite population correction)』を掛ける必要がでてくる。この分散は母分散の不偏推定量であることから『不偏分散 (unbiased variance)』と呼ばれており、標本分散の分母の“n”“n-1”の自由度に置き換えたものになる。

不偏分散を求める公式は“u^2=1/n-1Σ(y-x{i})^2”であり、上記したように標本分散の分母の“n”“n-1”の自由度に置き換えただけのものである。母集団のサンプル数が十分に多ければ、不偏分散と標本分散の数値は一致するので、“n-1”の自由度を用いる必要はなくなるが、サンプル数が少なければ標本分散は母分散より少し小さくなるので“n-1”で割る必要が出てくるということである。

母集団だけからいくつかのサンプルを抽出して平均を出すと、それらのサンプルだけの『平均値(標本平均)』は分かるものの、母集団に含まれるサンプル全ての『母平均』は分からない。これは母分散に比べると標本分散のほうが、『真の平均値(母平均)』が分からないので、情報量がn個より1個少ないということを意味している。この状況を指して、自由度が1個少ないと言っているのであり、分母を“n−1”にすることで分母が“n”の時よりも分散を多く見積もっていることになる。『真の平均値(母平均)』が分からない標本抽出の統計的推測では、分母を“n-1”の自由度にすることで分散値を大きめに補正しているのであり(=不偏分散にしているのであり)、標本分散のように分母を“n”にしてしまうと分散値が実際よりも小さくなってしまうのだ。



ラベル:統計学 分散
posted by ESDV Words Labo at 13:46 | TrackBack(0) | ふ:心理学キーワード | このブログの読者になる | 更新情報をチェックする

この記事へのトラックバック
×

この広告は180日以上新しい記事の投稿がないブログに表示されております。