層別抽出法(stratified sampling)と統計調査
統計学的な社会調査には、母集団に属する全ての人(標本)を調査する『全数調査』と母集団の中から全体の代表性の高い人を抽出(サンプリング)して調査する『標本調査(サンプリング調査)』とがある。テレビの視聴率や国勢調査などでも『全数調査』は行われていないが、全数調査は『経済的コスト・時間的コスト・人的コスト』が非常に大きくなるという欠点があり、母集団が大きくなると殆ど実施されることはない。標本調査は一般的に、研究者の主観的・作為的なサンプルの選別が関与しない『無作為抽出法(random sampling)』によって行われることが望ましいとされる。
標本調査(サンプリング調査)で、サンプルを抽出する方法には研究者の主観を介在させない『無作為抽出法』以外にも、研究者の主観によって『偏りの小さそうなサンプル』を選んでいく『有意抽出法』とがあるが、無作為抽出法のほうが統計調査の信頼性と客観性が高くなる。
母集団からサンプルをランダムに抽出する無作為抽出法は『確率標本抽出法』と呼ばれ、『確率論による代表性』が『大数の法則』によって保証されているので統計調査の精度が高くなるのである。一方、研究者の主観・恣意によって『偏りの小さそうな代表的サンプル』を抽出していく有意抽出法は『非確率標本抽出法』と呼ばれる。
標本調査(サンプリング調査)で最も重視されることは、母集団全体の性質を的確に代表できる『偏りの小さい標本』をどうにかして抽出することであり、その実践的方法である無作為抽出法には『単純無作為抽出法・系統抽出法(等間隔抽出法)・層別抽出法(層化抽出法・多段無作為抽出法』という4つの方法がある。ここでは、一般的な層別抽出法について簡単に説明をする。
『層別抽出法(層化抽出法)』とは、母集団を何らかの基準に基づいて幾つかの層(小集団)に分割して、各層のサンプルに対して更に単純無作為抽出や系統抽出を行っていく標本調査の方法である。単純無作為抽出というのは無作為抽出法の最も原理的な方法で、くじ引きや乱数表などを用いて、人間の意志・主観を排除してランダムにサンプリングするものである。系統抽出というのは、時間・労力のコストがかからないので比較的多く用いられる方法であり、母集団のサンプルを並べたリストから『標本を等間隔で機械的に抽出する(2の倍数や5の倍数といった基準で等間隔にサンプルを抽出する)』というものである。
層別抽出法では、母集団(サンプル全体)を幾つかの『層(小集団)』に分けて分割していくが、この層(小集団)は均質的で偏りが小さいことが望ましい。その為、層別抽出法では一つの小集団内部(層内部)の分散を小さくして、複数の小集団間の分散を大きくすることができ、統計調査の推測の誤差を小さくして精度を向上させられるメリットがある。母集団を複数の層(小集団)に分割して、各層からランダムにサンプリングしていくことで、統計学的操作を行うサンプル数(標本数)を小さく抑えられるという利点もある。