母集団から標本を抽出し、データを集め平均を計算する場合、標本の平均を計算することが最終的な目的ではなく、標本からの情報を基に母集団の平均を知ることが目的であろう。一般に、標本からの情報を基に母集団の特性値を知る方法を推定といい、特性値についての仮説の是非を確かめる方法を検定という。
推定や検定で問題になるのは、標本から得られるデータには(標本)誤差が含まれているということである。推定や検定を行うということはこの(標本)誤差をどう評価してやるかということである。
標本誤差を知るための道具として、標本分布がある。
標本から計算される平均の値は、標本を1つ抽出した場合、1つ決まる。仮に、標本抽出を繰り返し行い、平均をその都度計算したとしよう。たくさんの平均の値がでてくるはずで、この平均の値について分布を考えることができる。これが、平均の標本分布になる。
標本平均 の標本分布は、次のような性質がある。
(1)
の平均は、母集団の平均
(2)
の分散は、
(3.1)
n が大きいとき、の分布は正規分布
(3.2)
母集団分布が正規分布であれば、の分布は正規分布
比率の場合、変数を とおけば、
はYESの標本比率 pと等しくなる。よって、標本比率の標本分布についても次のような性質がある。
(1)
pの平均は、母集団での比率P
(2)
pの分散は、
(3)
n が大きいとき、p の分布は正規分布