母集団と標本

 

 母集団から標本を抽出し、データを集め平均を計算する場合、標本の平均を計算することが最終的な目的ではなく、標本からの情報を基に母集団の平均を知ることが目的であろう。一般に、標本からの情報を基に母集団の特性値を知る方法を推定といい、特性値についての仮説の是非を確かめる方法を検定という。

 推定や検定で問題になるのは、標本から得られるデータには(標本)誤差が含まれているということである。推定や検定を行うということはこの(標本)誤差をどう評価してやるかということである。

 

標本分布

 

 標本誤差を知るための道具として、標本分布がある。

 標本から計算される平均の値は、標本を1つ抽出した場合、1つ決まる。仮に、標本抽出を繰り返し行い、平均をその都度計算したとしよう。たくさんの平均の値がでてくるはずで、この平均の値について分布を考えることができる。これが、平均の標本分布になる。

 

標本平均  の標本分布は、次のような性質がある。

 

              (1) の平均は、母集団の平均

              (2) の分散は、

              (3.1) n が大きいとき、の分布は正規分布

              (3.2) 母集団分布が正規分布であれば、の分布は正規分布

 

比率の場合、変数を  とおけば、YESの標本比率 pと等しくなる。よって、標本比率の標本分布についても次のような性質がある。

 

              (1) pの平均は、母集団での比率P

              (2) pの分散は、

              (3) n が大きいとき、p の分布は正規分布