母集団
私たちはサイコロを振ったときにどの目が出る確率も等しく 1/6 であることを「経験的に」知ってはいますが、まだ1度も振ったことのないサイコロについて、絶対にそうだと断言することはできません。しかし、100 回、200 回と振って、それぞれの目の出る数を集計すれば、その確率を推測することはできます。どの目もほぼ同じ回数だけでるのであれば確率が 1/6 であるといえますし、もしある目の出る回数が若干多かったり少なかったりするならば、そのサイコロは少しだけいびつな形をしている可能性があります(外見が正確な六面体であっても、密度が部分的に異なれば出る目に偏りが生じます)。また、ある工場で組み立てた PC を抜き取り検査して、500 台の中に不良品が 3 台あったとします。このとき、この工場で生産された 38,000 台の PC のうち不良品がいくつあるのかを統計的に推測できます。
サイコロを振ったときの1回ごとの試行結果や、工場で生産される1台の PC などのように、観測を行う個別の対象を個体(individual)とよびます。また個体全部の集合を 母集団(population)といいます。特に母集団に含まれる個体が有限であるときは有限母集団(finite population)、無限であるときは無限母集団(infinite population)とよびます。PC の例では、これまで工場で生産された全製品を対象とするなら有限母集団と考えられます。しかし今後生産される PC も含めて推測するなら、(無限に同じ型の PC が生産されることはありえないので、あくまで仮想的に)無限母集団と考えることができます。
標本調査
日本では統計法に基づいて 5 年ごとに国勢調査が実施されます。原則的に国内の全居住者を対象に性別、年齢、職業などを調査して統計資料を作成します。このように特定の母集団に属する全ての個体を調べることを全数調査とよびます。全数調査は母集団に関する完全な情報を得ることができますが、膨大な時間と費用がかかります。また「今後生産される製品」というような無限母集団を対象とする場合は全数調査は物理的に不可能です。
そこで多くの場合に、標本調査(sample survey)とよばれる手法がとられます。標本調査は以下の手順で行ないます。
① 予め定めておいた数(標本の大きさ)に達するまで母集団から個体を抽出(標本抽出)して標本を作ります。
② 標本に属する全ての個体について性質を調べます。
③ ②で得た情報から母集団の特性を推測します。
たとえば「サイコロを振って 6 の目が出る確率」を調査する場合にあてはめると、
① サイコロを 600 回振って出た目を記録します。
② 600 回のうち 6 の目が出たのは 102 回であることがわかりました。
③ サイコロを振ったときの確率は約 1/6 であると推測できます。
作られた標本に偏りが生じないために、標本抽出には 無作為抽出 という手法が用いられます。昔は乱数表が用いられていましたが、現在ではコンピュータで無作為抽出を行なっています。
エクセルや数学に関するコメントをお寄せください