二項分布
成功率
によって与えられます (『反復試行』の記事参照)。そこでたとえば 1 枚の硬貨を 5 回投げて表が出る回数を
となります。すべての
実際にコインを投げるところを想像すると、この結果は直感と合っています。全てが裏である (X=0) 、あるいは表である(X=5)確率はとても小さく、表が 2 枚と 3 枚である確率が最も大きくなっています。また各試行において「表が出る」確率と「裏が出る」確率は同じなので、
というように対称形になっています。一般に確率変数のとり得る値が正の整数であり、確率密度関数が次のような形(ただし
で与えられるような確率分布を 二項分布(Binomial Distribution)あるいはベルヌーイ分布(Bernoulli distribution) とよび、
上のグラフは硬貨を 5 回(赤)、10 回 (青)、20 回投げて表(あるいは裏)が何回出るかという確率を示す分布図です。試行回数
二項分布の期待値
二項分布の確率の和が 1 になっていることを確認しておきましょう。確率密度関数
において
となりますが、左辺は
となって確率の和が 1 であるという条件を満たしていることがわかります。次は二項分布の平均値(期待値)を求めてみます。やや技巧的ですが
の両辺を
両辺に
という式が得られます。ここで右辺は
なので、これは平均値
というように平均値は試行回数と確率の積で表されます。たとえばコイン投げのように確率 1/2 の試行を 100 回繰り返せば、表も裏もおおよそ 50 回ずつ出るという、当たり前のことを式にしているだけです。
二項分布の分散
次は二項分布の分散を求めます。(5) 式を再掲すると
この式をもう一度
両辺に
となります。ここで (6) 式
を用いると
となります。ここで分散の公式
と書いてみると、
を用いて二項分布の分散
を得ます。分散も試行回数
硬貨を 10 回投げて表が出る回数を
で与えられます。また標準偏差は
となります。
【Excel】BINOM.DIST関数
二項分布を調べるために、Excel には BINOM.DIST という関数が用意されています。BINOM.DIST は BINOMIAL DISTRIBUTION (二項分布) の略です。この関数は
=BINOM.DIST(X,n,p,0)
という形で使用します。すなわち
=BINOM.DIST(成功数,試行回数,成功率,関数形式)
であり、引数に応じて確率 P(X) を返します。関数形式は 0 としておいてください( 1 と指定すると累積分布関数になります)。たとえば、
=BINOM.DIST(2,10,1/6,0)
と入力すると「サイコロを 10 回振って 1 の目が 2 回出る確率」に相当する値を計算します。この関数を用いて X を横軸に、P(X) を縦軸にプロットしてみましょう。まずはワークシートに次のようなデータを作っておきます。
B 列には X の値を 0 から 10 までを入れておきます。セル C2 には
=BINOM.DIST(B2,10,1/6,0)
と入力し、オートフィルで(あるいはセルの右下隅をダブルクリックして)セル C12 までデータを埋めます。これをマーカー付散布図でプロットしてみると、次のようなグラフが得られます。
これが二項分布 B(10, 1/6) にしたがう確率密度のグラフです。「1 の目が 1 回だけ出る確率」が最も高く、その次に「2 回出る確率」となっています。二項分布の平均値は μ = np で計算できることが知られています。今の場合は
μ = 10/6 = 5/3 = 1.667
となり、1 と 2 の中間あたりに平均値が存在していることになります。要するにサイコロを 10 回投げると「1 回か 2 回ほど 1 の目が出る」ということです。グラフを見ると、6 回以上同じ目が出るのは極めて稀な現象であることもわかります。
二項分布 B(n, p) が p に応じてどのように変化するのか調べてみましょう。先ほどのグラフに B(10, 5/6) と B(10, 3/6) のグラフを重ねてみます。
青い線で描かれた B(10, 5/6) は B(10, 1/6) と対称な形になっています。p = 5/6 は「 1 以外の数が出る確率」、言い換えると「 1 の目が 1 回も出ない」確率に相当するからです。また緑の線で描かれた B(10, 3/6) すなわち B(10, 1/2) は「コインを 10 回投げて表が X 回出る」ような確率分布です。たとえば「表が 4 回出る確率」と「表が 6 回出る確率 = 裏が 4 回出る確率」は同じなので、このように左右対称なグラフになります。
エクセルや数学に関するコメントをお寄せください