Excel VBA 数学教室ではアフィリエイトプログラムを利用して商品を紹介しています。

確率密度と累積分布関数

確率密度

確率変数 $X$ が離散的で有限個の値
 \[x_1,\:x_2,\:\cdots,\:x_n\]
をとるとき、$x_i\:(i=1,\:2,\cdots\:n)$ となる確率を
 \[P(X=x_i)=p_i\]
と表すことにします。これを全ての実数 $x$ に拡大した関数
 \[f(x)=\begin{cases}p_i & (x=x_i)\\[6pt]0 & (x \neq x_i)\end{cases}\]
確率密度関数 (probability density function) あるいは単に 確率密度 (probability density) とよびます。本来なら値をもたない $P(X\neq x_i)$ を改めて「確率 0 」と定義した関数です。たとえばサイコロを 1 回投げて出た目を確率変数 $X$ とした場合、確率密度は
 \[f(x)=\begin{cases}\cfrac{1}{6} & (x=1,2,3,4,5,6)\\[6pt]
0 & (x \neq x_i)\end{cases}\]
となります。つまり 6 個の点のみで 1/6 という値をもち、その他の全ての $x$ で 0 となるような関数です(下図参照)。
 
Excel確率密度Probability Density

確率の和は 1 なので確率密度には
 \[\sum_{i=1}^{n}f(x_i)=f(x_1)+f(x_2)+\:\cdots\:+f(x_i)=1\]
という条件が付きます。

累積分布関数

確率変数が離散的な値をとる場合

確率変数 $X$ のとる値が $x$ 以下である確率を表すような関数
 \[F(x)=P(X\leq x)=\sum_{x_i\leq x}f(x)\]
を定義します。これを分布関数 (distribution function)、あるいは 累積分布関数 (cumulative distribution function) といいます。たとえばサイコロを 1 回投げて出た目を確率変数 $X$ とするとき、分布関数 $F(x)$ のグラフは次のように階段状になります。
 
Excel確率分布Distribution Function
 サイコロの出る目が 3 以下になる確率は
 \[F(3)=P(X\leq x)=\frac{1}{6}+\frac{1}{6}+\frac{1}{6}=\frac{1}{2}\]
で与えられますが、$F(3.5)$ のように変数が整数以外の値をとった場合も、「出る目が 3.5 以下である確率」なので、これは「出る目が 3 以下である確率」に等しく、やはり $F(3.5)=1/2$ となります。また定義から明らかなように
 \[F(-\infty)=0,\quad F(\infty)=1\]
が成り立ちます。確率変数が $\alpha\lt X\beta$ である確率は
 \[P(\alpha\lt X\leq\beta)=F(\beta)-F(\alpha)=\sum_{\alpha\lt x_i\leq\beta}f(x_i)\]
によって与えられます。

確率変数が連続的な値をとる場合

確率変数 $X$ が $a\leq X\leq b$ の範囲で連続的な値をとるときには、$X$ が $x$ と $x+\Delta x$ の間にある確率が
 \[P(x\leq X\leq x+\Delta x)=\int_{x}^{x+\Delta x}f(t)dt\]
となるような関数を確率密度 $f(x)$ と定義します。すべての確率の和は 1 となるので、$f(x)$ は
 \[\int_{a}^{b}f(x)dx=\int_{-\infty}^{\infty}f(x)dx=1\]
を満たしています。$X$ の値がある $x$ 以下である確率は
 \[P(X\leq x)=F(x)=\int_{a}^{x}f(t)dt=\int_{-\infty}^{x}f(t)dt\]
で求めることができます。また $X$ が $\alpha\lt X\leq\beta$ の範囲の値をとる確率は
 \[P(\alpha\leq X\leq\beta)=F(\beta)-F(\alpha)=\int_{\alpha}^{\beta}f(x)dx\]
となります。

ルーレット

下図のようなルーレット盤があるとします。
 
Excelルーレット
 
$a$ と $b$ は 0 から測った弧の長さです。
針が $a$ と $b$ の間に入る確率は $b-a$ に比例して
 
\[P(a\leq X\leq b)=k(b-a)\]
という形になっているはずです($k$ は定数)。針がルーレット盤のどこかにある確率は 1 なので
 
\[P(0\leq X\leq 12)=12k=1\]
から $k=1/12$ が定まります。したがって
 
\[P(a\leq X\leq b)=\frac{1}{12}(b-a)=\int_{a}^{b}\frac{dx}{12}\]
と書けるので、確率密度は
 
\[f(x)=\frac{1}{12}\quad (0\leq x\leq 12)\]
であり、分布関数は
 
\[f(x)=\frac{x}{12}\quad (0\leq x\leq 12)\]
で与えられます。

エクセルや数学に関するコメントをお寄せください