確率密度と累積分布関数

 

確率密度 Probability Dencsity Function

 確率変数 $X$ が離散的で有限個の値
 
\[x_1,\:x_2,\:\cdots,\:x_n\]
をとるとき、$x_i\:(i=1,\:2,\cdots\:n)$ となる確率を
 
\[P(X=x_i)=p_i\]
と表すことにします。これを全ての実数 $x$ に拡大した関数

\[f(x)=\begin{cases}p_i & (x=x_i)\\[6pt]0 & (x \neq x_i)\end{cases}\]

確率密度関数 (probability density function) あるいは単に 確率密度 (probability density) とよびます。本来なら値をもたない $P(X\neq x_i)$ を改めて「確率 0 」と定義した関数です。たとえばサイコロを 1 回投げて出た目を確率変数 $X$ とした場合、確率密度は
 
\[f(x)=\begin{cases}\cfrac{1}{6} & (x=1,2,3,4,5,6)\\[6pt]
0 & (x \neq x_i)\end{cases}\]
となります。つまり 6 個の点のみで 1/6 という値をもち、その他の全ての $x$ で 0 となるような関数です(下図参照)。

 Excel確率密度Probability Density

 確率の和は 1 なので確率密度には

\[\sum_{i=1}^{n}f(x_i)=f(x_1)+f(x_2)+\:\cdots\:+f(x_i)=1\]

という条件が付きます。
 

累積分布関数 Cumulative Distribution Function

確率変数が離散的な値をとる場合

確率変数 $X$ のとる値が $x$ 以下である確率を表すような関数

\[F(x)=P(X\leq x)=\sum_{x_i\leq x}f(x)\]

を定義します。これを 分布関数 (distribution function) 、あるいは 累積分布関数 (cumulative distribution function) といいます。たとえばサイコロを 1 回投げて出た目を確率変数 $X$ とするとき、分布関数 $F(x)$ のグラフは次のように階段状になります。

 Excel確率分布Distribution Function

 サイコロの出る目が 3 以下になる確率は
 
\[F(3)=P(X\leq x)=\frac{1}{6}+\frac{1}{6}+\frac{1}{6}=\frac{1}{2}\]
で与えられますが、$F(3.5)$ のように変数が整数以外の値をとった場合も、「出る目が 3.5 以下である確率」なので、これは「出る目が 3 以下である確率」に等しく、やはり $F(3.5)=1/2$ となります。また定義から明らかなように
 
\[F(-\infty)=0,\quad F(\infty)=1\]
が成り立ちます。確率変数が $\alpha\lt X\beta$ である確率は
 
\[P(\alpha\lt X\leq\beta)=F(\beta)-F(\alpha)=\sum_{\alpha\lt x_i\leq\beta}f(x_i)\]
によって与えられます。

確率変数が連続的な値をとる場合

 確率変数 $X$ が $a\leq X\leq b$ の範囲で連続的な値をとるときには、$X$ が $x$ と $x+\Delta x$ の間にある確率が

\[P(x\leq X\leq x+\Delta x)=\int_{x}^{x+\Delta x}f(t)dt\]

となるような関数を確率密度 $f(x)$ と定義します。すべての確率の和は 1 となるので、$f(x)$ は
 
\[\int_{a}^{b}f(x)dx=\int_{-\infty}^{\infty}f(x)dx=1\]
を満たしています。$X$ の値がある $x$ 以下である確率は
 
\[P(X\leq x)=F(x)=\int_{a}^{x}f(t)dt=\int_{-\infty}^{x}f(t)dt\]
で求めることができます。また $X$ が $\alpha\lt X\leq\beta$ の範囲の値をとる確率は
 
\[P(\alpha\leq X\leq\beta)=F(\beta)-F(\alpha)=\int_{\alpha}^{\beta}f(x)dx\]
となります。

ルーレット

 下図のようなルーレット盤があるとします。

 Excelルーレット

 $a$ と $b$ は 0 から測った弧の長さです。
 針が $a$ と $b$ の間に入る確率は $b-a$ に比例して
 
\[P(a\leq X\leq b)=k(b-a)\]
という形になっているはずです($k$ は定数)。針がルーレット盤のどこかにある確率は 1 なので
 
\[P(0\leq X\leq 12)=12k=1\]
から $k=1/12$ が定まります。したがって
 
\[P(a\leq X\leq b)=\frac{1}{12}(b-a)=\int_{a}^{b}\frac{dx}{12}\]
と書けるので、確率密度は
 
\[f(x)=\frac{1}{12}\quad (0\leq x\leq 12)\]
であり、分布関数は
 
\[f(x)=\frac{x}{12}\quad (0\leq x\leq 12)\]
で与えられます。 ≫ 数学事典

スポンサーリンク
スポンサーリンク
末尾広告
末尾広告

コメントをどうぞ

メールアドレスが公開されることはありません。

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください