変動係数CV(データ同士のばらつき具合を比較します)

 

変動係数 Coefficient of variation

 $n$ 個のデータ $x_1,\:x_2,\:\cdots,\:x_N$ があったとき、標準偏差 $\sigma$ は
 
\[\sigma=\sqrt{V}=\sqrt{\frac{\sum_{i=1}^{N}(x_i-m)^2}{n}}\]
で与えられます。ここで $V$ は分散、$m$ は平均です。標準偏差はデータのばらつき具合を表しますが、平均値や単位の異なるデータ同士で標準偏差を比較しても意味はありません(式の中に平均値からの差分が含まれているので、平均値の大きなデータの標準偏差は大きくなります)。たとえば、ある集団の身長の標準偏差が 12 cm, 体重の標準偏差が 9 kg だったとしても、身長のほうが体重よりばらつきが多いとは言えないのです。そこで標準偏差を平均で割って無次元の量を定義します。
 
\[CV=\frac{\sigma}{m}\]
 この量を 変動係数 とよび、異なる平均値や単位をもつデータ同士のばらつきを比較する ために用いられます。たとえば

  平均身長 170 cm  標準偏差 12 cm
  平均体重 60 kg  標準偏差 9 kg

というデータがあった場合、変動係数はそれぞれ

  身長の変動係数 $=12/170=0.07$
  体重の変動係数 $=9/60=0.15$

となるので、体重のほうがばらつきが大きいことになります。以下で Excel を使ってより具体的な例を見てみます。
 

Excel で変動係数を計算します

 あるクラスから無作為に 10 名を選んで身長と体重のデータを記録すると次のようになったとします。

番号 身長 [cm] 体重 [kg]
1 161.24 59.99
2 162.67 61.48
3 157.99 55.86
4 172.04 64.74
5 169.97 61.02
6 168.4 59.47
7 179.52 83.33
8 152.22 55.85
9 166.18 59.7
10 153.19 58.19

 Excel で分母が $n$ の標準偏差(母集団標準偏差)を計算する関数は

=STDEV.P(数値1,[数値2, ...])

です。Excel2007 以前のバージョンでは STDEVP関数を使用してください。一般には引数に範囲を指定して使用します。平均値は AVERAGE関数で計算できるので、D14 セルには

=STDEV.P(C3:C12)/AVERAGE(C3:C12)

と入力すると身長の変動係数 0.0496 が得られます。

 Excelで変動係数 coefficient of variation を計算

 同様に D15 セルには

=STDEV.P(D3:D12)/AVERAGE(D3:D12)

と入力して 0.1218 を得るので、体重のほうがばらつきが大きいことがわかります。
 ≫ 数学事典

スポンサーリンク
スポンサーリンク
末尾広告
末尾広告

コメントをどうぞ

メールアドレスが公開されることはありません。

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください