【本記事限定】標本平均の分散の注意点(nで割るな!)
分散を\(σ^2/n\)とサンプル数nで割る公式。でも「サンプル数nが大きいと分散\(σ^2/n\)が低減される」のは不思議だと思いませんか?「数学的に証明された公式だから」といってそのまま計算していませんか?
こういう疑問に答えます。
本記事のテーマ
標本平均の分散の注意点(nで割るな!)
- ➀数学的に正しい標本平均の分散\(σ^2/n\)の注意点
- ②標本平均の分散は\(σ^2/n\)で良いのか?
- ③標本平均の分散はあなたが判断する
さっそく見ていきましょう。
➀数学的に正しい標本平均の分散\(σ^2/n\)の注意点
標本平均の分散\(σ^2/n\)が正しいのかどうかと言われたら、最初に「数学的に正しいのか?」を疑うはずです。まず、標本平均の分散を紹介して、数学的に正しいことを証明します。
標本平均の分散
\(V(\bar{x})=σ^2/n\) が正規分布や、検定・推定によく出てくる式なので無条件にnで割りますよね。しかも、大数の法則や中心極限定理で数学的に証明されているから、安心して公式を使って良いのです。
標本平均の分散\(σ^2/n\)の証明
\(V(\bar{x})
=V(\frac{x_1+x_2+…+x_n}{n})\)
=\(\frac{1}{n^2}(V(x_1)+V(x_2)+…+V(x_n))\)
=\(\frac{1}{n^2} (σ^2+σ^2+…+σ^2)\)
=\(\frac{1}{n^2} nσ^2\)
=\(\frac{σ^2}{n}\)
シンプルに証明できます。
②標本平均の分散は\(σ^2/n\)で良いのか?
標本平均の分散をサンプル数で割って良いかを悩ます例題
を紹介します。
標本平均の分散を悩ます問題
(1)サンプルn=4の製品を取り出したところ、性能の平均は51だった。製法の違いが出たといえるか?
(2)サンプルn=100の製品を取り出したところ、性能の平均は51だった。製法の違いが出たといえるか?
サンプル数によって検定結果が変わります。
。計算して確かめてみましょう。
検定については、ここを見てください。検定統計量を定義します。
検定統計量 \(Z=\frac{\bar{x}-μ}{σ/\sqrt{n}}\)
なお、片側検定の有意水準5%ですからZ0=1.96で判断します。
(1) \(Z=\frac{\bar{x}-μ}{\sqrt{n}}\)=\(Z=\frac{51-50}{5/\sqrt{4}}\)=0.4 1.96
(2) \(Z=\frac{\bar{x}-μ}{\sqrt{n}}\)=\(Z=\frac{51-50}{5/\sqrt{100}}\)=2 >
1.96
(1)は有意でない(製法に差がない)となりますが、
(2)は有意である(製法に差がある)となります。
検定統計量で扱う、分散は\(σ^2/n\)として、母分散をサンプル数で割ります。でもサンプル数によって上の検定の結果が変わるのはおかしいですよね。都合よいサンプル数を取って検査を合格使用する人がいてもおかしくはありません。
数学的は正しいですが、よく考えると本当?
と疑問に思ってしまいます。
標本平均の分散\(V(\bar{x})\)は母分散と同じ\(σ^2\)ではないのか?
次の例を見てみましょう
\(x_1: 55,53,47,44,51 \)
\(x_2: 55,53,47,44,51 \)
\(x_3: 55,53,47,44,51 \)
\(x_4: 55,53,47,44,51 \)
すべて平均が50,分散は80
(1)ここで、標本平均\(\bar{x}\)のデータを求めよ。
(2)標本平均\(\bar{x}\)の分散\(V(\bar{x})\)を求めよ。
(1)は\(x_1~x_4\)まで同じデータ群なので、\(\bar{x}\)=55,53,47,44,51ですね。
(2) \(\bar{x}\)=55,53,47,44,51の分散を求めるので、\(V(x_i)\)と同じ\(V(\bar{x})\)=80ですね。
一方、標本平均の分散\(V(\bar{x})=σ^2/n\)をそのまま使うと、\(V(\bar{x})=80/4\)=20となります。
同じ標本平均の分散\(V(\bar{x})\)でも、問いかけを変えると答えが変わります。
標本平均の分散\(V(\bar{x})\)の意味と式を考える
\(V(\bar{x})=V(\frac{x_1+x_2+…+x_n}{n})\)=\(\frac{σ^2}{n}\)
の式の意味を考えます。
\(V(\bar{x})= V(\frac{x_1}{n}+\frac{x_2}{n}+…+\frac{x_n}{n})\)と変形します。
\(x_i\)のデータを1/n倍に圧縮した分散\(V(\frac{x_1}{n})\)をi=1~nまで合わせたもの
上の事例で当てはめると、次のようになります。
4
,53/4
,47/4
,44/4
,51/4
\(x_2\):55/
4
,53/4
,47/4
,44/4
,51/4
\(x_3\):55/
4
,53/4
,47/4
,44/4
,51/4
\(x_4\):55/
4
,53/4
,47/4
,44/4
,51/4
どれも(平均50/
4
,分散80/16
)
分散がn=4の2乗の16で割った80→5に変化します。分散5を4つ加算するため、5→20となったものが、
\(V(\bar{x})\)=\(\frac{σ^2}{n}\)=80/4=20
なのです。
しかし、よく見ると、\(\bar{x}\)=55,53,47,44,51の分散を求めるので、\(V(x_i)\)と同じ\(V(\bar{x})\)=80ですね。
標本平均の分散の算出ポイント
(1) 母集合とデータのばらつきは変わらないから、標本分散も\(σ^2\)とする。
(2) 母集合から個々のデータをサンプル数で割ったデータのついての分散を作る。その分散をサンプル数分加算して\(\frac{σ^2}{n}\)とする。
(1)と(2)の違いがイメージできますか?同じ式ですがイメージが異なります。
分散を求める式の左辺は\(V(\bar{x})\)ですが、公式どおりに母分散をサンプル数nで割るか、元のデータの母分散と同じとするかはよく考える必要があります。
でも試験ではとりあえず公式どおりに母分散をサンプル数nで割ってください。
③標本平均の分散はあなたが判断する
標本(サンプル)の分散を母分散\(σ^2/n\)とする前に、nで割るべきかどうかを考えましょう。
試験対策では、機械的にnで割ってください。でも、分散の値がサンプル数の逆数で変わるのは違和感があります。
標本平均の分散\(V(\bar{x})\)の式が、
\(V(\bar{x})=V(\frac{x_1+x_2+…+x_n}{n})\)と違和感なく書けるため、そのまま機械的に\(V(\bar{x})\)=\(\frac{σ^2}{n}\)と導出できます。しかし、実務では
\(V(\bar{x})=V(x_i)\)=\(σ^2\)とするか、
\(V(\bar{x})\)=\(\frac{σ^2}{n}\)とするかを
よく考える必要があります。
まとめ
標本平均の分散の求め方で注意すべきポイントを解説しました。試験では機械的にサンプル数nで割ってください。目的は合格することです。でも、実務はよく考えて分散値を求めてください。
- ➀数学的に正しい標本平均の分散の注意点
- ②標本平均の分散は\(σ^2/n\)で良いのか?
- ③標本平均の分散はあなたが判断する
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119