QCプラネッツ 品質のプロフェッショナルを育成するサイト

【簡単】不偏分散はn-1で割る理由がすぐわかる

基本統計量

「なぜ、標本分散と不偏分散の2種類あるのか?」、「なぜ、不偏分散はn-1で割るのか?」がわからず、困っていませんか?

こういう疑問に答えます。

本記事のテーマ

【簡単】不偏分散はn-1で割る理由がすぐわかる

【簡単】不偏分散はn-1で割る理由がすぐわかる

  • ➀母集団の推定のために標本から標本分散を算出
  • ②標本分散の期待値は母分散と一致しない
  • ③母分散と一致する不偏分散を導出

記事の信頼性

記事を書いている私は、QC検定®1級合格し、分散や検定・推定でつまずきやすい社内のQC検定®2級挑戦者にわかりやすく説明しています。

QC模試受験しよう!

QC模試で、腕試ししましょう!
QC模試(品質技量の腕試し&QC検定®対策)
品質技量の実力を試したい! QC検定®合格対策に活用したい! 1,000円で提供します! 公式、暗記で終わらず、自分のものにできているかを試すオリジナル試験問題です!

品質力が鍛えられる「QC塾」を是非ご利用ください。

【2022/4/22up!】QC塾(有料)開設します!
ブログでは、品質の勉強、実務、QC検定®に役立つ情報をアップして 「わかる」価値を提供していますが、「わかる」を「できる」に変える トレーニング塾「QC塾」を是非ご利用ください。 難解な品質が、すっきりわかり、指導できるレベルまで上達できます!

さっそく見ていきましょう。

●商標使用について、
①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

➀母集団の推定のために標本から標本分散を算出

母集団と標本データの違い

母集団と標本データの違いを説明します。母集団とはデータ全体であり、標本とは母集団から一部を取り出したものですね。

具体例も紹介します。

20代の日本人を調べたい。
➀母集団は20代の日本人全員→データは絶対入手できない
②標本は、100人の20代の日本人→データは絶対入手できる

母集団は20代の日本人全員のデータを集めるのはムリですね。全員見つけるのは大変ですし、常に人数は増減します。だから、現実に評価可能な範囲の人数を②標本として調べますよね。

また、標本データに興味はなく、標本から母集団の様子を推定したいはずです。
なので、標本から母集団を推定するデータ解析が必要になります。それは平均と分散なわけです。

標本から取り出せる平均は「標本平均」、分散は「標本分散」と呼んでいます。

手元にある標本の平均と分散から母集団を推定したい

2つのニーズがあります。

・標本平均から母平均(期待値)を推定したい
・標本分散から母分散を推定したい

値を定義します。

・標本平均=\(\bar{x}\)
・母平均=μ
・標本分散=\(s^2\)
・母分散=\(σ^2\)

では、標本と母集団の平均と分散の関係を調べましょう。

標本 母集団
平均 標本平均\(\bar{x}\) 母平均μ(=E[\(\bar{x}\)])か?
分散 標本分散\(s^2\) 母分散\(σ^2\)(=E[\(s^2\)])か?

②標本分散の期待値は母分散と一致しない

平均と分散についてそれぞれ標本と母集団との関係式を見てみましょう。

標本平均の期待値は母平均と一致する

E[\(\bar{x}\)]
=E[\(\frac{1}{n}(x_1+x_2+…+x_n\)]
=\(\frac{1}{n}\)(E[\(x_1\)]+ E[\(x_2\)]+…+ E[\(x_n\)])
=\(\frac{1}{n}\)(μ+μ+…+μ)
= \(\frac{1}{n}\)nμ

となり、標本平均の期待値は母平均と一致します。
なお、E[\(x_i\)]=μを使っています。
各サンプルの平均の推定値である母平均はすべてμになるはずと期待しているからです。

標本分散の期待値は母分散と一致しない

式が長く続きますので、ポイントを解説します。

  • (A) \((x_i-\bar{x})\)の式の中に母平均μを入れて展開
  • (B)標本平均の期待値は母平均に一致E[\(x_i\)]=μを使う
  • (C)分散の定義V(X)=E[\((X-E[X])^2\)]を代入
  • (D)分散の加法性V(\(x_i)=σ^2\)、V(\(\bar{X}\))=\(\frac{1}{n}σ^2\)を代入

ではやってみましょう。数式苦手な方は眺めるだけでOKです。結論だけ見てください。

(A) \((x_i-\bar{x})\)の式の中に母平均μを入れて展開

E[\(s^2\)]
=E[\(\frac{1}{n} \sum^{n}_{i=1}(x_i-\bar{x})^2\)]
=E[\(\frac{1}{n} \sum^{n}_{i=1}((x_i-μ)-(\bar{x}-μ))^2\)]
=\(\frac{1}{n}E[\sum^{n}_{i=1}((x_i-μ)^2\)\(-2(x_i-μ)(\bar{x}-μ) \)\(+(\bar{x}-μ)^2)]\)
=\(\frac{1}{n}E[(\sum^{n}_{i=1}(x_i-μ)^2\)\(-2(\bar{x}-μ)\sum^{n}_{i=1} (x_i-μ) \)\(+(\bar{x}-μ)^2\sum^{n}_{i=1}1]\) (★1)

ここで、第2項の\(\sum^{n}_{i=1} (x_i-μ)\)は、実際に書き出してみると、

\(\sum^{n}_{i=1} (x_i-μ)\)
=\((x_1-μ)+(x_2-μ)+・・・+(x_n-μ) \)
=\((x_1+・・・+x_n)-nμ\)\(=n(\bar{x}-μ)\)となります。

また、第3項の\(\sum^{n}_{i=1}1\)は1+1+・・・+1=nとなります。これらを式(★1)に代入します。

(★1)
=\(\frac{1}{n}E[\sum^{n}_{i=1}(x_i-μ)^2\)\(-2n(\bar{x}-μ)^2 \)\(+n(\bar{x}-μ)^2]\)
=\(\frac{1}{n}E[\sum^{n}_{i=1}(x_i-μ)^2\)\(-n(\bar{x}-μ)^2]\) (★2)

(B)標本平均の期待値は母平均に一致E[\(x_i\)]=μを使う

式(★2)に,E[\(x_i\)]=μ,E[\(\bar{x}\)]=μを代入します。
(★2)
=\(\frac{1}{n}E[\sum^{n}_{i=1}(x_i-E[x_i])^2\)\(-n(\bar{x}-E[\bar{x}])^2]\) (★3)

(C)分散の定義V(X)=E[\((X-E[X])^2\)]を代入

E[(\(x_i-E[x_i])^2\)=V(\(x_i\))と
E[(\(\bar{x}-E[\bar{x}])^2\)]=V(\(\bar{x}\))
を式(★3)に代入します。
(★3)
=\(\frac{1}{n}E[\sum^{n}_{i=1} V(x_i)\)\(-nV(\bar{x})] \) (★4)

(D)分散の加法性V(\(x_i)=σ^2\)、V(\(\bar{X}\))=\(\frac{1}{n}σ^2\)を代入

さらに次の2の式
V(\(x_i)=σ^2\)、
V(\(\bar{x}\))=\(\frac{1}{n} σ^2\)
を式(★4)に代入します。
(★4)
=\(\frac{1}{n}E[\sum^{n}_{i=1} σ^2 – n \frac{1}{n} σ^2]\)
=\(\frac{1}{n} (nσ^2-σ^2)\)
=\(\frac{n-1}{n} σ^2 \)

まとめると、
\(E[s^2]=\frac{n-1}{n} σ^2\neq σ^2\)
となり、標本偏差の期待値は母分散と一致しません。残念!

③母分散と一致する不偏分散を導出

標本平均の期待値は母平均と一致しますが、標本分散の期待値は母分散と一致しません。ではどうするか?

母分散に一致する分散を定義すればよいわけで、これが不偏分散が出てきた理由です。

不偏分散を作る

不偏分散をuとして、式で定義します。
\(u^2=\frac{n}{n-1} s^2\)
いかにも母分散に一致させる感じが出てますね。

不偏分散の期待値を計算

では、不偏分散の期待値を計算して母分散になるか?調べてみましょう。
E[\(u^2\)]
=E[\(\frac{n}{n-1} s^2]\)
\(=\frac{n}{n-1} E[s^2] \)
=\(\frac{n}{n-1} \frac{n-1}{n} σ^2 \)
\(=σ^2\)
確かにE[\(u^2]=σ^2\)となり、母分散\(σ^2\)に一致しました。

不偏分散の式をまとめる

\(u^2=\frac{n}{n-1} s^2\)に
\(s^2=\frac{1}{n} \sum^{n}_{i=1}(x_i-\bar{x})^2\)を代入します。
\(u^2\)
=\(\frac{n}{n-1} \frac{1}{n} \sum^{n}_{i=1}(x_i-\bar{x})^2\)
=\(\frac{1}{n-1} \sum^{n}_{i=1}(x_i-\bar{x})^2\)

この式が、教科書でよく見る「n-1で割る」不偏分散の公式ですね。

以上から、母集団の分散を特定したければ、「n-1で割った不偏分散という変な値を使う」理由がわかりました。

まとめ

母集団を推定するために、部分をサンプリングします。標本データの平均と分散の期待値を求めますが、分散だけ一致しません。そのためにn-1で割る不偏分散をよく使います。標本分散の期待値の導出過程をしっかり見ていただきました。

  • ➀母集団の推定のために標本から標本分散を算出
  • ②標本分散の期待値は母分散と一致しない
  • ③母分散と一致する不偏分散を導出


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!