【必読】全分散の公式の導出がわかる

全分散の公式導出

本記事のテーマ

【必読】全分散の公式の導出がわかる
  • ①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容
  • ➁事前に読んでおくべき関連記事
  • ➂E[E[Y|X]]=E[Y]の導出
  • ➃全分散の導出

QC・統計に勝てるためのサンプリング問題集を販売します!

QC検定®1級合格したい方、QCに必要なサンプリングをしっかり学びたい方におススメです。
QC検定®1級、2級でサンプリングの問題で苦戦していませんか?本記事では、QC・統計に勝てるためのサンプリング問題集(20題)を紹介します。

①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容

2段サンプリングの分散の式

「2段サンプリングの分散」の式があります。

E(\(\bar{\bar{x}}\))=μ
V(\(\bar{\bar{x}}\))=\(\frac{M-m}{M-1}・\frac{σ_b^2}{m}\)+\(\frac{N-n}{N-1}・\frac{σ_w^2}{mn}\)
・\(m\):1次サンプルの大きさ
・\(n\):2次サンプルの大きさ
・\(σ_b^2\):1次単位間の特性xの分散
・\(σ_w^2\):1次単位内の特性xの分散
・M:1次単位の総数
・N:1次単位の大きさ
・\(\frac{M-m}{M-1},\frac{N-n}{N-1}\):有限修正項
となりますよね。

でも、

この式は何なの?
何でこんな難しい式なの?
覚えられない。。。

と困ってしまいますよね。QCプラネッツも苦労しました。

そこで、

せめて、「2段サンプリングの分散」の式を導出したい!

という思いで、解説していきます。

2段サンプリングの分散の式に必要な内容

まとめると、以下を理解しておく必要があります。

  1. 条件付き確率
  2. 2変数の確率分布関数(同時確率質量関数)
  3. 同時確率分布の分散、共分散の導出
  4. 条件付き確率の期待値・分散
  5. 全分散の公式の導出
  6. 2段サンプリングの分散の公式導出
2段サンプリングは式が複雑!
公式暗記・代入だけでは意味不明!
サンプリングの分散はみんな苦手

なので、1つ1つ解説します。

今回は第5弾として「全分散の公式の導出」を解説します。

➁事前に読んでおくべき関連記事

●いきなり、全分散の公式を理解しようとすると、挫折します。そこで、具体事例の計算過程を一回読んでから、公式導出するとかなり身近な式になります。

関連記事でおさえておくべきポイント

  1. E(Y|X)はどんな式か? 和または積分対象はX,Yどちらか?
  2. E(E(Y|X))の計算過程。 和または積分対象はX,Yのどちらか?
  3. E(Y2|X)に慣れておく
  4. V(Y|X)はどんな式か? 和または積分対象はX,Yどちらか?
  5. E(V(Y|X)]の計算過程。 和または積分対象はX,Yのどちらか?
  6. V(E(Y|X)]の計算過程。 和または積分対象はX,Yのどちらか?
  7. 全分散の公式が成り立つ計算過程

全分散の公式を含めて、条件つき期待値、条件つき分散を網羅して解説しています。

離散型(数列)で解く場合(本記事も数列版で全分散の公式を導出します。)

【必読】条件つき期待値・条件付き分散がわかる(離散型)
本記事では2段サンプリングの分散公式に必須な 条件付き期待値、条件付き分散、 全分散の公式を実例を使って、数列で計算して確認します。

連続型(積分)で解く場合

【必読】条件つき期待値・条件つき分散がわかる(連続型)
本記事では2段サンプリングの分散公式に必須な 条件付き期待値、条件付き分散、全分散の公式を実例を使って,積分で計算して確認します。

では、一般化して公式導出に入ります。

➂E[E[Y|X]]=E[Y]の導出

導出

文字式でさっと書いていきます。

E(E(Y|X=xi))
=\(\sum_{i} (E(Y|X=x_i))f_{xi}\)
=\(\sum_{i}(\sum_{j} y_j f_{Y|X}(y_i|x_i)) f_{xi}\)

ここで、\(y_j\)を前に出して、fを整理します。
=\(\sum_{j} y_j(\sum_{i} f_{Y|X}(y_i|x_i) f_{xi})\)
=\(\sum_{j} y_j(\sum_{i} f(x_i,y_j)\)
=\(\sum_{j} y_j f_Y(y_j)\)
=E(Y)
となります。

ここで、1つわかりにくいポイントがあります。
\(\sum_{i} f(x_i,y_j)\) ⇒ \( f_Y(y_j)\)
になぜ変わるのか?
です。

式だけではわかりにくいので、上の関連記事の事例を使って、具体的な数字を使って計算します。

実例で詳細に解説

結果的に、
\(\sum_{i} f(x_i,y_j)\) ⇒ \( f_Y(y_j)\)
が一致します。文字で解くと難しい場合は、具体例で理解しておくとよいです。

関連記事の例題から具体的な値で比較しましょう。
E(E(Y|X))の値は下表のようにまとめる事ができます。

x/y
y1

\(f_{xi,y1}\)

y2

\(f_{xi,y2}\)

y3

\(f_{xi,y3}\)

\(f_{xi}\)

x1 [1 ×\(\frac{1}{2}\) +2 ×\(\frac{1}{4}\) +3 ×\(\frac{1}{4}\)] ×\(\frac{1}{2}\) =\(\frac{7}{8}\)
x2 [1 ×\(\frac{1}{4}\) +2 ×\(\frac{1}{4}\) +3 ×\(\frac{1}{2}\)] ×\(\frac{1}{2}\) =\(\frac{7}{9}\)
計 E[Y]= 2

上の表の⑧は
⑧=[①×➁+➂×➃+⑤×⑥]×⑦
で計算して、
E[E[Y|X]]=E[Y]
を計算してます。

なお、E[Y]の求め方は、下表通りです。

x/y
y1

\(f_y(y1)\)

y2

\(f_{y}(y2)\)

y3

\(f_y(y3)\)

x1 [1 ×\(\frac{3}{8}\) +2 ×\(\frac{2}{8}\) +3 ×\(\frac{3}{8}\)] =2

上の2つの表を比較すると、

x/y
\(f_{xi,y1}\)

\(f_{xi,y2}\)

\(f_{xi,y3}\)
x1 \(\frac{1}{2}\) \(\frac{1}{4}\) \(\frac{1}{4}\)
x2 \(\frac{1}{4}\) \(\frac{1}{4}\) \(\frac{1}{2}\)
x/y
\(f_y(y1)\)

\(f_{y}(y2)\)

\(f_y(y3)\)
x1 \(\frac{3}{8}\) \(\frac{2}{8}\) \(\frac{3}{8}\)

確かに、
\(\sum_{i} f(x_i,y_j)\) ⇒ \( f_Y(y_j)\)
が一致します。文字で解くと難しい場合は、具体例で理解しておくとよいです。

ここまで細かく解説するのは、QCプラネッツだけですね。

➃全分散の導出

V(Y|X)の導出

機械的に、
V(Y)=E(Y2)-E(Y) 2
ですから、

V(Y|X) =E(Y2|X)-E(Y|X) 2
です。

E(V(Y|X),V(E(Y|X))の導出

●V(Y|X)の期待値E(V(Y|X)ですが、
E(V(Y|X)
=E(E(Y2|X)-E(Y|X) 2)
= E(E(Y2|X))-E(E(Y|X) 2)

ここで、E(E(Y|X))=E(Y)ですから、
E(Y|X)⇒E(Y2|X)と見ると、

E(E(Y2|X))=E(Y2)です。あら、不思議!

よって、
E(V(Y|X)= E(Y2)- E(E(Y|X) 2) …(式1)

●次に、E(Y|X)の分散V(E(Y|X)) ですが、
V(E(Y|X))
=E(E(Y|X) 2)-(E(E(Y|X)))2

ここで、E(E(Y|X))=E(Y)ですから、

よって、
V(E(Y|X))=E(E(Y|X) 2)-(E(Y))2…(式2)

全分散の導出

(式1)+(式2)より、下の色部分がキャンセルされます。
E(V(Y|X))= E(Y2)-E(E(Y|X) 2) …(式1)
V(E(Y|X))= E(E(Y|X) 2)-(E(Y))2…(式2)

よって、
E(V(Y|X))+ V(E(Y|X))= E(Y2)–(E(Y))2=V(Y)
が成り立ちます。

全分散の公式
V(Y)= E(V(Y|X))+ V(E(Y|X))

が導出できました。

まとめ

全分散の公式の導出をわかりやすく解説しました。

  • ①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容
  • ➁事前に読んでおくべき関連記事
  • ➂E[E[Y|X]]=E[Y]の導出
  • ➃全分散の導出

error: Content is protected !!