★ 本記事のテーマ
同時確率分布の分散、共分散の導出がわかる
- ①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容
- ➁【何度も復習しよう!】離散型確率分布の場合
- ➂【何度も復習しよう!】連続型確率分布の場合
★QC・統計に勝てるためのサンプリング問題集を販売します!
QC検定®1級合格したい方、QCに必要なサンプリングをしっかり学びたい方におススメです。
①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容
2段サンプリングの分散の式
「2段サンプリングの分散」の式があります。
E(\(\bar{\bar{x}}\))=μ
V(\(\bar{\bar{x}}\))=\(\frac{M-m}{M-1}・\frac{σ_b^2}{m}\)+\(\frac{N-n}{N-1}・\frac{σ_w^2}{mn}\)
・\(m\):1次サンプルの大きさ
・\(n\):2次サンプルの大きさ
・\(σ_b^2\):1次単位間の特性xの分散
・\(σ_w^2\):1次単位内の特性xの分散
・M:1次単位の総数
・N:1次単位の大きさ
・\(\frac{M-m}{M-1},\frac{N-n}{N-1}\):有限修正項
となりますよね。
でも、
この式は何なの?
何でこんな難しい式なの?
覚えられない。。。
と困ってしまいますよね。QCプラネッツも苦労しました。
そこで、
せめて、「2段サンプリングの分散」の式を導出したい!
という思いで、解説していきます。
2段サンプリングの分散の式に必要な内容
まとめると、以下を理解しておく必要があります。
- 条件付き確率
- 2変数の確率分布関数(同時確率質量関数)
- 同時確率分布の分散、共分散の導出
- 条件付き確率の期待値・分散
- 全分散の公式の導出
- 2段サンプリングの分散の公式導出
2段サンプリングは式が複雑!
公式暗記・代入だけでは意味不明!
サンプリングの分散はみんな苦手
なので、1つ1つ解説します。
今回は第3弾として「同時確率分布の分散、共分散の導出」を解説します。
➁【何度も復習しよう!】離散型確率分布の場合
●まず、わかりやすい「離散型」の場合で、数列∑を使った計算を解説します。
例題
●2次元の確率変数(X,Y)が、下表のような分布を持っている。
| X/Y |
1 |
2 |
3 |
計 |
| 1 |
\(\frac{2}{8}\) |
\(\frac{1}{8}\) |
\(\frac{1}{8}\) |
\(\frac{1}{2}\) |
| 2 |
\(\frac{1}{8}\) |
\(\frac{1}{8}\) |
\(\frac{2}{8}\) |
\(\frac{1}{2}\) |
| 計 |
\(\frac{3}{8}\) |
\(\frac{2}{8}\) |
\(\frac{3}{8}\) |
1 |
(1)期待値E[X],E[Y],E[X+Y],E[XY]を求めよ。
(2)分散V[X],V[Y],共分散COV[X,Y]を求めよ。
期待値と分散のフルセットを計算してみましょう。
解法に必要な公式集
離散系の場合の期待値と分散の解法に慣れるために必要な公式集をまとめます。以下の式を使って、解いていきます。なお、連続系の場合は∑を∫に変えればOKです。
★期待値の公式
●E[X]=∑X・Pr(X)
●E[Y]=∑X・Pr(Y)
●E[X+Y]=∑(X+Y)・Pr(X+Y)
●E[XY]=∑XY・Pr(XY)
★分散の公式
●V[X]=E[\((X-μ_X)^2\)]
●V[Y]=E[\((Y-μ_Y)^2\)]
●COV[X,Y]=E[\((X-μ_X)(Y-μ_Y)\)]
●Cov[X,Y]= E[XY]- E[X]E[Y]
解法(期待値)
(1)期待値E[X],E[Y],E[X+Y],E[XY]を求めよ。
では、解いていきましょう。
★ E[X]の解法
表から、X=1の確率が1/2、X=2の確率が1/2ですから期待値は、
E[X]=1×1/2+2×1/2=3/2
簡単ですね!
★ E[Y]の解法
表から、Y=1の確率が3/8、Y=2の確率が2/8、Y=3の確率が3/8ですから期待値は、
E[Y]=1×3/8+2×2/8+3×3/8=2
簡単ですね!
★ E[X+Y]の解法
X+Yの場合について下表を追加しましょう。
| X/Y |
1 |
2 |
3 |
| 1 |
X+Y=2 |
X+Y=3 |
X+Y=4 |
| \(\frac{2}{8}\) |
\(\frac{1}{8}\) |
\(\frac{1}{8}\) |
| 2 |
X+Y=3 |
X+Y=4 |
X+Y=5 |
| \(\frac{1}{8}\) |
\(\frac{1}{8}\) |
\(\frac{2}{8}\) |
表から、
X+Y=2の確率が2/8、
X+Y=3の確率が2/8、
X+Y=4の確率が2/8、
X+Y=5の確率が2/8
ですから期待値は、
E[X+Y]=2×2/8+3×2/8+4×2/8+5×2/8=3.5
表を追加すれば簡単ですね!
★ E[XY]の解法
同様にXYの場合について下表を追加しましょう。
| X/Y |
1 |
2 |
3 |
| 1 |
XY=1 |
XY=2 |
XY=3 |
| – |
\(\frac{2}{8}\) |
\(\frac{1}{8}\) |
\(\frac{1}{8}\) |
| 2 |
XY=2 |
XY=4 |
XY=6 |
| – |
\(\frac{1}{8}\) |
\(\frac{1}{8}\) |
\(\frac{2}{8}\) |
表から、
XY=1の確率が2/8、
XY=2の確率が2/8、
XY=3の確率が1/8、
XY=4の確率が1/8、
XY=6の確率が2/8
ですから期待値は、
E[XY]=1×2/8+2×2/8+3×1/8+4×1/8+6×2/8=25/8
表を追加すれば簡単ですね!
期待値をまとめると、
E[X]=3/2、E[Y]=2、E[X+Y]=3.5、E[XY]=25/8
となります。
また、
E[X+Y]= E[X]+ E[Y] は成り立ちますが、
E[XY]= E[X] E[Y] は成り立ちません。
X,Yは互いに独立ではないからですね。
解法(分散)
(2)分散V[X],V[Y],共分散COV[X,Y]を求めよ。
★ V[X]の解法
●ここで、分散V[X]の式をおさえましょう。
V[X]=E[\((X-μ_X)^2\)]
ですね。
次に、Xの平均\(μ_X\)を求めましょう。
平均\(μ_X\)はX=1,2の平均ですから3/2ですね。
表から、X=1の確率が1/2、X=2の確率が1/2ですから分散は、
V[X]=E[\((X-μ_X)^2\)]=E[\((X-1.5)^2\)]
=\((1-1.5)^2\)×1/2+\((2-1.5)^2\)×1/2
=1/4
ちょっと難しいですね。
★ V[Y]の解法
●ここで、分散V[Y]の式をおさえましょう。
V[Y]=E[\((Y-μ_Y)^2\)]
ですね。
次に、Yの平均\(μ_Y\)を求めましょう。
平均\(μ_Y\)はY=1,2,3の平均ですから2ですね。
表から、Y=1の確率が3/8、Y=2の確率が2/8、Y=3の確率が3/8ですから分散は、
V[Y]=E[\((Y-μ_Y)^2\)]=E[\((Y-2)^2\)]
=\((1-2)^2\)×3/8+\((2-2)^2\)×2/8+\((3-2)^2\)×3/8
=3/4
ちょっと難しいですね。
★共分散COV[X,Y]の解法
●ここで、共分散COV[X,Y]の式をおさえましょう。
COV[X,Y]=E[\((X-μ_X)(Y-μ_Y)\)]
ですね。
共分散は、
COV[X,Y]=E[\((X-μ_X)(Y-μ_Y)\)]= E[\((X-1.5)(Y-2)\)]
=(1-1.5)(1-2)×2/8+(1-1.5)(2-2)×1/8+(1-1.5)(3-2)×1/8+
(2-1.5)(1-2)×1/8+(2-1.5)(2-2)×1/8+(2-1.5)(3-2)×2/8
=1/8
なお、共分散Cov[X,Y]はもう1つ公式があり、
Cov[X,Y]= E[XY]- E[X]E[Y]
1/8=25/8-3/2・3
が成り立ちます。
ちょっと難しいですが、解き方は1パターンなので、何度も復習しましょう。
分散をまとめると、
V[X]=1/4、V[Y]=3/4、Cov[X,Y]=1/8
となります。
➂【何度も復習しよう!】連続型確率分布の場合
●「連続型」の場合で、積分を使った計算を解説します。
例題
2次元の確率変数(X,Y)の同時確率密度関数が
\(f(x,y)=\frac{1}{4}(x+2y)\) (0 ≤ \(x\) ≤ 2, 0 ≤ \(y\) ≤ 1)
で表されている。
(1)X,Yの周辺確率密度関数\(f_X(x)\), \(f_Y(y)\)を求めよ。
(2)期待値E[X]、E[Y]、E[X+Y]、E[XY]を求めよ。
(3)分散V[X]、V[Y]、共分散Cov[X,Y]を求めよ。
本記事は、(2)(3)を解説します。
解法に必要な公式集
連続系の場合の期待値と分散の解法に慣れるために必要な公式集をまとめます。以下の式を使って、解いていきます。なお、離散系の場合は∫を∑に変えればOKです。
★期待値の公式
●E[X]=\(\int_0^2 xf_X(x)dx\)
●E[Y]=\(\int_0^1 yf_Y(y)dy\)
–
●E[X+Y]=E[X]+E[Y]
または、
●E[X+Y]=\(\int_0^2 \int_0^1 (x+y)f(x,y)dydx\)
–
●E[XY]=\(\int_0^2 \int_0^1 xyf(x,y)dydx\)
(E[XY]とE[X]E[Y]が一致しない場合もあるので注意!)
★分散の公式
●E[X2]=\(\int_0^2 x^2 f_X(x)dx\)
●E[Y2]=\(\int_0^1 y^2 f_Y(y)dy\)
–
●V[X]=E[X2]-E[X]2
●V[Y]=E[Y2]-E[Y]2
–
●Cov[X,Y]= E[XY]- E[X]E[Y]
解法(期待値)
(2)期待値E[X]、E[Y]、E[X+Y]、E[XY]を求めよ。
では、解いていきましょう。
★ E[X]の解法
\(\begin{eqnarray}
\int_0^2 xf_X(x) dx \\
&= \frac{1}{4} \int_0^2 x(x+1) dx \\
&= \frac{1}{4} \left[ \frac{x^3}{3}+\frac{x^2}{2} \right]_0^2 dx\\
\end{eqnarray}\)
=\(\frac{7}{6}\)
となります。
★ E[Y]の解法
\(\begin{eqnarray}
\int_0^1 yf_Y(y) dy \\
&= \frac{1}{2} \int_0^1 y(1+2y) dy \\
&= \frac{1}{2} \left[ \frac{y^2}{2}+\frac{2y^3}{3} \right]_0^1 dy\\
\end{eqnarray}\)
=\(\frac{7}{12}\)
となります。
★ E[X+Y]の解法
E[X+Y]=E[X]+E[Y]=\(\frac{7}{4}\)
この解法でもいいですが、せっかくなので積分からでも算出しましょう。
\(\begin{eqnarray}
\int_0^2 \int_0^1 (x+y)f(x,y)dydx \\
&= \frac{1}{4} \int_0^2 \int_0^1 (x+y)(x+2y)dydx \\
\end{eqnarray}\)
=\(\frac{7}{4}\)
となります。
(途中経過は計算してみてください)
積分の計算の詳細はここをご覧ください。
【リンク】計算メモ(PDF)
★ E[XY]の解法
\(\begin{eqnarray}
\int_0^2 \int_0^1 xyf(x,y)dydx \\
&= \frac{1}{4} \int_0^2 \int_0^1 xy(x+2y)dydx \\
\end{eqnarray}\)
=\(\frac{2}{3}\)
となります。
(途中経過は計算してみてください)
積分の計算の詳細はここをご覧ください。
【リンク】計算メモ(PDF)
期待値をまとめると、
E[X]=7/6、E[Y]=7/12、E[X+Y]=7/4、E[XY]=2/3
となります。
また、
E[X+Y]= E[X]+ E[Y] は成り立ちますが、
E[XY]= E[X] E[Y] は成り立ちません。
X,Yは互いに独立ではないからですね。
解法(分散)
(3)分散V[X]、V[Y]、共分散Cov[X,Y]を求めよ。
★ V[X]の解法
●ここで、分散V[X]の式をおさえましょう。
まず、E[X2]が必要です。
\(\begin{eqnarray}
\int_0^2 x^2 f_X(x) dx \\
&= \frac{1}{4} \int_0^2 x^2 (x+1) dx \\
&= \frac{1}{4} \left[ \frac{x^4}{4}+\frac{x^3}{3} \right]_0^2 dx\\
\end{eqnarray}\)
=\(\frac{5}{3}\)
となります。
よって、
V[X]=E[X2]-E[X]2
=\(\frac{5}{3}\)-\((\frac{7}{6})^2\)
=11/36
★ V[Y]の解法
●ここで、分散V[Y]の式をおさえましょう。
まず、E[Y2]が必要です。
\(\begin{eqnarray}
\int_0^1 y^2 f_Y(y) dy \\
&= \frac{1}{2} \int_0^1 y^2 (1+2y) dy \\
&= \frac{1}{2} \left[ \frac{y^3}{3}+\frac{y^4}{2} \right]_0^1 dy\\
\end{eqnarray}\)
=\(\frac{5}{12}\)
となります。
よって、
V[Y]=E[Y2]-E[Y]2
=\(\frac{5}{12}\)-\((\frac{7}{12})^2\)
=11/144
★ 共分散COV[X,Y]の解法
●ここで、共分散COV[X,Y]の式をおさえましょう。
COV[X,Y]=E[XY]-E[X]E[Y]
=\(\frac{2}{3}\)-\(\frac{7}{6}\)・\(\frac{7}{12}\)
=\(\frac{-1}{72}\)
ちょっと難しいですが、解き方は1パターンなので、何度も復習しましょう。
積分の計算の詳細はここをご覧ください。
【リンク】計算メモ(PDF)
分散をまとめると、
V[X]=11/36、V[Y]=11/144、Cov[X,Y]=-1/72
となります。
連続系は、ひたすら積分すればOKです。
まとめ
同時確率分布の分散、共分散の導出をわかりやすく解説しました。
- ①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容
- ➁【何度も復習しよう!】離散型確率分布の場合
- ➂【何度も復習しよう!】連続型確率分布の場合