2変数の確率分布関数(同時確率質量関数)がわかる
「2変数の確率分布関数(同時確率質量関数)がわからない」、と困っていませんか?
こういう疑問に答えます。
本記事のテーマ
- ①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容
- ➁2変数の確率分布関数(同時確率質量関数)とは
- ➂離散型確率分布の場合
- ➃連続型確率分布の場合
これを理解しないと、サンプリングの分散が理解できなくなります。
①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容
2段サンプリングの分散の式
「2段サンプリングの分散」の式があります。
E(\(\bar{\bar{x}}\))=μ
V(\(\bar{\bar{x}}\))=\(\frac{M-m}{M-1}・\frac{σ_b^2}{m}\)+\(\frac{N-n}{N-1}・\frac{σ_w^2}{mn}\)
・\(m\):1次サンプルの大きさ
・\(n\):2次サンプルの大きさ
・\(σ_b^2\):1次単位間の特性xの分散
・\(σ_w^2\):1次単位内の特性xの分散
・M:1次単位の総数
・N:1次単位の大きさ
・\(\frac{M-m}{M-1},\frac{N-n}{N-1}\):有限修正項
となりますよね。
でも、
と困ってしまいますよね。QCプラネッツも苦労しました。
そこで、
という思いで、解説していきます。
2段サンプリングの分散の式に必要な内容
まとめると、以下を理解しておく必要があります。
- 条件付き確率
- 2変数の確率分布関数(同時確率質量関数)
- 同時確率分布の分散、共分散の導出
- 条件付き確率の期待値・分散
- 全分散の公式の導出
- 2段サンプリングの分散の公式導出
残念ながら、「Yes」です。
だから、「2段サンプリングの分散」の式を暗記して代入するだけの問題がよくあります。
だから、サンプリングの分散はみんな苦手なのです!
2段サンプリングの分散の式の丁寧な導出はQCプラネッツだけ
「だから、教科書やサイトに、2段サンプリングの分散の式を導出する内容が書いているはず」と懇願しても、残念、ありませんでした。
では、1つ1つ解説します。
➁2変数の確率分布関数(同時確率質量関数)がわかる
第2弾として「2変数の確率分布関数」を解説します。
- 条件付き確率
- 2変数の確率分布関数(同時確率質量関数)
- 同時確率分布の分散、共分散の導出
- 条件付き確率の期待値・分散
- 全分散の公式の導出
- 2段サンプリングの分散の公式導出
2変数の確率分布関数とは
●簡単にいうと、2変数(x,y)が同時に起こる確率を分布関数にしたものです。
確率分布関数は
\(f(x,y)\)
で表現します。
●これだけなので、簡単ですね。
徐々に複雑になっていきますが、簡単に解説していきます。
2変数が完全に独立している場合
なお、2変数の確率分布で、頭が混乱しがちになるのは、
です。
●式で書くと、
\(f(x,y)\)=\(g(x)\)×\(h(y)\)
と表現できます。2変数x,yは互いに独立しているので、同時確率は単純に積でよいとなります。
●これだけなので、簡単ですね。
徐々に複雑になっていきますが、簡単に解説していきます。
●以下、例題を使って、解説しますが、よく混乱するポイントなので、読んでください。全分散の公式の導出などで、よく使う式ですが、不慣れでパニックになるところです。
例題でおさえておくポイント
- 離散型の例で、2変数が互いに独立している場合を理解する
- 連続型の例で、X,Yそれぞれの周辺確率密度関数の求め方を理解する
この2点をあやふやにすると、応用が利きません。。。
➂離散型確率分布の場合
次の3つの例題を挙げます。2変数の確率分布の特徴に慣れましょう。
- 例題1(2変数が互いに独立していない例)
- 例題2(2変数が互いに独立してそうな例)
- 例題3(2変数が完全に独立している例)
例題1(2変数が互いに独立していない例)
2変数が互いに独立していない、交互に影響する例を下表に挙げます。これは中学数学レベルなので安心してください。
X/Y | 1 | 2 | 3 | 計 |
1 | \(\frac{2}{8}\) | \(\frac{1}{8}\) | \(\frac{1}{8}\) | \(\frac{1}{2}\) |
2 | \(\frac{1}{8}\) | \(\frac{1}{8}\) | \(\frac{2}{8}\) | \(\frac{1}{2}\) |
計 | \(\frac{3}{8}\) | \(\frac{2}{8}\) | \(\frac{3}{8}\) | 1 |
●以下の確率を計算してみましょう。
(1) P(X=2,Y=3)
(2) P(X=1)
(3) P(Y=3)
これは簡単ですよね。ビビらないでください。
●答えは、表に書いていますよね。
例題2(2変数が互いに独立してそうな例)
例題1と同じ表ですが、値を若干変えます。
X/Y | 1 | 2 | 3 | 計 |
1 | \(\frac{3}{16}\) | \(\frac{1}{8}\) | \(\frac{3}{16}\) | \(\frac{1}{2}\) |
2 | \(\frac{3}{16}\) | \(\frac{1}{8}\) | \(\frac{3}{16}\) | \(\frac{1}{2}\) |
計 | \(\frac{3}{8}\) | \(\frac{2}{8}\) | \(\frac{3}{8}\) | 1 |
●ここでポイントなのは、
どのi(i=1,2),j(j=1,2,3)に対して、
Pr(X=i,Y=j)=Pr(X=i)×Pr(Y=j)
が成り立ちます。
この状態は、
と言えます。
例題3(2変数が完全に独立している例)
例題2は確かに完全に独立していますが、X,Yに関係する表があると、独立しているかどうかをいちいち確認する必要があります。
本来、独立しているわけですから、下表の方が、独立していることがはっきりしてわかりやすいです。
X | 1 | 2 | 計 |
Pr | \(\frac{1}{2}\) | \(\frac{1}{2}\) | 1 |
Y | 1 | 2 | 3 | 計 |
Pr | \(\frac{3}{8}\) | \(\frac{2}{8}\) | \(\frac{3}{8}\) | 1 |
別表にまとめると、独立感がありますよね。これくらいX,Yを切り離して考えましょう。
➃連続型確率分布の場合
積分が複雑だけど、1つずつ見れば理解できます!
●離散型は簡単ですが、連続型になると難しく感じます。その理由は以下です。
- ∑が積分に変わる
- Xの確率分布関数を求めるのに、Yで積分が必要なのが理解しにくい
- 計算結果がイメージしにくい
- 二重積分に不慣れで難しい
難しくなりますが、1つずつ記事を読み進めていけば理解できます。大丈夫です!
例題
2次元の確率変数(X,Y)の同時確率密度関数が
\(f(x,y)=k(x+2y)\) (0 ≤ \(x\) ≤ 2, 0 ≤ \(y\) ≤ 1)
で表されている。
(1) kを求めよ。
(2)Xの周辺確率密度関数\(f_X(x)\)を求めよ。
(3)Yの周辺確率密度関数\(f_Y(y)\)を求めよ。
1つずつ解説します。慣れてましょう!
解法
●(1)は、早速二重積分ですが、x,yについて、2回積分すればOKです。
\(\begin{eqnarray}
\int_0^1 \int_0^2 f(x,y)dxdy
&= \int_0^2 \left[ xy+y^2 \right]_0^1 dx\\
&= \int_0^2 (x+1) dx
&= \left[ \frac{1}{2}x^2+x \right]_0^2\\
&= 4\\
\end{eqnarray}\)
確率密度関数の全積分は1なので、k=\(\frac{1}{4}\)となります。
●(2)これがわかりにくい。Xなので、xで積分したいが、そうではなく、yで積分します。
さっきの、離散型で考えると、Pr(X=1)を計算するときは、Pr(X=1)に相当するYの確率の和を下図のように計算しますよね。離散型は「和」で、連続型は「積分」となるイメージで理解しましょう。
よって、
\(\begin{eqnarray}
\frac{1}{4} \int_0^1 (x+2y) dy
&= \frac{1}{4} \left[ xy+y^2 \right]_0^1 dx\\
&= \frac{1}{4} (x+1)\\
\end{eqnarray}\)
となります。
●(3)同様に、Yなので、yで積分したいが、そうではなく、xで積分します。
さっきの、離散型で考えると、Pr(Y=0)を計算するときは、Pr(Y=0)に相当するXの確率の和を下図のように計算しますよね。離散型は「和」で、連続型は「積分」となるイメージで理解しましょう。
よって、
\(\begin{eqnarray}
\frac{1}{4} \int_0^2 (x+2y) dx
&= \frac{1}{4} \left[ \frac{1}{2}x^2+xy \right]_0^2 dx\\
&= \frac{1}{2} (1+2y)\\
\end{eqnarray}\)
となります。
ただ、困ったことに、元の確率密度関数と、X,Yの周辺確率密度関数の式を見ると、関係性がわかりません。
●元の確率密度関数:\(f(x,y)=\frac{1}{4}(x+2y)\)
●Xの周辺確率密度関数:\(f_X(x)= \frac{1}{4} (x+1)\)
●Yの周辺確率密度関数:\(f_Y(x)= \frac{1}{2} (1+2y)\)
これも、理解しにくい点ですが、積分で一発で出せる良さはあります。慣れましょう!
まとめ
2変数の確率分布関数(同時確率質量関数)をわかりやすく解説しました。
- ①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容
- ➁2変数の確率分布関数(同時確率質量関数)とは
- ➂離散型確率分布の場合
- ➃連続型確率分布の場合
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119