QCプラネッツ 品質のプロフェッショナルを育成するサイト

2変数の確率分布関数(同時確率質量関数)がわかる

サンプリング

「2変数の確率分布関数(同時確率質量関数)がわからない」、と困っていませんか?

こういう疑問に答えます。

本記事のテーマ

2変数の確率分布関数(同時確率質量関数)がわかる
  • ①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容
  • ➁2変数の確率分布関数(同時確率質量関数)とは
  • ➂離散型確率分布の場合
  • ➃連続型確率分布の場合
2変数の確率分布関数にまず、慣れましょう!
➃連続型確率分布の場合が最も大事なので、最後まで読んでください。
これを理解しないと、サンプリングの分散が理解できなくなります。

①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容

2段サンプリングの分散の式

「2段サンプリングの分散」の式があります。

E(\(\bar{\bar{x}}\))=μ
V(\(\bar{\bar{x}}\))=\(\frac{M-m}{M-1}・\frac{σ_b^2}{m}\)+\(\frac{N-n}{N-1}・\frac{σ_w^2}{mn}\)
・\(m\):1次サンプルの大きさ
・\(n\):2次サンプルの大きさ
・\(σ_b^2\):1次単位間の特性xの分散
・\(σ_w^2\):1次単位内の特性xの分散
・M:1次単位の総数
・N:1次単位の大きさ
・\(\frac{M-m}{M-1},\frac{N-n}{N-1}\):有限修正項
となりますよね。

でも、

この式は何なの?
何でこんな難しい式なの?
覚えられない。。。

と困ってしまいますよね。QCプラネッツも苦労しました。

そこで、

せめて、「2段サンプリングの分散」の式を導出したい!

という思いで、解説していきます。

2段サンプリングの分散の式に必要な内容

まとめると、以下を理解しておく必要があります。

  1. 条件付き確率
  2. 2変数の確率分布関数(同時確率質量関数)
  3. 同時確率分布の分散、共分散の導出
  4. 条件付き確率の期待値・分散
  5. 全分散の公式の導出
  6. 2段サンプリングの分散の公式導出
1つの式なのにこんなに勉強が必要なの?

残念ながら、「Yes」です。

だから、「2段サンプリングの分散」の式を暗記して代入するだけの問題がよくあります。

公式暗記・代入だけでは意味不明!

だから、サンプリングの分散はみんな苦手なのです!

2段サンプリングの分散の式の丁寧な導出はQCプラネッツだけ

「だから、教科書やサイトに、2段サンプリングの分散の式を導出する内容が書いているはず」と懇願しても、残念、ありませんでした。

2段サンプリングの分散の式の丁寧な導出はQCプラネッツだけ

では、1つ1つ解説します。

➁2変数の確率分布関数(同時確率質量関数)がわかる

第2弾として「2変数の確率分布関数」を解説します。

  1. 条件付き確率
  2. 2変数の確率分布関数(同時確率質量関数)
  3. 同時確率分布の分散、共分散の導出
  4. 条件付き確率の期待値・分散
  5. 全分散の公式の導出
  6. 2段サンプリングの分散の公式導出

2変数の確率分布関数とは

●簡単にいうと、2変数(x,y)が同時に起こる確率を分布関数にしたものです。
確率分布関数は
\(f(x,y)\)
で表現します。

●これだけなので、簡単ですね。
徐々に複雑になっていきますが、簡単に解説していきます。

2変数が完全に独立している場合

なお、2変数の確率分布で、頭が混乱しがちになるのは、

2変数が互いに独立している場合と、そうでない場合の区別がつきにくい

です。

●式で書くと、
\(f(x,y)\)=\(g(x)\)×\(h(y)\)
と表現できます。2変数x,yは互いに独立しているので、同時確率は単純に積でよいとなります。

●これだけなので、簡単ですね。
徐々に複雑になっていきますが、簡単に解説していきます。

●以下、例題を使って、解説しますが、よく混乱するポイントなので、読んでください。全分散の公式の導出などで、よく使う式ですが、不慣れでパニックになるところです。

例題でおさえておくポイント

  1. 離散型の例で、2変数が互いに独立している場合を理解する
  2. 連続型の例で、X,Yそれぞれの周辺確率密度関数の求め方を理解する

この2点をあやふやにすると、応用が利きません。。。

➂離散型確率分布の場合

次の3つの例題を挙げます。2変数の確率分布の特徴に慣れましょう。

  1. 例題1(2変数が互いに独立していない例)
  2. 例題2(2変数が互いに独立してそうな例)
  3. 例題3(2変数が完全に独立している例)
違いを理解しましょう。

例題1(2変数が互いに独立していない例)

2変数が互いに独立していない、交互に影響する例を下表に挙げます。これは中学数学レベルなので安心してください。

X/Y 1 2 3
1 \(\frac{2}{8}\) \(\frac{1}{8}\) \(\frac{1}{8}\) \(\frac{1}{2}\)
2 \(\frac{1}{8}\) \(\frac{1}{8}\) \(\frac{2}{8}\) \(\frac{1}{2}\)
\(\frac{3}{8}\) \(\frac{2}{8}\) \(\frac{3}{8}\) 1

●以下の確率を計算してみましょう。
(1) P(X=2,Y=3)
(2) P(X=1)
(3) P(Y=3)
これは簡単ですよね。ビビらないでください。

●答えは、表に書いていますよね。

例題2(2変数が互いに独立してそうな例)

例題1と同じ表ですが、値を若干変えます。

X/Y 1 2 3
1 \(\frac{3}{16}\) \(\frac{1}{8}\) \(\frac{3}{16}\) \(\frac{1}{2}\)
2 \(\frac{3}{16}\) \(\frac{1}{8}\) \(\frac{3}{16}\) \(\frac{1}{2}\)
\(\frac{3}{8}\) \(\frac{2}{8}\) \(\frac{3}{8}\) 1

●ここでポイントなのは、
どのi(i=1,2),j(j=1,2,3)に対して、
Pr(X=i,Y=j)=Pr(X=i)×Pr(Y=j)
が成り立ちます。

この状態は、

2変数が互いに独立している

と言えます。

例題3(2変数が完全に独立している例)

例題2は確かに完全に独立していますが、X,Yに関係する表があると、独立しているかどうかをいちいち確認する必要があります。

本来、独立しているわけですから、下表の方が、独立していることがはっきりしてわかりやすいです。

X 1 2
Pr \(\frac{1}{2}\) \(\frac{1}{2}\) 1

Y 1 2 3
Pr \(\frac{3}{8}\) \(\frac{2}{8}\) \(\frac{3}{8}\) 1

別表にまとめると、独立感がありますよね。これくらいX,Yを切り離して考えましょう。

➃連続型確率分布の場合

積分が複雑だけど、1つずつ見れば理解できます!

●離散型は簡単ですが、連続型になると難しく感じます。その理由は以下です。

  1. ∑が積分に変わる
  2. Xの確率分布関数を求めるのに、Yで積分が必要なのが理解しにくい
  3. 計算結果がイメージしにくい
  4. 二重積分に不慣れで難しい

難しくなりますが、1つずつ記事を読み進めていけば理解できます。大丈夫です!

例題

2次元の確率変数(X,Y)の同時確率密度関数が
\(f(x,y)=k(x+2y)\) (0 ≤ \(x\) ≤ 2, 0 ≤ \(y\) ≤ 1)
で表されている。
(1) kを求めよ。
(2)Xの周辺確率密度関数\(f_X(x)\)を求めよ。
(3)Yの周辺確率密度関数\(f_Y(y)\)を求めよ。

1つずつ解説します。慣れてましょう!

解法

●(1)は、早速二重積分ですが、x,yについて、2回積分すればOKです。

\(\begin{eqnarray}
\int_0^1 \int_0^2 f(x,y)dxdy
&= \int_0^2 \left[ xy+y^2 \right]_0^1 dx\\
&= \int_0^2 (x+1) dx
&= \left[ \frac{1}{2}x^2+x \right]_0^2\\
&= 4\\
\end{eqnarray}\)

確率密度関数の全積分は1なので、k=\(\frac{1}{4}\)となります。

●(2)これがわかりにくい。Xなので、xで積分したいが、そうではなく、yで積分します。

さっきの、離散型で考えると、Pr(X=1)を計算するときは、Pr(X=1)に相当するYの確率の和を下図のように計算しますよね。離散型は「和」で、連続型は「積分」となるイメージで理解しましょう。

確率密度関数

よって、

\(\begin{eqnarray}
\frac{1}{4} \int_0^1 (x+2y) dy
&= \frac{1}{4} \left[ xy+y^2 \right]_0^1 dx\\
&= \frac{1}{4} (x+1)\\
\end{eqnarray}\)

となります。

●(3)同様に、Yなので、yで積分したいが、そうではなく、xで積分します。

さっきの、離散型で考えると、Pr(Y=0)を計算するときは、Pr(Y=0)に相当するXの確率の和を下図のように計算しますよね。離散型は「和」で、連続型は「積分」となるイメージで理解しましょう。

確率密度関数

よって、

\(\begin{eqnarray}
\frac{1}{4} \int_0^2 (x+2y) dx
&= \frac{1}{4} \left[ \frac{1}{2}x^2+xy \right]_0^2 dx\\
&= \frac{1}{2} (1+2y)\\
\end{eqnarray}\)

となります。

ただ、困ったことに、元の確率密度関数と、X,Yの周辺確率密度関数の式を見ると、関係性がわかりません。
●元の確率密度関数:\(f(x,y)=\frac{1}{4}(x+2y)\)
●Xの周辺確率密度関数:\(f_X(x)= \frac{1}{4} (x+1)\)
●Yの周辺確率密度関数:\(f_Y(x)= \frac{1}{2} (1+2y)\)

これも、理解しにくい点ですが、積分で一発で出せる良さはあります。慣れましょう!

まとめ

2変数の確率分布関数(同時確率質量関数)をわかりやすく解説しました。

  • ①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容
  • ➁2変数の確率分布関数(同時確率質量関数)とは
  • ➂離散型確率分布の場合
  • ➃連続型確率分布の場合


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!