カテゴリー: サンプリング

  • 条件付き確率がわかる(2段サンプリングの分散式導出)

    条件付き確率がわかる(2段サンプリングの分散式導出)

    条件付き確率がわかる(2段サンプリングの分散式導出)

    「条件付き確率がわからない」、と困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    条件付き確率がわかる
    • ①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容
    • ➁条件付き確率とは
    • ➂条件付き確率の例題

    QC・統計に勝てるためのサンプリング問題集を販売します!

    QC検定®1級、2級でサンプリングの問題で苦戦していませんか?本記事では、QC・統計に勝てるためのサンプリング問題集(20題)を紹介します。

    [themoneytizer id=”105233-2″]

    ①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容

    2段サンプリングの分散の式

    「2段サンプリングの分散」の式があります。

    E(\(\bar{\bar{x}}\))=μ
    V(\(\bar{\bar{x}}\))=\(\frac{M-m}{M-1}・\frac{σ_b^2}{m}\)+\(\frac{N-n}{N-1}・\frac{σ_w^2}{mn}\)
    ・\(m\):1次サンプルの大きさ
    ・\(n\):2次サンプルの大きさ
    ・\(σ_b^2\):1次単位間の特性xの分散
    ・\(σ_w^2\):1次単位内の特性xの分散
    ・M:1次単位の総数
    ・N:1次単位の大きさ
    ・\(\frac{M-m}{M-1},\frac{N-n}{N-1}\):有限修正項
    となりますよね。

    でも、

    この式は何なの?
    何でこんな難しい式なの?
    覚えられない。。。

    と困ってしまいますよね。QCプラネッツも苦労しました。

    そこで、

    せめて、「2段サンプリングの分散」の式を導出したい!

    という思いで、解説していきます。

    2段サンプリングの分散の式に必要な内容

    まとめると、以下を理解しておく必要があります。

    1. 条件付き確率
    2. 2変数の確率分布関数(同時確率質量関数)
    3. 同時確率分布の分散、共分散の導出
    4. 条件付き確率の期待値・分散
    5. 全分散の公式の導出
    6. 2段サンプリングの分散の公式導出
    1つの式なのにこんなに勉強が必要なの?

    残念ながら、「Yes」です。

    だから、「2段サンプリングの分散」の式を暗記だけして代入して終わることが多いです。

    公式暗記・代入だけでは意味不明!

    だから、サンプリングの分散はみんな苦手なのです!

    2段サンプリングの分散の式の丁寧な導出はQCプラネッツだけ

    「だから、教科書やサイトに、2段サンプリングの分散の式を導出する内容が書いているはず」と懇願しても、残念、ありませんでした。

    2段サンプリングの分散の式の丁寧な導出はQCプラネッツだけ

    では、1つ1つ解説します。

    ➁条件付き確率とは

    まず、第1弾として「条件付き確率」を解説します。条件付き確率は高校数学でも習う、「ちょっと変わった確率」です。

    1. 条件付き確率
    2. 2変数の確率分布関数(同時確率質量関数)
    3. 同時確率分布の分散、共分散の導出
    4. 条件付き確率の期待値・分散
    5. 全分散の公式の導出
    6. 2段サンプリングの分散の公式導出

    条件付き確率とは

    ●2つの事象、変数が前提です。ある事象Bが起こった条件のもとで、事象Aが起こる確率を考えるのが、「条件付き確率」ですね。

    事象Aも事象Bも同時に起こる確率は
    P(A∩B)=P(A)×P(B)
    で計算しますね。

    このANDの条件に対して、分母を
    全体1ではなく、事象Bが起こる確率と変える点が、
    「条件付き確率」の特徴です。

    条件付き確率の公式

    公式で書くと、

    ある事象Bが起こった条件のもとで、事象Aが起こる確率は
    P(A|B)=\(\frac{P(A∩B)}{P(B)}\)
    と書ける。

    条件付き確率の独立性とは?

    上に書いたとおり、
    P(A∩B)=P(A)×P(B)
    が成り立つ場合は

    P(A|B)=\(\frac{P(A∩B)}{P(B)}\)
    =\(\frac{ P(A)×P(B)}{P(B)}\)
    =P(A)
    なります。

    「ある事象Bが起こった条件のもとで、事象Aが起こる確率は、
    単に事象Aが起こる確率と同じ」です。

    って、これって、事象Aと事象Bの関わりがまったく無いじゃん!ということで、
    事象Aと事象Bは独立である
    って言います。

    論理的には、条件付き確率の独立性は有りですけど、実際は、
    AとBが互いに影響し合う場合に考える確率問題が「条件付き確率」です。

    2段サンプリングも1段目と2段目が互いに影響するので、条件付き確率の考えが必要です。

    ➂条件付き確率の例題

    実際に例題を解いてみましょう。

    袋の中にトランプが次のように12枚入っている。
    ハートの1~4の1枚ずつ計4枚
    スペードの1~8の1枚ずつ計8枚
    袋の中から1枚取り出すとき、
    (1)カードの数が3以下である確率を求めよ。
    (2)カードがスペードとわかっている時、カードの数が3以下である確率を求めよ。
    (3)カードの数が3以下であるとわかっているとき、カードがハートである確率を求めよ。

    解いてみましょう。
    ●(1)は、全12枚中、3以下のカードは6枚あるので、確率P=1/2
    これは簡単!

    (2)(3)は条件付き確率ですね。
    ●(2)は
    ・事象A:「カードの数が3以下」
    ・事象B:「スペードとわかっている時」
    ・事象A∩B:「カードがスペードで数が3以下」
    ですから、
    P(B)=8/12
    P(A∩B)=3/12
    より
    P(A|B)=\(\frac{P(A∩B)}{P(B)}\)= (3/12)/(8/12)=3/8
    です。ちょっとわかりにくいですね。条件付き確率は。

    検算方法としては、
    ・事象B:「スペードとわかっている時」⇒8枚
    ・事象A∩B:「カードがスペードで数が3以下」⇒3枚
    から3/8としてもOKですね。こっちの方が分かりやすいですね!

    ●(3)は
    ・事象A:「カードがハート」
    ・事象B:「カードの数が3以下である」
    ・事象A∩B:「カードの数が3以下で、ハート」
    ですから、
    P(B)=4/12
    P(A∩B)=3/12
    より
    P(A|B)=\(\frac{P(A∩B)}{P(B)}\)= (3/12)/(4/12)=3/4
    です。ちょっとわかりにくいですね。条件付き確率は。

    検算方法としては、
    ・事象B:「カードの数が3以下である」⇒4枚
    ・事象A∩B:「カードの数が3以下で、ハート」⇒3枚
    から3/4としてもOKですね。こっちの方が分かりやすいですね!

    条件付き確率って馴染みにくいですけど、
    P(A|B)=\(\frac{P(A∩B)}{P(B)}\)
    の式、ガンガン使っていくので、慣れましょうね!

    まとめ

    条件付き確率をわかりやすく解説しました。

    • ①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容
    • ➁条件付き確率とは
    • ➂条件付き確率の例題

  • 【必読】有限母集団の修正項の導出ができる

    【必読】有限母集団の修正項の導出ができる

    「有限母集団の修正項\(\frac{N-n}{N-1}\)の導出ができない」、と困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    【必読】有限母集団の修正項の導出ができる
    ●E[\(\bar{x}\)]=μ
    ●V(\(\bar{x}\))=\(\frac{N-n}{N-1}\)\(\frac{σ}{n}\)
    を丁寧に導出します。
    • ①有限母集団からのランダムサンプリング
    • ②有限母集団の標本平均の導出
    • ③修正項の導出に必要な数式
    • ④有限母集団の標本分散の修正項への導出

    QC・統計に勝てるためのサンプリング問題集を販売します!

    QC検定®1級、2級でサンプリングの問題で苦戦していませんか?本記事では、QC・統計に勝てるためのサンプリング問題集(20題)を紹介します。

    ①有限母集団からのランダムサンプリング

    下図のように、データ数N、平均μ、分散\(σ^2\)の有限母集団から、n個のデータをランダムサンプリングします。

    サンプリング

    n個のデータの平均ではない、標本平均の期待値E[\(\bar{x}\)]と、
    分散ではない、標本分散の期待値V(\(\bar{x}\))を導出します。

    [themoneytizer id=”105233-2″]

    ②有限母集団の標本平均の導出

    導出します。

    E[\(\bar{x}\)]=E[\(\frac{1}{n}\)\(\sum_{i=1}^{n}x_i\)]
    =\(\frac{1}{n}\)E[\(\sum_{i=1}^{n}x_i\)]
    =\(\frac{1}{n}\){E[\(x_1+x_2+…+x_n\)]}
    =\(\frac{1}{n}\){E[\(x_1\)]+ E[\(x_2\)]+…+ E[\(x_n\)]}
    =\(\frac{1}{n}\){μ+μ+…+μ}
    =\(\frac{nμ}{n}\)

    なお、すべてのiについて、
    E[\(x_i\)]=μ
    を使いました。

    ●E[\(\bar{x}\)]=μ
    と有限母集団の平均μと一致しました。

    ②修正項の導出に必要な数式

    次に標本分散V(\(\bar{x}\))を導出しますが、導出過程に必要な式があります。先に紹介して導出しておきましょう。

    【数式その1】
    \((\sum_{i=1}^{n}x_i)^2\)=\(\sum_{i=1}^{n}x_i ^2\)+\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)
    同様にnをNに、xをXに変えて
    \((\sum_{i=1}^{N}X_i)^2\)=\(\sum_{i=1}^{N}X_i ^2\)+\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{N}X_i X_j\)

    「なんじゃこりゃ!」という式ですが、展開すれば成立します。あとで導出しますね。

    【数式その2】
    \(\frac{1}{n}\)E[\(\sum_{i=1}^{n}x_i ^2\)]=\(\frac{1}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]
    \(\frac{1}{_{n}C_2}\)E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]= \(\frac{1}{_{N}C_2}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]

    【数式その1】の導出

    実際に展開しましょう。

    \((\sum_{i=1}^{n}x_i)^2\)
    =\((x_1+x_2+…+x_n)^2\)
    =(あ)

    和の2乗の展開は、
    自身の2乗と、互いの積の和ですね。これは高校1年数学レベルです。

    (あ)式は
    (あ)=(\(x_1^2+x_2^2+…+x_n^2\) (2乗和)
    +\(x_1( なし+x_2+x_3+…+x_{n-1}+x_n)\) (互いの積)
    +\(x_2(x_1+なし+x_3+…+x_{n-1}+x_n)\) (互いの積)

    +\(x_{n-1}(x_1+x_2+x_3+…+x_{n-2}+なし+x_n)\) (互いの積)
    +\(x_n (x_1+x_2+x_3+…+x_{n-2}+x_{n-1}+なし)\) (互いの積)
    =(い)

    (あ)式の「互いの積」項にある「なし」は2乗和の項に入れたため、ありません。「ない」ことを明確にするために「なし」と入れました。

    (い)式をまとめましょう。

    2乗和は簡単で
    (\(x_1^2+x_2^2+…+x_n^2\)=\(\sum_{i=1}^{n} x_i^2\)
    ですね。

    互いの積は、それぞれの組み合わせの積だけど、自分自身同士の積はないので、
    \(x_1( なし+x_2+x_3+…+x_{n-1}+x_n)\) (互いの積)
    +\(x_2(x_1+なし+x_3+…+x_{n-1}+x_n)\) (互いの積)

    +\(x_{n-1}(x_1+x_2+x_3+…+x_{n-2}+なし+x_n)\) (互いの積)
    +\(x_n (x_1+x_2+x_3+…+x_{n-2}+x_{n-1}+なし)\) (互いの積)
    =\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)
    とまとめることができます。

    【数式その1】
    \((\sum_{i=1}^{n}x_i)^2\)=\(\sum_{i=1}^{n}x_i ^2\)+\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)

    できましたね。

    【数式その2】の導出

    【数式その2】
    \(\frac{1}{n}\)E[\(\sum_{i=1}^{n}x_i ^2\)]=\(\frac{1}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]

    期待値Eを使って、ズルく導出します。数式よりは論理で両辺を等号に持ち込みます。

    もともとデータ\( X_i \)も\( x_i \)も同じ集合におり、平均、分散も同じですね。だとしたら、
    期待値E[\( X_i \)]= E[\( x_i \)]と
    期待値E[\( X_i^2 \)]= E[\( x_i^2 \)]と
    してもよいですね。期待値だから、似たデータなら期待値は同じ。ちょっと強引ですか?

    あとは、個数の平均を考えればOK。よって、

    【数式その2】
    \(\frac{1}{n}\)E[\(\sum_{i=1}^{n}x_i ^2\)]=\(\frac{1}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]

    数学的には正しいけど、ちょっと強引ですね。

    同様に、

    【数式その2】
    \(\frac{1}{_{n}C_2}\)E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]= \(\frac{1}{_{N}C_2}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]

    以上、下ごしらえは終わりです。では、標本分散を導出しましょう。

    ③有限母集団の標本分散の修正項への導出

    標本分散V(\(\bar{x}\))の式

    分散の公式は、

    V(\(\bar{x}\))=E[\(\bar{x^2}\)]-E[\(\bar{x}\)]2

    E[\(\bar{x}\)]はすでに、E[\(\bar{x}\)]=μとわかっています。

    E[\(\bar{x^2}\)]を導出します。分散はいつもE[\(x^2\)]の導出が難しいですよね。

    期待値E[\(\bar{x^2}\)]の導出

    E[\(\bar{x^2}\)]=E[\((\frac{1}{n}\sum_{i=1}^{n}x_i)^2\)]
    =\(\frac{1}{n^2}\)E[\((\sum_{i=1}^{n}x_i)^2\)]
    =(ア)

    (ア)の式で、\((\sum_{i=1}^{n}x_i)^2\)は、【数式その1】そのものですね。使いましょう。

    (ア)= \(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}x_i ^2\)+\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]
    =\(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}x_i ^2\)]+\(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]
    =(イ)

    次に、【数式その2】を使って\(x_i\)から\(X_i\)の式に変換します。
    E[\(\sum_{i=1}^{n}x_i ^2\)]=\(\frac{n}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]
    E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]= \(\frac{_{n}C_2}{_{N}C_2}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]

    (イ)
    =\(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}x_i ^2\)]+\(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]
    =\(\frac{1}{n^2}\)\(\frac{n}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]+\(\frac{1}{n^2}\)\(\frac{_{n}C_2}{_{N}C_2}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]
    =(ウ)

    整理すると、
    (ウ)
    =\(\frac{1}{nN}\)E[\(\sum_{i=1}^{N}X_i ^2\)]+\(\frac{1}{n^2}\)\(\frac{n(n-1)}{N(N-1)}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]
    =(エ)

    ここで、\(X_i\)は母集団のデータなので、期待値Eが外せます。つまり、
    E[\(\sum_{i=1}^{N}X_i ^2\)]=\(\sum_{i=1}^{N}X_i ^2\)
    E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]=\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)
    です。なお、サンプリングした方の\(x_i\)は期待値Eが外せません。

    (エ)
    =\(\frac{1}{nN}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{1}{n^2}\)\(\frac{n(n-1)}{N(N-1)}\)\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)
    =(オ)

    次に、よくわからない式、\(\sum_{j=1(i≠j)}^{n}X_i X_j\)を別の式に書き換えましょう。

    ここで、よく考えると、
    \(\frac{1}{N}\sum_{i=1}^{N}X_i\)=μより、
    ●\(\sum_{i=1}^{N}X_i\)=Nμ
    ●\((\sum_{i=1}^{N}X_i)^2\)=\((Nμ)^2\)
    が成り立ちますね。

    【数式その1】を見ると、

    【数式その1】
    \((\sum_{i=1}^{N}X_i)^2\)=\(\sum_{i=1}^{N}X_i ^2\)+\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{N}X_i X_j\)

    つまり、
    \((\sum_{i=1}^{N}X_i)^2\)=\(\sum_{i=1}^{N}X_i ^2\)+\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{N}X_i X_j\)=\((Nμ)^2\)
    が成り立ちます。式変形すると、
    \(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{N}X_i X_j\)=\((Nμ)^2\)-\(\sum_{i=1}^{N}X_i ^2\)
    =(カ)
    が成り立ちます。

    ちょっと前の(オ)式に(カ)式を代入します。

    (オ)
    =\(\frac{1}{nN}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{1}{n^2}\)\(\frac{n(n-1)}{N(N-1)}\)\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)
    =\(\frac{1}{nN}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{1}{n^2}\)\(\frac{n(n-1)}{N(N-1)}\)[\((Nμ)^2\)-\(\sum_{i=1}^{N}X_i ^2\)]
    =(キ)

    (キ)式はμと\(\sum_{i=1}^{N}X_i ^2\)について式変形しましょう。その結果は

    (キ)
    =E[\(\bar{x^2}\)]
    =\(\frac{1}{nN}\)\(\frac{N-n}{N-1}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{N(n-1)}{n(N-1)}\)\(μ^2\)
    となります。長かったですね。もうちょっとで完成です。

    標本分散の修正項への導出

    標本分散V(\(\bar{x}\))の式は

    V(\(\bar{x}\))=E[\(\bar{x^2}\)]-E[\(\bar{x}\)]2

    代入しましょう。
    V(\(\bar{x}\))=\(\frac{1}{nN}\)\(\frac{N-n}{N-1}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{N(n-1)}{n(N-1)}\)\(μ^2\)-\(μ^2\)
    =(ク)

    (ク)式をまとめると
    (ク)=\(\frac{N-n}{N-1}\)[\(\frac{1}{N}\sum_{i=1}^{N}X_i^2\)-\(μ^2\)]\(\frac{1}{n}\)
    =(ケ)

    (ケ)式の中の、[\(\frac{1}{N}\sum_{i=1}^{N}X_i^2\)-\(μ^2\)]はよく見ると、
    [\(\frac{1}{N}\sum_{i=1}^{N}X_i^2\)-\(μ^2\)]=E[x2]-E[x]2
    =\(σ^2\)
    ですから、まとめると、

    (ケ)つまり、標本分散V(\(\bar{x}\))は
    V(\(\bar{x}\))=\(\frac{N-n}{N-1}\)\(\frac{σ^2}{n}\)

    無限母集団の標本分散は\(\frac{σ^2}{n}\)ですから、修正項は、

    修正項は、\(\frac{N-n}{N-1}\)

    できましたね。お疲れさまでした。

    まとめ

    有限母集団の修正項の導出をわかりやすく解説しました。

    • ①有限母集団からのランダムサンプリング
    • ②有限母集団の標本平均の導出
    • ③修正項の導出に必要な数式
    • ④有限母集団の標本分散の修正項への導出

error: Content is protected !!