【必読】有限母集団の修正項の導出ができる
「有限母集団の修正項\(\frac{N-n}{N-1}\)の導出ができない」、と困っていませんか?
こういう疑問に答えます。
本記事のテーマ
●V(\(\bar{x}\))=\(\frac{N-n}{N-1}\)\(\frac{σ}{n}\)
を丁寧に導出します。
- ①有限母集団からのランダムサンプリング
- ②有限母集団の標本平均の導出
- ③修正項の導出に必要な数式
- ④有限母集団の標本分散の修正項への導出
①有限母集団からのランダムサンプリング
下図のように、データ数N、平均μ、分散\(σ^2\)の有限母集団から、n個のデータをランダムサンプリングします。
n個のデータの平均ではない、標本平均の期待値E[\(\bar{x}\)]と、
分散ではない、標本分散の期待値V(\(\bar{x}\))を導出します。
②有限母集団の標本平均の導出
導出します。
E[\(\bar{x}\)]=E[\(\frac{1}{n}\)\(\sum_{i=1}^{n}x_i\)]
=\(\frac{1}{n}\)E[\(\sum_{i=1}^{n}x_i\)]
=\(\frac{1}{n}\){E[\(x_1+x_2+…+x_n\)]}
=\(\frac{1}{n}\){E[\(x_1\)]+ E[\(x_2\)]+…+ E[\(x_n\)]}
=\(\frac{1}{n}\){μ+μ+…+μ}
=\(\frac{nμ}{n}\)
=μ
なお、すべてのiについて、
E[\(x_i\)]=μ
を使いました。
と有限母集団の平均μと一致しました。
②修正項の導出に必要な数式
次に標本分散V(\(\bar{x}\))を導出しますが、導出過程に必要な式があります。先に紹介して導出しておきましょう。
\((\sum_{i=1}^{n}x_i)^2\)=\(\sum_{i=1}^{n}x_i ^2\)+\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)
同様にnをNに、xをXに変えて
\((\sum_{i=1}^{N}X_i)^2\)=\(\sum_{i=1}^{N}X_i ^2\)+\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{N}X_i X_j\)
「なんじゃこりゃ!」という式ですが、展開すれば成立します。あとで導出しますね。
\(\frac{1}{n}\)E[\(\sum_{i=1}^{n}x_i ^2\)]=\(\frac{1}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]
\(\frac{1}{_{n}C_2}\)E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]= \(\frac{1}{_{N}C_2}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]
【数式その1】の導出
実際に展開しましょう。
\((\sum_{i=1}^{n}x_i)^2\)
=\((x_1+x_2+…+x_n)^2\)
=(あ)
和の2乗の展開は、
自身の2乗と、互いの積の和ですね。これは高校1年数学レベルです。
(あ)式は
(あ)=(\(x_1^2+x_2^2+…+x_n^2\) (2乗和)
+\(x_1( なし+x_2+x_3+…+x_{n-1}+x_n)\) (互いの積)
+\(x_2(x_1+なし+x_3+…+x_{n-1}+x_n)\) (互いの積)
…
+\(x_{n-1}(x_1+x_2+x_3+…+x_{n-2}+なし+x_n)\) (互いの積)
+\(x_n (x_1+x_2+x_3+…+x_{n-2}+x_{n-1}+なし)\) (互いの積)
=(い)
(あ)式の「互いの積」項にある「なし」は2乗和の項に入れたため、ありません。「ない」ことを明確にするために「なし」と入れました。
(い)式をまとめましょう。
2乗和は簡単で
(\(x_1^2+x_2^2+…+x_n^2\)=\(\sum_{i=1}^{n} x_i^2\)
ですね。
互いの積は、それぞれの組み合わせの積だけど、自分自身同士の積はないので、
\(x_1( なし+x_2+x_3+…+x_{n-1}+x_n)\) (互いの積)
+\(x_2(x_1+なし+x_3+…+x_{n-1}+x_n)\) (互いの積)
…
+\(x_{n-1}(x_1+x_2+x_3+…+x_{n-2}+なし+x_n)\) (互いの積)
+\(x_n (x_1+x_2+x_3+…+x_{n-2}+x_{n-1}+なし)\) (互いの積)
=\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)
とまとめることができます。
\((\sum_{i=1}^{n}x_i)^2\)=\(\sum_{i=1}^{n}x_i ^2\)+\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)
できましたね。
【数式その2】の導出
\(\frac{1}{n}\)E[\(\sum_{i=1}^{n}x_i ^2\)]=\(\frac{1}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]
期待値Eを使って、ズルく導出します。数式よりは論理で両辺を等号に持ち込みます。
もともとデータ\( X_i \)も\( x_i \)も同じ集合におり、平均、分散も同じですね。だとしたら、
期待値E[\( X_i \)]= E[\( x_i \)]と
期待値E[\( X_i^2 \)]= E[\( x_i^2 \)]と
してもよいですね。期待値だから、似たデータなら期待値は同じ。ちょっと強引ですか?
あとは、個数の平均を考えればOK。よって、
\(\frac{1}{n}\)E[\(\sum_{i=1}^{n}x_i ^2\)]=\(\frac{1}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]
数学的には正しいけど、ちょっと強引ですね。
同様に、
\(\frac{1}{_{n}C_2}\)E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]= \(\frac{1}{_{N}C_2}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]
以上、下ごしらえは終わりです。では、標本分散を導出しましょう。
③有限母集団の標本分散の修正項への導出
標本分散V(\(\bar{x}\))の式
分散の公式は、
E[\(\bar{x}\)]はすでに、E[\(\bar{x}\)]=μとわかっています。
E[\(\bar{x^2}\)]を導出します。分散はいつもE[\(x^2\)]の導出が難しいですよね。
期待値E[\(\bar{x^2}\)]の導出
E[\(\bar{x^2}\)]=E[\((\frac{1}{n}\sum_{i=1}^{n}x_i)^2\)]
=\(\frac{1}{n^2}\)E[\((\sum_{i=1}^{n}x_i)^2\)]
=(ア)
(ア)の式で、\((\sum_{i=1}^{n}x_i)^2\)は、【数式その1】そのものですね。使いましょう。
(ア)= \(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}x_i ^2\)+\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]
=\(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}x_i ^2\)]+\(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]
=(イ)
次に、【数式その2】を使って\(x_i\)から\(X_i\)の式に変換します。
E[\(\sum_{i=1}^{n}x_i ^2\)]=\(\frac{n}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]
E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]= \(\frac{_{n}C_2}{_{N}C_2}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]
(イ)
=\(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}x_i ^2\)]+\(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]
=\(\frac{1}{n^2}\)\(\frac{n}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]+\(\frac{1}{n^2}\)\(\frac{_{n}C_2}{_{N}C_2}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]
=(ウ)
整理すると、
(ウ)
=\(\frac{1}{nN}\)E[\(\sum_{i=1}^{N}X_i ^2\)]+\(\frac{1}{n^2}\)\(\frac{n(n-1)}{N(N-1)}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]
=(エ)
ここで、\(X_i\)は母集団のデータなので、期待値Eが外せます。つまり、
E[\(\sum_{i=1}^{N}X_i ^2\)]=\(\sum_{i=1}^{N}X_i ^2\)
E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]=\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)
です。なお、サンプリングした方の\(x_i\)は期待値Eが外せません。
(エ)
=\(\frac{1}{nN}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{1}{n^2}\)\(\frac{n(n-1)}{N(N-1)}\)\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)
=(オ)
次に、よくわからない式、\(\sum_{j=1(i≠j)}^{n}X_i X_j\)を別の式に書き換えましょう。
ここで、よく考えると、
\(\frac{1}{N}\sum_{i=1}^{N}X_i\)=μより、
●\(\sum_{i=1}^{N}X_i\)=Nμ
●\((\sum_{i=1}^{N}X_i)^2\)=\((Nμ)^2\)
が成り立ちますね。
【数式その1】を見ると、
\((\sum_{i=1}^{N}X_i)^2\)=\(\sum_{i=1}^{N}X_i ^2\)+\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{N}X_i X_j\)
つまり、
\((\sum_{i=1}^{N}X_i)^2\)=\(\sum_{i=1}^{N}X_i ^2\)+\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{N}X_i X_j\)=\((Nμ)^2\)
が成り立ちます。式変形すると、
\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{N}X_i X_j\)=\((Nμ)^2\)-\(\sum_{i=1}^{N}X_i ^2\)
=(カ)
が成り立ちます。
ちょっと前の(オ)式に(カ)式を代入します。
(オ)
=\(\frac{1}{nN}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{1}{n^2}\)\(\frac{n(n-1)}{N(N-1)}\)\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)
=\(\frac{1}{nN}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{1}{n^2}\)\(\frac{n(n-1)}{N(N-1)}\)[\((Nμ)^2\)-\(\sum_{i=1}^{N}X_i ^2\)]
=(キ)
(キ)式はμと\(\sum_{i=1}^{N}X_i ^2\)について式変形しましょう。その結果は
(キ)
=E[\(\bar{x^2}\)]
=\(\frac{1}{nN}\)\(\frac{N-n}{N-1}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{N(n-1)}{n(N-1)}\)\(μ^2\)
となります。長かったですね。もうちょっとで完成です。
標本分散の修正項への導出
標本分散V(\(\bar{x}\))の式は
代入しましょう。
V(\(\bar{x}\))=\(\frac{1}{nN}\)\(\frac{N-n}{N-1}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{N(n-1)}{n(N-1)}\)\(μ^2\)-\(μ^2\)
=(ク)
(ク)式をまとめると
(ク)=\(\frac{N-n}{N-1}\)[\(\frac{1}{N}\sum_{i=1}^{N}X_i^2\)-\(μ^2\)]\(\frac{1}{n}\)
=(ケ)
(ケ)式の中の、[\(\frac{1}{N}\sum_{i=1}^{N}X_i^2\)-\(μ^2\)]はよく見ると、
[\(\frac{1}{N}\sum_{i=1}^{N}X_i^2\)-\(μ^2\)]=E[x2]-E[x]2
=\(σ^2\)
ですから、まとめると、
(ケ)つまり、標本分散V(\(\bar{x}\))は
V(\(\bar{x}\))=\(\frac{N-n}{N-1}\)\(\frac{σ^2}{n}\)
無限母集団の標本分散は\(\frac{σ^2}{n}\)ですから、修正項は、
できましたね。お疲れさまでした。
まとめ
有限母集団の修正項の導出をわかりやすく解説しました。
- ①有限母集団からのランダムサンプリング
- ②有限母集団の標本平均の導出
- ③修正項の導出に必要な数式
- ④有限母集団の標本分散の修正項への導出
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119