QCプラネッツ 品質のプロフェッショナルを育成するサイト

【必読】有限母集団の修正項の導出ができる

サンプリング

「有限母集団の修正項\(\frac{N-n}{N-1}\)の導出ができない」、と困っていませんか?

こういう疑問に答えます。

本記事のテーマ

【必読】有限母集団の修正項の導出ができる
●E[\(\bar{x}\)]=μ
●V(\(\bar{x}\))=\(\frac{N-n}{N-1}\)\(\frac{σ}{n}\)
を丁寧に導出します。
  • ①有限母集団からのランダムサンプリング
  • ②有限母集団の標本平均の導出
  • ③修正項の導出に必要な数式
  • ④有限母集団の標本分散の修正項への導出

QC・統計に勝てるためのサンプリング問題集を販売します!

QC検定®1級、2級でサンプリングの問題で苦戦していませんか?本記事では、QC・統計に勝てるためのサンプリング問題集(20題)を紹介します。

①有限母集団からのランダムサンプリング

下図のように、データ数N、平均μ、分散\(σ^2\)の有限母集団から、n個のデータをランダムサンプリングします。

サンプリング

n個のデータの平均ではない、標本平均の期待値E[\(\bar{x}\)]と、
分散ではない、標本分散の期待値V(\(\bar{x}\))を導出します。

②有限母集団の標本平均の導出

導出します。

E[\(\bar{x}\)]=E[\(\frac{1}{n}\)\(\sum_{i=1}^{n}x_i\)]
=\(\frac{1}{n}\)E[\(\sum_{i=1}^{n}x_i\)]
=\(\frac{1}{n}\){E[\(x_1+x_2+…+x_n\)]}
=\(\frac{1}{n}\){E[\(x_1\)]+ E[\(x_2\)]+…+ E[\(x_n\)]}
=\(\frac{1}{n}\){μ+μ+…+μ}
=\(\frac{nμ}{n}\)

なお、すべてのiについて、
E[\(x_i\)]=μ
を使いました。

●E[\(\bar{x}\)]=μ
と有限母集団の平均μと一致しました。

②修正項の導出に必要な数式

次に標本分散V(\(\bar{x}\))を導出しますが、導出過程に必要な式があります。先に紹介して導出しておきましょう。

【数式その1】
\((\sum_{i=1}^{n}x_i)^2\)=\(\sum_{i=1}^{n}x_i ^2\)+\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)
同様にnをNに、xをXに変えて
\((\sum_{i=1}^{N}X_i)^2\)=\(\sum_{i=1}^{N}X_i ^2\)+\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{N}X_i X_j\)

「なんじゃこりゃ!」という式ですが、展開すれば成立します。あとで導出しますね。

【数式その2】
\(\frac{1}{n}\)E[\(\sum_{i=1}^{n}x_i ^2\)]=\(\frac{1}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]
\(\frac{1}{_{n}C_2}\)E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]= \(\frac{1}{_{N}C_2}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]

【数式その1】の導出

実際に展開しましょう。

\((\sum_{i=1}^{n}x_i)^2\)
=\((x_1+x_2+…+x_n)^2\)
=(あ)

和の2乗の展開は、
自身の2乗と、互いの積の和ですね。これは高校1年数学レベルです。

(あ)式は
(あ)=(\(x_1^2+x_2^2+…+x_n^2\) (2乗和)
+\(x_1( なし+x_2+x_3+…+x_{n-1}+x_n)\) (互いの積)
+\(x_2(x_1+なし+x_3+…+x_{n-1}+x_n)\) (互いの積)

+\(x_{n-1}(x_1+x_2+x_3+…+x_{n-2}+なし+x_n)\) (互いの積)
+\(x_n (x_1+x_2+x_3+…+x_{n-2}+x_{n-1}+なし)\) (互いの積)
=(い)

(あ)式の「互いの積」項にある「なし」は2乗和の項に入れたため、ありません。「ない」ことを明確にするために「なし」と入れました。

(い)式をまとめましょう。

2乗和は簡単で
(\(x_1^2+x_2^2+…+x_n^2\)=\(\sum_{i=1}^{n} x_i^2\)
ですね。

互いの積は、それぞれの組み合わせの積だけど、自分自身同士の積はないので、
\(x_1( なし+x_2+x_3+…+x_{n-1}+x_n)\) (互いの積)
+\(x_2(x_1+なし+x_3+…+x_{n-1}+x_n)\) (互いの積)

+\(x_{n-1}(x_1+x_2+x_3+…+x_{n-2}+なし+x_n)\) (互いの積)
+\(x_n (x_1+x_2+x_3+…+x_{n-2}+x_{n-1}+なし)\) (互いの積)
=\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)
とまとめることができます。

【数式その1】
\((\sum_{i=1}^{n}x_i)^2\)=\(\sum_{i=1}^{n}x_i ^2\)+\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)

できましたね。

【数式その2】の導出

【数式その2】
\(\frac{1}{n}\)E[\(\sum_{i=1}^{n}x_i ^2\)]=\(\frac{1}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]

期待値Eを使って、ズルく導出します。数式よりは論理で両辺を等号に持ち込みます。

もともとデータ\( X_i \)も\( x_i \)も同じ集合におり、平均、分散も同じですね。だとしたら、
期待値E[\( X_i \)]= E[\( x_i \)]と
期待値E[\( X_i^2 \)]= E[\( x_i^2 \)]と
してもよいですね。期待値だから、似たデータなら期待値は同じ。ちょっと強引ですか?

あとは、個数の平均を考えればOK。よって、

【数式その2】
\(\frac{1}{n}\)E[\(\sum_{i=1}^{n}x_i ^2\)]=\(\frac{1}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]

数学的には正しいけど、ちょっと強引ですね。

同様に、

【数式その2】
\(\frac{1}{_{n}C_2}\)E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]= \(\frac{1}{_{N}C_2}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]

以上、下ごしらえは終わりです。では、標本分散を導出しましょう。

③有限母集団の標本分散の修正項への導出

標本分散V(\(\bar{x}\))の式

分散の公式は、

V(\(\bar{x}\))=E[\(\bar{x^2}\)]-E[\(\bar{x}\)]2

E[\(\bar{x}\)]はすでに、E[\(\bar{x}\)]=μとわかっています。

E[\(\bar{x^2}\)]を導出します。分散はいつもE[\(x^2\)]の導出が難しいですよね。

期待値E[\(\bar{x^2}\)]の導出

E[\(\bar{x^2}\)]=E[\((\frac{1}{n}\sum_{i=1}^{n}x_i)^2\)]
=\(\frac{1}{n^2}\)E[\((\sum_{i=1}^{n}x_i)^2\)]
=(ア)

(ア)の式で、\((\sum_{i=1}^{n}x_i)^2\)は、【数式その1】そのものですね。使いましょう。

(ア)= \(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}x_i ^2\)+\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]
=\(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}x_i ^2\)]+\(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]
=(イ)

次に、【数式その2】を使って\(x_i\)から\(X_i\)の式に変換します。
E[\(\sum_{i=1}^{n}x_i ^2\)]=\(\frac{n}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]
E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]= \(\frac{_{n}C_2}{_{N}C_2}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]

(イ)
=\(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}x_i ^2\)]+\(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]
=\(\frac{1}{n^2}\)\(\frac{n}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]+\(\frac{1}{n^2}\)\(\frac{_{n}C_2}{_{N}C_2}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]
=(ウ)

整理すると、
(ウ)
=\(\frac{1}{nN}\)E[\(\sum_{i=1}^{N}X_i ^2\)]+\(\frac{1}{n^2}\)\(\frac{n(n-1)}{N(N-1)}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]
=(エ)

ここで、\(X_i\)は母集団のデータなので、期待値Eが外せます。つまり、
E[\(\sum_{i=1}^{N}X_i ^2\)]=\(\sum_{i=1}^{N}X_i ^2\)
E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]=\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)
です。なお、サンプリングした方の\(x_i\)は期待値Eが外せません。

(エ)
=\(\frac{1}{nN}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{1}{n^2}\)\(\frac{n(n-1)}{N(N-1)}\)\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)
=(オ)

次に、よくわからない式、\(\sum_{j=1(i≠j)}^{n}X_i X_j\)を別の式に書き換えましょう。

ここで、よく考えると、
\(\frac{1}{N}\sum_{i=1}^{N}X_i\)=μより、
●\(\sum_{i=1}^{N}X_i\)=Nμ
●\((\sum_{i=1}^{N}X_i)^2\)=\((Nμ)^2\)
が成り立ちますね。

【数式その1】を見ると、

【数式その1】
\((\sum_{i=1}^{N}X_i)^2\)=\(\sum_{i=1}^{N}X_i ^2\)+\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{N}X_i X_j\)

つまり、
\((\sum_{i=1}^{N}X_i)^2\)=\(\sum_{i=1}^{N}X_i ^2\)+\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{N}X_i X_j\)=\((Nμ)^2\)
が成り立ちます。式変形すると、
\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{N}X_i X_j\)=\((Nμ)^2\)-\(\sum_{i=1}^{N}X_i ^2\)
=(カ)
が成り立ちます。

ちょっと前の(オ)式に(カ)式を代入します。

(オ)
=\(\frac{1}{nN}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{1}{n^2}\)\(\frac{n(n-1)}{N(N-1)}\)\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)
=\(\frac{1}{nN}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{1}{n^2}\)\(\frac{n(n-1)}{N(N-1)}\)[\((Nμ)^2\)-\(\sum_{i=1}^{N}X_i ^2\)]
=(キ)

(キ)式はμと\(\sum_{i=1}^{N}X_i ^2\)について式変形しましょう。その結果は

(キ)
=E[\(\bar{x^2}\)]
=\(\frac{1}{nN}\)\(\frac{N-n}{N-1}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{N(n-1)}{n(N-1)}\)\(μ^2\)
となります。長かったですね。もうちょっとで完成です。

標本分散の修正項への導出

標本分散V(\(\bar{x}\))の式は

V(\(\bar{x}\))=E[\(\bar{x^2}\)]-E[\(\bar{x}\)]2

代入しましょう。
V(\(\bar{x}\))=\(\frac{1}{nN}\)\(\frac{N-n}{N-1}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{N(n-1)}{n(N-1)}\)\(μ^2\)-\(μ^2\)
=(ク)

(ク)式をまとめると
(ク)=\(\frac{N-n}{N-1}\)[\(\frac{1}{N}\sum_{i=1}^{N}X_i^2\)-\(μ^2\)]\(\frac{1}{n}\)
=(ケ)

(ケ)式の中の、[\(\frac{1}{N}\sum_{i=1}^{N}X_i^2\)-\(μ^2\)]はよく見ると、
[\(\frac{1}{N}\sum_{i=1}^{N}X_i^2\)-\(μ^2\)]=E[x2]-E[x]2
=\(σ^2\)
ですから、まとめると、

(ケ)つまり、標本分散V(\(\bar{x}\))は
V(\(\bar{x}\))=\(\frac{N-n}{N-1}\)\(\frac{σ^2}{n}\)

無限母集団の標本分散は\(\frac{σ^2}{n}\)ですから、修正項は、

修正項は、\(\frac{N-n}{N-1}\)

できましたね。お疲れさまでした。

まとめ

有限母集団の修正項の導出をわかりやすく解説しました。

  • ①有限母集団からのランダムサンプリング
  • ②有限母集団の標本平均の導出
  • ③修正項の導出に必要な数式
  • ④有限母集団の標本分散の修正項への導出


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!