投稿者: QCプラネッツ

  • ウェルチの方法とサタースウェイトの自由度が導出できる

    ウェルチの方法とサタースウェイトの自由度が導出できる

    「ウェルチの方法とサタースウェイトの自由度はどうやって導出するのかがわからない」などと困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    ウェルチの方法とサタースウェイトの自由度が導出できる

    おさえておきたいポイント

    • ①ウェルチの方法の検定統計量を導出
    • ➁サタースウェイトの自由度を導出
    [themoneytizer id=”105233-2″]
    検定統計量は自力で導出しよう!
    \(t\)=\(\frac{\bar{x_1}-\bar{x_2}}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}\)
    サタースウェイトの自由度の導出過程を知ろう!
    \(\frac{(\frac{V_A}{n_A}+\frac{V_B}{n_B})^2}{Φ^*}\)=\(\frac{(\frac{V_A}{n_A})^2}{Φ_A}\)+\(\frac{(\frac{V_B}{n_B})^2}{Φ_B}\)

    ①ウェルチの方法の検定統計量を導出

    元の式は関連記事になるように、
    \(t_0\)=\(\frac{\bar{x_1}-\bar{x_2}}{\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}}\)
    がベースです。

    【初心者必見!】計量値の検定統計量が導出できる
    計量値の検定統計量は暗記不要です。本記事では、正規分布、t分布に従う2つの検定統計量が有れば、母平均差の検定や対応のある場合の検定に必要な検定統計量の式が自力で導出できる方法をわかりやすく解説します。統計、QCの初心者は必読です。

    ウェルチの検定において、検定統計量の導出は簡単ですが、この検定統計量に該当する自由度Φはいくらにすべきでしょうか?

    これを与えてくれるのがサタースウェイトの自由度です。

    ➁サタースウェイトの自由度を導出

    サタースウェイトの自由度を導出

    サタースウェイトの自由度
    \(\frac{(\frac{V_A}{n_A}+\frac{V_B}{n_B})^2}{Φ^*}\)=\(\frac{(\frac{V_A}{n_A})^2}{Φ_A}\)+\(\frac{(\frac{V_B}{n_B})^2}{Φ_B}\)

    シンプルな式ではありますが、導出過程がどこにも書いていませんので、丁寧にまとめました。

    ウェルチ(Welch)の方法とサタースウェイトの自由度が導出できる【検定と推定】|こう品質@品質管理ブロガー
    ●サタースウェイトの自由度Φ* を導出します! 公式丸暗記で済ませがちですが、実際に導出します! 是非ご購入いただいて、ご確認ください。 よろしくお願いいたします。

    ご確認ください。

    サタースウェイトの自由度の注意点

    1つ注意なのが、

    サタースウェイトの自由度
    \(\frac{(\frac{V_A}{n_A}+\frac{V_B}{n_B})^2}{Φ^*}\)=\(\frac{(\frac{V_A}{n_A})^2}{Φ_A}\)+\(\frac{(\frac{V_B}{n_B})^2}{Φ_B}\)
    から計算する\(Φ^*\)は
    小数を含むことが多い!

    なので、


    \(Φ^*\)の近い整数に変えるが、
    t分布の分布関数の値が厳しい方の整数に変えるとベター!

    です。

    これもよく試験に出ますね。

    まとめ

    「ウェルチの方法とサタースウェイトの自由度が導出できる」を解説しました。

    • ①ウェルチの方法の検定統計量を導出
    • ➁サタースウェイトの自由度を導出

  • 【初心者必見!】計数値の検定統計量が導出できる

    【初心者必見!】計数値の検定統計量が導出できる

    「計数値の検定統計量の式が多すぎて暗記できない」などと困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    【初心者必見!】計数値の検定統計量が導出できる

    おさえておきたいポイント

    • ①計数値の検定統計量のベースとなる式
    • ➁母不適合品率の検定統計量を導出
    • ➂母不適合品率差の検定統計量を導出
    • ➃母不適合品率差の検定統計量の注意点
    • ➄母不適合数の検定統計量を導出
    • ⑥母不適合数差の検定統計量を導出
    [themoneytizer id=”105233-2″]
    検定統計量は自力で導出しよう!
    各ケースでの検定統計量の式の違いも確認しよう!
    何度も見て、解けるようになりましょう!
    対象数 検定対象 統計量分布 検定統計量
    1 母不適合品率
    \(p\)
    二項分布 \(u_0\)=\(\frac{p-p_0}{\sqrt{\frac{p(1-p)}{n}}}\)
    2 母不適合品率差
    \(p_A-p_B\)
    二項分布 \(u_0\)=\(\frac{p_A-p_B}{\sqrt{\frac{p_A(1-p_A)}{n_A}+\frac{p_B(1-p_B)}{n_B}}}\)
    1 母不適合数
    λ
    ポアソン分布 \(u_0\)=\(\frac{\hat{λ}-λ_0}{\sqrt{\frac{λ_0}{n}}}\)
    2 母不適合数差
    \(λ_A-λ_B\)
    ポアソン分布 \(u_0\)=\(\frac{λ_A-λ_B}{\sqrt{\frac{λ_A}{n_A}+\frac{λ_B}{n_B}}}\)

    ①計数値の検定統計量のベースとなる式

    標準正規分布がベース

    標準正規分布に従うがベースとします。関連記事にあるように、
    二項分布やポアソン分布は正規分布に近づく性質があります。

    【初心者必見!】正規分布、二項分布、ポアソン分布が比較できる
    正規分布、二項分布、ポアソン分布が比較できますか?本記事では、期待値、分散の値をそろえると、正規分布、二項分布、ポアソン分布はぴったりそろうことをわかりやすく解説します。3者がそろう条件をしっかり理解しましょう。初心者は必読です。

    ベースとなる検定統計量は

    \(u_0\)=\(\frac{\bar{x}-μ_0}{σ}\)

    です。この式くらいは暗記してもOKです。

    ただし、1点注意なのは、サンプル数\(n\)の項は含まれていません。ここだけ注意しましょう。

    二項分布の場合

    二項分布の期待値と分散はそれぞれ
    ●E[\(k\)]=\(pn\) (\(k\)=\(pn\))
    ●V[\(k\)]=\(pn(1-p)\)  (\(k\)=\(pn\))
    です。この関係式を代入すれば二項分布の検定統計量が導出できます。

    ポアソン分布の場合

    ポアソン分布の期待値と分散はそれぞれ
    ●E[\(k\)]=\(λ\)
    ●V[\(k\)]=\(λ\)
    です。この関係式を代入すればポアソン分布の検定統計量が導出できます。

    ➁母不適合品率の検定統計量を導出

    前提条件

    前提条件は、

    1. 母不適合品率
    2. 二項分布に従う(正規分布近似できる)

    検定統計量を導出

    検定統計量の出発点は、\(u_0\)=\(\frac{\bar{x}-μ_0}{\sqrt{σ}}\)
    です。

    二項分布の期待値と分散はそれぞれ
    ●E[\(k\)]=\(pn\) (\(k\)=\(pn\))
    ●V[\(k\)]=\(pn(1-p)\)  (\(k\)=\(pn\))

    ただし、1つ注意点があります。

    ●E[\(k\)]=\(pn\) (\(k\)=\(pn\))
    ●V[\(k\)]=\(pn(1-p)\)であるが、
    必要なのは、
    ●E[\(p\)]と●V[\(p\)]

    なので、\(k=pn\)から\(p=\frac{k}{n}\)と変形して、求めます。

    ●E[\(p\)]=E[\(\frac{k}{n}\)]=\(\frac{1}{n}\)E[\(k\)]=\(\frac{pn}{n}\)=\(p\)
    ●V[\(p\)]= V[\(\frac{k}{n}\)]=\(\frac{1}{n^2}\)V[\(k\)]
    =\(\frac{pn(1-p)}{n^2}\)=\(\frac{p(1-p)}{n}\)
    を使います。

    この関係式を代入すれば二項分布の検定統計量が導出できます。

    また、二項分布は確率\(p\)を代入するので、
    \(u_0\)=\(\frac{\bar{x}-μ_0}{σ/n}\)の\(n\)を入れずに、
    \(u_0\)=\(\frac{\bar{x}-μ_0}{σ}\)を使います。
    ここがややこしいですが、注意しましょう。

    なので、この式を\(u_0\)=\(\frac{\bar{x}-μ_0}{σ}\)に代入します
    ●\(\bar{x}\)→\(p\)
    ●\(μ_0\)→\(p_0\)
    ●\(σ\)→\(\sqrt{\frac{p(1-p)}{n}}\)
    を代入するので、

    \(u_0\)=\(\frac{\bar{x}-μ_0}{σ}\)
    =\(\frac{p-p_0}{\sqrt{\frac{p(1-p)}{n}}}\)
    と導出できます。

    よって、検定統計量は
    ●\(u_0\)=\(\frac{p-p_0}{\sqrt{\frac{p(1-p)}{n}}}\)
    となります。

    ➂母不適合品率差の検定統計量を導出

    前提条件

    前提条件は、

    1. 母不適合品率差
    2. 二項分布に従う(正規分布近似できる)

    検定統計量を導出

    検定統計量の出発点は、\(u_0\)=\(\frac{p-p_0}{\sqrt{\frac{p(1-p)}{n}}}\)
    です。

    分散は加法性を使って
    ●V(A-B)=V(A)+V(B)= \(\frac{p_A (1-p_A)}{n_A}\)+\(\frac{p_B (1-p_B)}{n_B}\)
    とします。

    この関係式を代入すれば二項分布の検定統計量が導出できます。

    なので、この式を\(u_0\)=\(\frac{p-p_0}{\sqrt{\frac{p(1-p)}{n}}}\)に代入します
    ●\( p \)→\(p_A\)
    ●\( p_0\)→\(p_B\)
    ●\(σ\)→\(\sqrt{\frac{p_A(1-p_A)}{n_A}+\frac{p_B(1-p_B)}{n_B}}\)
    を代入するので、

    \(u_0\)=\(\frac{\bar{x}-μ_0}{σ}\)
    =\(\frac{p_A-p_B}{\sqrt{\frac{p_A(1-p_A)}{n_A}+\frac{p_B(1-p_B)}{n_B}}}\)
    と導出できます。

    よって、検定統計量は
    ●\(u_0\)=\(\frac{p_A-p_B}{\sqrt{\frac{p_A(1-p_A)}{n_A}+\frac{p_B(1-p_B)}{n_B}}}\)
    となります。

    二項分布の検定統計量が導出できました!

    ➃母不適合品率差の検定統計量の注意点

    実はよく使う公式に、

    検定統計量
    ●\(u_0\)=\(\frac{p_A-p_B}{\sqrt{\bar{p}(1-\bar{p})(\frac{1}{n_A}+\frac{1}{n_B})}}\)
    ただし
    ・\(p_A\)=\(\frac{x_A}{n_A}\)
    ・\(p_B\)=\(\frac{x_B}{n_B}\)
    ・\(\bar{p}\)=\(\frac{x_A+x_B}{n_A+n_B}\)

    ですが、よく確かめると

    ●\(u_0\)=\(\frac{p_A-p_B}{\sqrt{\frac{p_A(1-p_A)}{n_A}+\frac{p_B(1-p_B)}{n_B}}}\)

    ●\(u_0\)=\(\frac{p_A-p_B}{\sqrt{\bar{p}(1-\bar{p})(\frac{1}{n_A}+\frac{1}{n_B})}}\)
    は一致しません。

    よく式を見ると、
    ●\(u_0\)=\(\frac{p_A-p_B}{\sqrt{\frac{p_A(1-p_A)}{n_A}+\frac{p_B(1-p_B)}{n_B}}}\)
    ●\(u_0\)=\(\frac{p_A-p_B}{\sqrt{\bar{p}(1-\bar{p})(\frac{1}{n_A}+\frac{1}{n_B})}}\)
    が一致させるには、

    \(\frac{p_A(1-p_A)}{n_A}\)=\(\bar{p}(1-\bar{p})\)
    かつ
    \(\frac{p_B(1-p_B)}{n_B}\)=\(\bar{p}(1-\bar{p})\)
    が必要ですが、

    (左辺)はAまたはBのみ
    (右辺)はA,B両方が含まれる値なので、
    片方が実はない(0である)条件以外は結果は一致しません。

    よく使う検定統計量
    ●\(u_0\)=\(\frac{p_A-p_B}{\sqrt{\bar{p}(1-\bar{p})(\frac{1}{n_A}+\frac{1}{n_B})}}\)
    ですが、自分で正しく導出してきた
    ●\(u_0\)=\(\frac{p_A-p_B}{\sqrt{\frac{p_A(1-p_A)}{n_A}+\frac{p_B(1-p_B)}{n_B}}}\)
    と結果が一致しませんので、注意ください!

    ●\(u_0\)=\(\frac{p_A-p_B}{\sqrt{\bar{p}(1-\bar{p})(\frac{1}{n_A}+\frac{1}{n_B})}}\)
    は試験に出るから丸暗記とならないよう注意が必要です!

    自分が使う式は
    ちゃんと導出して理解してから
    使いましょう!

    ➄母不適合数の検定統計量を導出

    前提条件

    前提条件は、

    1. 母不適合数
    2. ポアソン分布に従う(正規分布近似できる)

    検定統計量を導出

    検定統計量の出発点は、\(u_0\)=\(\frac{\bar{x}-μ_0}{\frac{σ}{\sqrt{n}}}\)
    です。

    ポアソン分布の期待値と分散はそれぞれ
    ●E[\(λ\)]=\(λ\)
    ●V[\(λ\)]=\(λ\)です。

    二項分布と違って、\(λ\)を直接代入します。

    この関係式を代入すればポアソン分布の検定統計量が導出できます。

    また、ポアソン分布は\(λ\)=\(np\)を代入し\(n\)を含んでいるので、
    \(u_0\)=\(\frac{\bar{x}-μ_0}{\frac{σ}{\sqrt{n}}}\)を使います。
    二項分布と違って、ここがややこしいですが、注意しましょう。

    なので、この式を\(u_0\)=\(\frac{\bar{x}-μ_0}{\frac{σ}{\sqrt{n}}}\)に代入します
    ●\(\bar{x}\)→\(λ\)
    ●\(μ_0\)→\(λ_0\)
    ●\(σ\)→\(\sqrt{\frac{λ_0}{n}}\)
    を代入するので、

    \(u_0\)=\(\frac{\bar{x}-μ_0}{σ}\)
    =\(\frac{λ-λ_0}{\sqrt{\frac{λ_0}{n}}}\)
    と導出できます。

    よって、検定統計量は
    ●\(u_0\)=\(\frac{λ-λ_0}{\sqrt{\frac{λ_0}{n}}}\)
    となります。

    ⑥母不適合数差の検定統計量を導出

    前提条件

    前提条件は、

    1. 母不適合数差
    2. ポアソン分布に従う(正規分布近似できる)

    検定統計量を導出

    検定統計量の出発点は、\(u_0\)=\(\frac{λ-λ_0}{\sqrt{\frac{λ_0}{n}}}\)
    です。

    分散は加法性を使って
    ●V(A-B)=V(A)+V(B)= \(\frac{λ_A}{n_A}\)+ \(\frac{λ_B}{n_B}\)
    とします。

    この関係式を代入すればポアソン分布の検定統計量が導出できます。

    なので、この式を\(u_0\)=\(\frac{p-p_0}{\sqrt{\frac{p(1-p)}{n}}}\)に代入します
    ●\( p \)→\(p_A\)
    ●\( p_0\)→\(p_B\)
    ●\(σ\)→\(\sqrt{\frac{λ_A}{n_A}+\frac{λ_B}{n_B}}\)
    を代入するので、

    \(u_0\)=\(\frac{\bar{x}-μ_0}{σ}\)
    =\(\frac{p_A-p_B}{\sqrt{\frac{λ_A}{n_A}+\frac{λ_B}{n_B}}}\)
    と導出できます。

    よって、検定統計量は
    ●\(u_0\)=\(\frac{p_A-p_B}{\sqrt{\frac{λ_A}{n_A}+\frac{λ_B}{n_B}}}\)
    となります。

    ポアソン分布の検定統計量が導出できました!

    以上、よく使う検定統計量を導出しました。ちゃんと導出できるので、公式暗記に頼らず自力で導出できるようにしましょう。

    まとめ

    「【初心者必見!】計数値の検定統計量が導出できる」を解説しました。

    • ①計数値の検定統計量のベースとなる式
    • ➁母不適合品率の検定統計量を導出
    • ➂母不適合品率差の検定統計量を導出
    • ➃母不適合品率差の検定統計量の注意点
    • ➄母不適合数の検定統計量を導出
    • ⑥母不適合数差の検定統計量を導出

  • 【初心者必見!】計量値の検定統計量が導出できる

    【初心者必見!】計量値の検定統計量が導出できる

    「計量値の検定統計量の式が多すぎて暗記できない」などと困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    【初心者必見!】計量値の検定統計量が導出できる

    おさえておきたいポイント

    • ①計量値の検定統計量のベースとなる式
    • ➁母平均差の検定統計量を導出1
    • ➂母平均差の検定統計量を導出2
    • ➃母平均差の検定統計量を導出3
    • ➄母平均差の検定統計量を導出4
    • ⑥母平均差の検定統計量を導出5
    [themoneytizer id=”105233-2″]
    検定統計量は自力で導出しよう!
    各ケースでの検定統計量の式の違いも確認しよう!
    何度も見て、解けるようになりましょう!
    検定対象 母分散 統計量分布 検定統計量
    母平均μ 既知\(σ^2\) 標準正規分布 \(u_0\)=\(\frac{\bar{x}-μ_0}{\sqrt{σ^2/n}}\)
    未知 t分布 \(t_0\)=\(\frac{\bar{x}-μ_0}{\sqrt{V/n}}\)
    母平均
    μ1とμ2の差
    既知\(σ^2\) 標準正規分布 \(u_0\)=\(\frac{\bar{x_1}-\bar{x_2}}{\sqrt{\frac{σ_1^2}{n_1}+\frac{σ_2^2}{n_2}}}\)
    未知(\(V_1\)=\(V_2\) t分布 \(t_0\)=\(\frac{\bar{x_1}-\bar{x_2}}{\sqrt{V(\frac{1}{n_1}+\frac{1}{n_2})}}\)
    (\(V\)=\(\frac{S_1+S_2}{n_1+n_2-2}\))
    未知(\(V_1\)≠\(V_2\) t分布 \(t_0\)=\(\frac{\bar{x_1}-\bar{x_2}}{\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}}\)
    対応のある母平均
    μ1とμ2の差
    δ=μ1―μ2
    既知\(σ^2\) 標準正規分布 \(u_0\)=\(\frac{\bar{d}}{\sqrt{σ_d^2/n}}\)
    未知 t分布 \(t_0\)=\(\frac{\bar{d}}{\sqrt{V_d/n}}\)

    ①計量値の検定統計量のベースとなる式

    母平均\(μ\)で母分散が既知(\(σ^2\))の場合

    標準正規分布に従うので、検定統計量は

    \(u_0\)=\(\frac{\bar{x}-μ_0}{\sqrt{σ^2/n}}\)

    となります。この式くらいは暗記してもOKです。

    母平均\(μ\)で母分散が未知の場合

    t分布に従うので、検定統計量は

    \(t_0\)=\(\frac{\bar{x}-μ_0}{\sqrt{V/n}}\)

    となります。この式くらいは暗記してもOKです。

    母分散の既知、未知の違いで
    従う分布関数や、検定統計量の式が若干、形が変わります。

    この2つ式をベースに変形していきます。

    ➁母平均差の検定統計量を導出1

    前提条件

    前提条件は、

    1. 母平均差
    2. 母分散が既知でそれぞれ\(σ_1^2\),\(σ_2^2\)

    検定統計量を導出

    検定統計量の出発点は、\(u_0\)=\(\frac{\bar{x}-μ_0}{\sqrt{σ^2/n}}\)
    です。

    2つの母集団 N1(\(μ_1\),\(σ_1^2\)), N2(\(μ_2\),\(σ_2^2\))からそれぞれn1個、n2個データを取り出し、その標本集団をそれぞれN1’, N2’とします。

    平均と分散はN1’ (\(μ_1\),\(σ_1^2/n_1\)), N2’ (\(μ_2\),\(σ_2^2/n_2\))となります。

    あるN1’の点\(\bar{X_1}\)と、あるN2’の点\(\bar{X_2}\)との差を検定します。その分布N1’- N2’を考えると、

    ●平均(期待値)は、\(μ_1\)-\(μ_2\) とそのまま差として、
    ●分散は、\(σ_1^2/n_1\)+\(σ_2^2/n_2\)と分散の加法性を使います。

    よって、検定統計量は
    ●\(u_0\)=\(\frac{(\bar{x_1}-μ_1)-(\bar{x_2}-μ_2)}{\sqrt{\frac{σ_1^2}{n_1}+\frac{σ_2^2}{n_2}}}\)
    =\(\frac{(\bar{x_1}-\bar{x_2})-(μ_1-μ_2)}{\sqrt{\frac{σ_1^2}{n_1}+\frac{σ_2^2}{n_2}}}\)
    となります。

    ただし! \(μ_1-μ_2\)=0とする例もある

    母平均差を検定する思いは、母平均差が無いも考えるので、よく
    \(μ_1-μ_2\)=0として、
    ●\(u_0\)=\(\frac{\bar{x_1}-\bar{x_2}}{\sqrt{\frac{σ_1^2}{n_1}+\frac{σ_2^2}{n_2}}}\)
    をよく使います。

    検定統計量は
    ●\(u_0\)=\(\frac{\bar{x_1}-\bar{x_2}}{\sqrt{\frac{σ_1^2}{n_1}+\frac{σ_2^2}{n_2}}}\)
    ただし、 \(μ_1-μ_2\)=0として、
    ●\(u_0\)=\(\frac{\bar{x_1}-\bar{x_2}}{\sqrt{\frac{σ_1^2}{n_1}+\frac{σ_2^2}{n_2}}}\)

    ➂母平均差の検定統計量を導出2

    前提条件

    前提条件は、

    1. 母平均差
    2. 母分散が未知だが、分散は共通のV

    検定統計量を導出

    検定統計量の出発点は、\(t_0\)=\(\frac{\bar{x}-μ_0}{\sqrt{V/n}}\)
    です。

    2つの母集団 N1(\(μ_1\),\(V\)), N2(\(μ_2\),\(V\))からそれぞれn1個、n2個データを取り出し、その標本集団をそれぞれN1’, N2’とします。

    平均と分散はN1’ (\(μ_1\),\(V/n_1\)), N2’ (\(μ_2\),\(V/n_2\))となります。

    あるN1’の点\(\bar{X_1}\)と、あるN2’の点\(\bar{X_2}\)との差を検定します。その分布N1’- N2’を考えると、

    ●平均(期待値)は、\(μ_1\)-\(μ_2\) とそのまま差として、
    ●分散は、\(V/n_1\)+\(V/n_2\)=\(V(1/n_1+1/n_2)\)と分散の加法性を使います。

    よって、検定統計量は
    ●\(t_0\)=\(\frac{(\bar{x_1}-μ_1)-(\bar{x_2}-μ_2)}{\sqrt{V(\frac{1}{n_1}+\frac{1}{n_2})}}\)
    =\(\frac{(\bar{x_1}-\bar{x_2})-(μ_1-μ_2)}{\sqrt{ V(\frac{1}{n_1}+\frac{1}{n_2})}}\)
    となります。

    一方、分散\(V\)は、全平方和を全自由度で割ればいいので。
    ●\(V\)=\(\frac{S_1+S_2}{(n_1-1)+(n_2-1)}\)= \(\frac{S_1+S_2}{n_1+n_2-2}\)
    となります。

    ただし! \(μ_1-μ_2\)=0とする例もある

    母平均差を検定する思いは、母平均差が無いも考えるので、よく
    \(μ_1-μ_2\)=0として、
    ●\(t_0\)=\(\frac{\bar{x_1}-\bar{x_2}}{\sqrt{ V(\frac{1}{n_1}+\frac{1}{n_2})}}\)
    をよく使います。

    検定統計量は
    ●\(t_0\)=\(\frac{(\bar{x_1}-\bar{x_2})-(μ_1-μ_2)}{\sqrt{ V(\frac{1}{n_1}+\frac{1}{n_2})}}\)
    ただし、 \(μ_1-μ_2\)=0として、
    ●\(t_0\)=\(\frac{\bar{x_1}-\bar{x_2}}{\sqrt{ V(\frac{1}{n_1}+\frac{1}{n_2})}}\)
    (●\(V\)=\(\frac{S_1+S_2}{(n_1-1)+(n_2-1)}\)= \(\frac{S_1+S_2}{n_1+n_2-2}\))

    ➃母平均差の検定統計量を導出3

    前提条件

    前提条件は、

    1. 母平均差
    2. 母分散が未知だが、分散\(V_1\)≠\(V_2\)

    検定統計量を導出

    検定統計量の出発点は、\(t_0\)=\(\frac{\bar{x}-μ_0}{\sqrt{V/n}}\)
    です。

    2つの母集団 N1(\(μ_1\),\(V_1\)), N2(\(μ_2\),\(V_2\))からそれぞれn1個、n2個データを取り出し、その標本集団をそれぞれN1’, N2’とします。

    平均と分散はN1’ (\(μ_1\),\(V_1/n_1\)), N2’ (\(μ_2\),\(V_2/n_2\)となります。

    あるN1’の点\(\bar{X_1}\)と、あるN2’の点\(\bar{X_2}\)との差を検定します。その分布N1’- N2’を考えると、

    ●平均(期待値)は、\(μ_1\)-\(μ_2\) とそのまま差として、
    ●分散は、\(V_1/n_1\)+\(V_2/n_2\)と分散の加法性を使います。

    よって、検定統計量は
    ●\(t_0\)=\(\frac{(\bar{x_1}-μ_1)-(\bar{x_2}-μ_2)}{\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}}\)
    =\(\frac{(\bar{x_1}-\bar{x_2})-(μ_1-μ_2)}{\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}}\)
    となります。

    ただし! \(μ_1-μ_2\)=0とする例もある

    母平均差を検定する思いは、母平均差が無いも考えるので、よく
    \(μ_1-μ_2\)=0として、
    ●\(t_0\)=\(\frac{\bar{x_1}-\bar{x_2}}{\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}}\)
    をよく使います。

    検定統計量は
    ●\(t_0\)=\(\frac{(\bar{x_1}-\bar{x_2})-(μ_1-μ_2)} {\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}}\)
    ただし、 \(μ_1-μ_2\)=0として、
    ●\(t_0\)=\(\frac{\bar{x_1}-\bar{x_2}}{\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}}\)

    ➄母平均差の検定統計量を導出4

    「対応のある」とは何か?

    「対応のあるとない」の違いは何でしょうか?
    下図にイメージを示します。

    対応のある

    ●対応のない場合は、全く別の分布を2つ用意した場合
    ●対応のある場合は、異なる2つの分布とはいえ、個々のデータは関係性を持つ場合
    と分けた方が考えやすいですね。

    対応のある場合は、まとめて1つの分布として計算してもよいとして扱います。

    対応のある場合の扱い方

    2つの母集団 N1, N2からそれぞれn個データを取り出し、それぞれ対応する組み合わせデータ値の差分をとった集団N1’を作ります。

    前提条件

    前提条件は、

    1. 母平均差\(δ\)
    2. 母分散が既知で\(σ_d^2\)

    検定統計量を導出

    検定統計量の出発点は、\(u_0\)=\(\frac{\bar{x}-μ_0}{\sqrt{σ^2/n}}\)
    です。

    差をdとしているので、
    平均は\(\bar{d}\)
    分散はN1’ のデータから別途求めます。今回は\(σ_d^2\)となります。

    よって、検定統計量は
    ●\(u_d\)=\(\frac{(\bar{d}-d_0)}{\sqrt{σ_d^2/n}}\)
    となります。

    ただし! \( d_0\)=0とする例もある

    母平均差を検定する思いは、母平均差が無いも考えるので、よく
    \( d_0\)=0として、
    ●\(u_d\)=\(\frac{\bar{d}}{\sqrt{σ_d^2/n}}\)
    をよく使います。

    検定統計量は
    ●\(u_d\)=\(\frac{(\bar{d}-d_0)}{\sqrt{σ_d^2/n}}\)
    ただし、 \( d_0\)=0として、
    ●\(u_d\)=\(\frac{\bar{d}}{\sqrt{σ_d^2/n}}\)

    ⑥母平均差の検定統計量を導出5

    前提条件

    前提条件は、

    1. 母平均差\(δ\)
    2. 母分散が未知で\(V_d\)

    検定統計量を導出

    検定統計量の出発点は、\(t_0\)=\(\frac{\bar{x}-μ_0}{\sqrt{V/n}}\)
    です。

    差をdとしているので、
    平均は\(\bar{d}\)
    分散はN1’ のデータから別途求めます。今回は\(V_d\)となります。

    よって、検定統計量は
    ●\(t_d\)=\(\frac{\bar{d}-d_0}{\sqrt{V_d/n}}\)
    となります。

    ただし! \( d_0\)=0とする例もある

    母平均差を検定する思いは、母平均差が無いも考えるので、よく
    \( d_0\)=0として、
    ●\(t_d\)=\(\frac{\bar{d}}{\sqrt{V_d/n}}\)
    をよく使います。

    検定統計量は
    ●\(t_d\)=\(\frac{\bar{d}-d_0}{\sqrt{V_d/n}}\)
    ただし、 \( d_0\)=0として、
    ●\(t_d\)=\(\frac{\bar{d}}{\sqrt{V_d/n}}\)

    以上、よく使う検定統計量を導出しました。ちゃんと導出できるので、公式暗記に頼らず自力で導出できるようにしましょう。

    まとめ

    「【初心者必見!】計量値の検定統計量が導出できる」を解説しました。

    • ①計量値の検定統計量のベースとなる式
    • ➁母平均差の検定統計量を導出1
    • ➂母平均差の検定統計量を導出2
    • ➃母平均差の検定統計量を導出3
    • ➄母平均差の検定統計量を導出4
    • ⑥母平均差の検定統計量を導出5

  • 【QC検定®合格】「確率変数と確率分布」問題集を販売します

    【QC検定®合格】「確率変数と確率分布」問題集を販売します

    「QC検定®1級、2級合格したいけど、確率変数や確率分布わからない!、解けない!」、など、困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    【QC検定®合格】「確率変数と確率分布」問題集を販売します

    記事の信頼性

    記事を書いている私は、QC検定®1級合格した後、さらにQCをすべて研究して究めました。
    究めた結果、確率変数と確率分布がわかりましたので、問題集にしました!

    ●商標使用について、
    ①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
    ➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
    ➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

    ①確率変数と確率分布で困っていませんか?

    範囲が広い確率変数と確率分布

    次の内容で苦手意識があるかどうかをチェックしましょう!

    1. 期待値・分散の公式が使いこなせない!
    2. 公式暗記しても何を解いているかがわからない!
    3. 期待値・分散が数列や積分で計算する意味がわからない!
    4. 分散の加法性が苦手だ!
    5. 共分散が出たらお手上げだ!
    6. 正規分布の使い方がわからない!
    7. 二項分布、ポアソン分布が苦手!
    8. χ2乗分布、t分布、F分布が理解できない!
    9. どの問題をおさえたらよいかがわからない!

    いかがでしょうか? 多くの方が苦手となるポイントばかりですね。

    確率変数と確率分布の勉強方法

    本問題集の基本構成にもなっている、勉強方法ですが、
    QCプラネッツは以下の流れで習得すればOKと考えています。

    1. 期待値、分散の計算方法は数列と積分であること
    2. 確率の領域であるが、数列・積分を身近なものとして理解すること
    3. 期待値、分散の定義をおさえて、公式を自力で導出する練習をすること
    4. 分散の加法性をマスターすること(QC検定®2級レベル)
    5. 共分散に慣れること(QC検定®1級レベル)
    6. 正規分布、二項分布、ポアソン分布の式を実際にいじって式を解いて慣れること
    7. 高校数学の復習にも力をいれること
    8. χ2乗分布、t分布、F分布の式は、式の成り立ちを数式で理解すること

    上の8か条が自分のものになれば、しっかり解ける力も身に付きますし、
    指導するレベルにもなります。

    高校数学を駆使すれば、ほぼ全領域は解けます。
    (χ2乗分布、t分布、F分布の式の導出は除く)

    ご好評いただいている、数学の問題集も、高校数学を駆使すれば、ほぼ全領域は解けるように設計しております。

    【QC検定®1級,2級合格!】QCに必要な数学問題集を発売します!
    QC検定®1級、2級、統計検定2級以上の数学スキルを磨くのに苦戦していませんか? QCや統計の勉強で理解が進まないのは、ベースとなる数学スキルが弱いからです。本記事では、広大すぎる統計学、微分積分からQC・統計に勝てるための60題に厳選した問題集を紹介します。是非ご購入いただき、勉強してスキルを高めましょう。

    今回の、「確率変数と確率分布」の問題集は、
    QC検定®2級、QC検定®1級向けの
    問題を50題にまとめました。

    50題も解けば十分ですよ!

    ➁問題集のメリット

    本問題集を学ぶメリット

    1. 数列と積分を駆使して、確率変数と確率分布が計算できること
    2. 期待値、分散の定義から自力で公式が導出できること
    3. 分散の加法性、共分散をマスターして、QC検定®2級レベル、QC検定®1級レベルになること
    4. 正規分布、二項分布、ポアソン分布が身近なものになること
    5. χ2乗分布、t分布、F分布の式は、式の成り立ちを数式で理解できること

    逆にデメリットは

    1. 勉強しないと習得できない
      ⇒それはしゃーない!ですよね(笑)

    是非、ご購入いただきたいです。
    次に、全問題の内容を紹介します!

    ➂内容の範囲

    QCの「確率変数と確率分布」問題集の全問題を紹介!

    50題の問題内容と単元を紹介します!

    苦手な問題があれば、勉強して強化しましょう!
    どこが苦手かをチェックしながら各問を見ましょう。
    内容
    1 1 平方和、期待値、
    分散の性質
    平方和の公式
    2 期待値の公式1
    3 期待値の公式2
    4 分散の公式1
    5 分散の公式2
    6 共分散の公式
    7 2 確率変数の
    期待値・分散
    確率変数の期待値と分散1
    8 確率変数の期待値と分散2
    9 確率変数の期待値と分散3
    10 確率変数の期待値と分散4
    11 確率変数の期待値と分散5
    12 確率変数の期待値と分散6
    13 確率変数の期待値と分散7
    14 確率変数の期待値と分散8
    15 確率変数の期待値と分散9
    16 確率変数の期待値と分散10
    17 畳み込み積分
    18 不偏分散の期待値と分散
    19 3 分散の加法性 分散の加法性1
    20 分散の加法性2
    21 分散の加法性3
    22 分散の加法性4
    23 分散の加法性5
    24 分散の加法性6
    25 分散の加法性7
    26 分散の加法性の注意点1
    27 分散の加法性の注意点2
    28 分散の加法性の注意点3
    29 分散の加法性の注意点4
    30 4 正規分布、
    二項分布、
    ポアソン分布
    正規分布の概形
    31 正規分布の近似式
    32 正規分布の定積分
    33 二項分布の導出1
    34 二項分布の導出2
    35 二項分布の期待値と分散
    36 二項分布と正規分布
    37 ポアソン分布の導出
    38 ポアソン分布の分布関数
    39 ポアソン分布の期待値と分散
    40 二項分布からポアソン分布
    41 正規分布、二項分布、ポアソン分布の比較
    42 5 正規分布、
    χ2乗分布、
    t分布、
    F分布
    χ2乗分布の導出
    43 t分布の導出
    44 F分布の導出
    45 正規分布、χ2乗分布、t分布、F分布
    46 6 2変数の
    確率分布
    同時確率分布(離散系)の期待値と分散
    47 同時確率分布(連続系)の期待値と分散
    48 条件付き確率
    49 条件つき期待値・条件付き分散(離散系)
    50 条件つき期待値・条件付き分散(連続系)
    51 全分散の公式の導出

    6つの章に分けてしっかり解いていきましょう。

    • 第1章 平方和、期待値、分散の性質
    • 第2章 確率変数の期待値・分散
    • 第3章 分散の加法性
    • 第4章 正規分布、二項分布、ポアソン分布
    • 第5章 正規分布、χ2乗分布、t分布、F分布
    • 第6章 2変数の確率分布

    解説も充実!

    丁寧な解説ページやQCプラネッツのブログ記事を活用してわかりやすく解けますので、ご安心ください。

    1. 数列と積分を駆使して、確率変数と確率分布が計算できること
    2. 期待値、分散の定義から自力で公式が導出できること
    3. 分散の加法性、共分散をマスターして、QC検定®2級レベル、QC検定®1級レベルになること
    4. 正規分布、二項分布、ポアソン分布が身近なものになること
    5. χ2乗分布、t分布、F分布の式は、式の成り立ちを数式で理解できること

    是非、ご購入ください。

    ➃【問題集ご購入方法】

    メルカリとnoteから販売しております。
    「QCプラネッツ」で検索ください。

    メルカリでの販売

    「QCプラネッツ」で検索ください。

    qc1_test

    1500円/1冊
    とさせていただきます。ご購入よろしくお願いいたします。

    noteでの販売

    電子販売もしています。こちらへアクセスください。

    【QC検定®1級,2級合格!】QCに必要な「確率変数と確率分布」問題集を発売します!

    まとめ

    「【QC検定®合格】「確率変数と確率分布」問題集を販売します」、ご購入よろしくお願いいたします。。

  • 【初心者必見!】分散の加法性を使った問題が解ける

    【初心者必見!】分散の加法性を使った問題が解ける

    本記事のテーマ

    【初心者必見!】分散の加法性を使った問題が解ける
    • ①分散の加法性でおさえるべきポイント
    • ➁分散の加法性の演習問題
    QC検定®2級、1級で必ず出題される
    分散の加法性の解き方を伝授!
    何度も見て、解けるようになりましょう!
    ●商標使用について、
    ①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
    ➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
    ➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

    ①分散の加法性でおさえるべきポイント

    分散の加法性は展開できること

    まず、

    V(X+Y)=V(X)+2Cov(X,Y)+V(Y)
    は自力で導出できますか?
    QC検定®2級なら、 V(X+Y)=V(X)+V(Y)
    QC検定®1級なら、V(X+Y)=V(X)+2Cov(X,Y)+V(Y)
    と区別して暗記してませんか?
    ちゃんと自力で導出しようぜ!

    簡単なので、導出しましょう。自分で意味を理解することが大事です。

    自力で導出

    \(V(X+Y)\)=\(E((X_i-\bar{X})+(Y_i-\bar{Y}))^2\)は、分散の定義どおりですね。これを展開すると
    \(E((X_i-\bar{X})+(Y_i-\bar{Y}))^2\)=\(E((X_i-\bar{X})^2\)+2\(E((X_i-\bar{X})(Y_i-\bar{Y}))\)+\(E((Y_i-\bar{Y}))^2\)
    =V(X)+2Cov(X,Y)+V(Y)

    ここで、
    ●V(X)= \(E((X_i-\bar{X})^2\)
    ●Cov(X,Y)= \(E((X_i-\bar{X})(Y_i-\bar{Y}))\)
    ●V(Y)= \(E((Y_i-\bar{Y}))^2\)

    ちゃんと練習しておきましょう。

    X,Yが独立なら、Covは無視(QC検定®2級レベル)

    QC検定®2級では、よく、 

    変数X,Yは独立

    と書いていますが、これは、「共分散Covは考えなくていいというサイン」です。

    大事なポイント

    変数XにYを増減する場合の期待値と分散の±の動きに注目です。

    ●期待値E(X±Y)=E(X)±E(Y)
    ●分散V(X±Y)=V(X)+V(Y)

    と、

    分散は変数の増減に関係なく
    ●分散V(X±Y)=V(X)+V(Y)
    と増えます。

    理由はわかりますか? 理由が分かる方が、正しく計算できるより大事です。

    分散は2乗するので
    ±の2乗はすべて+になる!

    ですね。

    公式や問題を丸暗記せず、
    その理由をしっかり理解しましょう!

    自力で導出できれば公式暗記は不要になりますよね!

    X,Yに相関性あれば、Covも使う(QC検定®1級レベル)

    QC検定®1級レベルになると、共分散が出て来ますね。
    V(X+Y)=V(X)+2Cov(X,Y)+V(Y)
    は理解できたとしても、1つ疑問が出ます。

    共分散Cov(X,Y)はどこから値を求めるの?

    ですね。

    これはほとんどの場合、相関係数ρからCovを計算する流れになります。

    \(ρ(X,Y)\)=\(\frac{Cov(X,Y)}{V(X)V(Y)}\)
    から計算します。

    相関係数ρを問題文に与えれば、V(X),V(Y)がわかれば共分散は計算できますね。

    \(ρ(X,Y)\)=\(\frac{Cov(X,Y)}{V(X)V(Y)}\)
    ですが、自力で導出できますか?
    是非やってみてください。

    ➁分散の加法性の演習問題

    問題

    では①で解説したポイントを踏まえて問題を解きましょう。

    【問題】
    部品A(厚みxが母平均20.0mm,母標準偏差0.40mmの正規分布に従う)と部品B(厚みyが母平均30.0mm,母標準偏差0.60mmの正規分布に従う)がある。1個の部品Aを2個の部品Bで挟んで接着して作成させる組合せ部品Cを作る。部品Cは厚みにおいて、下限規格値78.0mm,上限規格値82.0mmの規定がある。
    (1) 部品Cの厚さの母平均と母標準偏差を求めよ。
    (2) 部品Cの厚みの母不適合品率を求めよ。
    (3) 部品Bを2つ選ぶときに、一方の部品Bの厚さが厚いときに、他方の部品Bの厚さは薄いものを選ぶようにする。2つの部品Bのそれぞれの厚みには負の相関(-0.2)があるようにする。
     ①2つの部品Bのそれぞれの厚みの共分散を求めよ。
     ②部品Cの厚みの母平均と母標準偏差を求めよ。

    (1)(2)は共分散Covの無い場合、(3)は共分散Covを考える場合ですね。

    解説

    問(1)
    ●母平均:80.0(=20.0+30.0×2)
    ●母標準偏差:0.934(=√(〖0.4〗^2+〖0.6〗^2+〖0.6〗^2 ))
    これは分散の加法性の基本ですね。

    問(2)
    答え:0.0332
    ●上限:u=(82-80)/0.934=2.14 Kp=2.14の時の確率P=0.0162
    ●下限:u=(80-78)/0.934=2.14 Kp=2.14の時の確率P=0.0162
    より、 0.0162×2=0.0332
    ここまではQC検定®2級レベルですね。

    問3①
    ●Cov(y1,y2)=ρ(y1,y2)×√(V_y1 V_y2 )=-0.2×0.36=-0.072
    公式どおり代入しましょう。

    問3➁
    ●母平均:80.0
    ●母標準偏差:0.858

    V(y1+y2)=V(y1)+V(y2)+2Cov(y1,y2)=0.62+0.62+2・1・1・(-0.072)=0.576
    V(z+y1+y2)=0.16+0.576=0.736 s=√V(z+y1+y2)=0.858
    共分散も考慮した計算結果になっていますね。

    問3➂
    答え:0.0198
    u=(82-80)/0.858=2.33 Kp=2.33の確率P=0.0099 0.0099×2=0.198
    となります。

    いかがでしょうか。分散の加法性の解き方を解説しました! 苦手な所があれば何度も読み返してマスターしましょう!QCの初心者を悩ます内容ですが、この計算をモノにしましょう!

    いろいろな問題が出ますが、エッセンスは本記事の内容です。ここを抑えれば大丈夫!

    まとめ

    「【初心者必見!】分散の加法性を使った問題が解ける」を解説しました。

    • ①分散の加法性でおさえるべきポイント
    • ➁分散の加法性の演習問題
  • 【初心者必見!】正規分布、二項分布、ポアソン分布が比較できる

    【初心者必見!】正規分布、二項分布、ポアソン分布が比較できる

    本記事のテーマ

    【初心者必見!】正規分布、二項分布、ポアソン分布が比較できる
    • ①3つの分布の分布関数、期待値、分散
    • ➁正規分布、二項分布、ポアソン分布を比較
    ●正規分布:\(\frac{1}{\sqrt{2π}σ} e^{-\frac{(x-μ)^2}{2σ^2}}\)
    ●二項分布:\({}_n C_r p^r (1-p)^{n-r}\)
    ●ポアソン分布:\(e^{-λ} \frac{λ^x}{x!}\)
    って式が全く別物だけど
    ぴったりそろうんだよね!

    正規分布、二項分布、ポアソン分布のグラフがぴったりそろえてみましょう。

    ①3つの分布の分布関数、期待値、分散

    さて、正規分布、二項分布、ポアソン分布の
    確率密度関数、期待値、分散は答えられますか?

    導出もよいですが、初心者は暗記から入ってもOKです。

    二項分布、ポアソン分布の期待値と分散は関連記事で丁寧に導出しています。ご覧ください。

    【初心者必見!】二項分布の期待値と分散が解ける(高校数学で解ける!)
    二項定理の式変形をしっかり演習し、二項分布の期待値、分散を2通りの方法で導出解説!初心者は必読です。

    【初心者必見!】ポアソン分布の期待値と分散が解ける(高校数学で解ける!)
    本記事では、慣れにくいポアソン分布の式変形をしっかり演習しつつ、ポアソン分布の期待値、分散を導出解説!

    下表に結果をまとめます。さっと書き出せるかを確認してください。

    分布 確率密度関数 期待値E 分散V
    正規分布 \(f(x)\)=\(\frac{1}{\sqrt{2π}σ} ・exp(-\frac{(x-μ)^2}{2σ^2})\) \(μ\) \(σ^2\)
    二項分布 \(f(x)\)=\({}_n C_x p^x・(1-p)^{n-r}\) \(np\) \(np(1-p)\)
    ポアソン分布 \(f(x)\)=\(e^{-λ}・\frac{λ^x}{x!}\) \(λ\) \(λ\)

    ➁正規分布、二項分布、ポアソン分布を比較

    パラメータをそろえる

    ここで、正規分布、二項分布、ポアソン分布の期待値、分散のパラメータをそろえます。つまり、

    分布 期待値E 分散V
    正規分布 \(μ\) \(np\) \(σ^2\) \(np(1-p)\)
    二項分布 \(np\) \(np\) \(np(1-p)\) \(np(1-p)\)
    ポアソン分布 \(λ\) \(np\) \(λ\) \(np\)

    とパラメータをそろえます。

    正規分布、二項分布、ポアソン分布を比較

    ここで、(n,p)=(100,0.2)と(n,p)=(1000,0.02)を代入して、3つの分布関数のグラフを描いて比較しましょう。

    正規分布

    正規分布

    2つの場合とも、ほぼ3つの分布関数が重なりましたね。n=100の方は数が少ないこともあり、ポアソン分布だけ少しずれますが、n=1000まで増やすとほぼぴったりそろいます。

    標本数が大きい場合は
    正規分布で考えればOKといえますね。

    学問的には、正規分布、二項分布、ポアソン分布は別物ですが、
    実務上は同じとして扱ってもよいでしょう。

    まとめ

    「【初心者必見!】正規分布、二項分布、ポアソン分布が比較できる」を解説しました。

    • ①3つの分布の分布関数、期待値、分散
    • ➁正規分布、二項分布、ポアソン分布を比較
  • 【初心者必見!】正規分布の概形、近似式、定積分が解ける!(高校数学で解ける!)

    【初心者必見!】正規分布の概形、近似式、定積分が解ける!(高校数学で解ける!)

    本記事のテーマ

    【初心者必見!】正規分布の概形、近似式、定積分が解ける!(高校数学で解ける!)
    • ①正規分布の概形を描いてみよう!(高3レベル)
    • ➁正規分布に近いグラフを描いてみよう!(高3レベル)
    • ➂正規分布の積分の近似値を解いてみよう!(高2レベル)
    正規分布は絶対勉強しないといけないけど、
    式が難しいし、
    正規分布表が何であるのかわからない
    など、最初悩みますよね!
    正規分布に慣れるには、
    高校数学の微分積分を使って
    実際にグラフを描いて、面積を求めてみましょう!
    \(e^{-\frac{x^2}{2}}\)の式に
    圧倒される必要はありません。
    自分の解けるテリトリーに持って行きましょう。

    正規分布に慣れる良問を持ってきましたので、一緒に解きながら慣れていきましょう!

    ①正規分布の概形を描いてみよう!(高3レベル)

    例題

    正規分布の分布関数\(f(x)\)=\(e^{-\frac{x^2}{2}}\)のグラフを描く。
    (1) 極値と変曲点の座標を求めよ。
    (2) \(y=f(x)\)を描け

     理系の高校数学の定期試験問題レベルです。ここは、しっかり解けるようにしましょう。

    問(1)の回答

    微分します。
    ●\(f’(x)\)=\(-x e^{-\frac{x^2}{2}}\)
    ●\(f’’(x)\)=\((-1+x^2 e^{-\frac{x^2}{2}})\)

    ここで、極値と変曲点を考えます。
    ●\(f’(x)\)=0のときは、\(x\)=0 で、
    ●\(f’’(x)\)=0のときは、\(x\)=±1 なので、
    増減表ができますね。

    正規分布

    増減表をもとに、概形を描くと下図になります。

    正規分布

    高校数学では、あまり\(e^{-\frac{x^2}{2}}\)の式が出ませんが、特に気にせず、普通に微分積分すれば解けます!

    ➁正規分布に近いグラフを描いてみよう!(高3レベル)

    正規分布の式になぜ正規分布表があるのか?

    統計学やQCを勉強すると、必ず、正規分布表の読み方などを勉強しますが、
    何で、あんな表があるかわかりますか? この疑問を持つことの方が表の読み方の勉強より大事です!

    正規分布の式
    \(e^{-\frac{x^2}{2}}\)
    は積分できない(不定積分が作れない)
    正規分布の式
    \(e^{-\frac{x^2}{2}}\)
    の積分値は近似値で与えているのが現状
    でも、正規分布の式の定積分
    \( \displaystyle \int_{-∞}^{∞}e^{-\frac{x^2}{2}}dx \)は計算できる!

    不定積分が計算できないのに、なぜか定積分は計算できる
    変な式です。だから、理解が難しい!

    だったら、簡単な近似式を作ってしまおう!

    次の例題に行きましょう。

    例題

    正規分布の分布関数\(f(x)\)=\(e^{-\frac{x^2}{2}}\)をテイラー展開して4次の整式からなる近似式を作って、積分を考えたい。
    (1) \(f(x)\)=\(1-\frac{x^2}{2}+\frac{x^4}{8}\)と近似できることを示せ。
    (2) 正規分布から\( \displaystyle \int_{0}^{1} \frac{1}{\sqrt{2π}} e^{-\frac{x^2}{2}}dx \)を求め、
    手計算から\( \displaystyle \int_{0}^{1}\frac{1}{\sqrt{2π}}(1-\frac{x^2}{2}+\frac{x^4}{8})dx \)の結果と比較せよ。

    問(1)の回答

    テイラー展開は教科書どおりで、\(x=0\)のまわりで、テイラー展開すると
    \(f(x)\)=\(f(0)\)+\(\frac{f^{(1)}(0)}{1!} x^1\)+\(\frac{f^{(2)}(0)}{2!} x^2\)+\(\frac{f^{(3)}(0)}{3!} x^3\)+\(\frac{f^{(4)}(0)}{4!} x^4\)+…

    どんどん微分しましょう。この微分は良い練習です。是非計算しましょう!
    ●\( f^{(1)}(x)\)=\(-x e^{-\frac{x^2}{2}}\)
    ●\( f^{(2)}(x)\)=\((-1+x^2) e^{-\frac{x^2}{2}}\)
    ●\( f^{(3)}(x)\)=\((-x^3+3x) e^{-\frac{x^2}{2}}\)
    ●\( f^{(4)}(x)\)=\((x^4-6x^2+3) e^{-\frac{x^2}{2}}\)

    より、\(x=0\)を代入して、\(f(x)\)の近似式を計算すると、
    ●\( f^{(1)}(0)\)=0
    ●\( f^{(2)}(0)\)=-1
    ●\( f^{(3)}(0)\)=0
    ●\( f^{(4)}(0)\)=3
    となるので、

    \(f(x)\)=1-\(\frac{1}{2} x^2\)+\(\frac{1}{8} x^4\)

    近似式の概形と正規分布の概形を描いてみる

    近似式は4次関数で高2レベルですね。Excelでグラフを描いてみましょう。

    正規分布

    確かに、\(x=0\)付近は2つのグラフは重なっていますね。近似値からでも正規分布の定積分は精度よく求められそうですね。

    ➂正規分布の積分の近似値を解いてみよう!(高2レベル)

    問(2)を再掲

    正規分布の分布関数\(f(x)\)=\(e^{-\frac{x^2}{2}}\)をテイラー展開して4次の整式からなる近似式を作って、積分を考えたい。
    (2) 正規分布から\( \displaystyle \int_{0}^{1}\frac{1}{\sqrt{2π}} e^{-\frac{x^2}{2}}dx \)を求め、
    手計算から\( \displaystyle \int_{0}^{1}\frac{1}{\sqrt{2π}}(1-\frac{x^2}{2}+\frac{x^4}{8})dx \)の結果と比較せよ。

    では、2つの関数の積分を解いてみましょう。

    正規分布表から確認

    正規分布表から値を読みます。正規分布表の読み方は大丈夫でしょうか?一応解説します。

    Kp *=0 *=1 ・・・  *=9
    0.0* 0.5 0.496 ・・・ ・・・
    ・・・ ・・・ ・・・ ・・・ ・・・
    1.0* 0.1587 0.1562 ・・・  ・・・
    1.1* 0.1357 ・・・  ・・・  ・・・
    ・・・ ・・・ ・・・ ・・・ ・・・

    上表のマーカ部でKp=1.00の値「0.1587」を見ますが、
    これは、\( \displaystyle \int_{1}^{∞}\frac{1}{\sqrt{2π}} e^{-\frac{x^2}{2}}dx \)の値なので、
    0.5-0.1587=0.3413が、求めたい積分値\( \displaystyle \int_{0}^{1}\frac{1}{\sqrt{2π}} e^{-\frac{x^2}{2}}dx \)です。

    何を言っているかわからない場合は、正規分布の基礎を復習しましょう。関連記事を紹介します。

    【簡単】正規分布は怖くない!正規分布表や確率計算の求め方がすぐわかる
    「正規分布とは何か?」、「正規分布の難解な式が理解できない」、「正規分布表の意味がわからない」など、よくある困りごとをわかりやすく解説します。

    【初心者必見】正規分布の標準化や応用問題は怖くない!必勝解法を解説します。
    「正規分布の標準化する理由がわからない」、「平均μ、分散\(σ^2\)の一般的な正規分布の確率の計算ができない」など、よくある困りごとをわかりやすく解説します。

    近似式の定積分

    \( \displaystyle \int_{0}^{1}\frac{1}{\sqrt{2π}}(1-\frac{x^2}{2}+\frac{x^4}{8})dx \)を計算します。高2レベルです。

    \( \displaystyle \int_{0}^{1}\frac{1}{\sqrt{2π}}(1-\frac{x^2}{2}+\frac{x^4}{8})dx \)
    =\(\frac{1}{\sqrt{2π}} \frac{103}{120}\)=0.3425
    となります。この計算もやってみてください。

    積分値の比較

    ●正規分布の場合は、0.3413
    ●近似式の場合は、0.3425
    とほぼ一致していますね。差は0.4%!

    グラフ見れば、x=0~1の区間は2つのグラフのyの値はほぼ一致していますね。

    正規分布

    以上、
    ①微分を計算してわかる正規分布の概形
    ➁正規分布の概形近似式の作り方
    ➂定積分の値の比較
    を解説しました! 正規分布にだいぶ慣れたはずです!

    まとめ

    「【初心者必見!】正規分布の概形、近似式、定積分が解ける!(高校数学で解ける!)」を解説しました。

    • ①正規分布の概形を描いてみよう!(高3レベル)
    • ➁正規分布に近いグラフを描いてみよう!(高3レベル)
    • ➂正規分布の積分の近似値を解いてみよう!(高2レベル)
  • 【QC検定®1級,2級合格!】QCに必要なサンプリング問題集を発売します!

    【QC検定®1級,2級合格!】QCに必要なサンプリング問題集を発売します!

    「QC検定®1級、2級合格したいけど、サンプリングが難解すぎてわからない!、解けない!」、など、困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    【QC検定®合格】サンプリング問題集を販売します

    記事の信頼性

    記事を書いている私は、QC検定®1級合格した後、さらにQCをすべて研究して究めました。
    究めた結果、サンプリングがわかりましたので、問題集にしました!

    ●商標使用について、
    ①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
    ➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
    ➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

    ①サンプリング(特に分散)が難しすぎる

    QC検定®2級はサンプリングの種類を当てる問題⇒簡単
    QC検定®1級はサンプリングの標本平均の分散を求める問題⇒激ムズ
    ですよね。

    サンプリング(特に分散)の難しさ

    \(V(\bar{\bar{x}})\)が意味不明だし!
    V(\(\bar{\bar{x}}\))=\(\frac{M-m}{M-1}・\frac{σ_b^2}{m}\)+\(\frac{N-n}{N-1}・\frac{σ_w^2}{mn}\)が覚えられないし!
    代入がうまくできない!
    V(\(\bar{\bar{x}}\))=\(\frac{M-m}{M-1}・\frac{σ_b^2}{m}\)+\(\frac{N-n}{N-1}・\frac{σ_w^2}{mn}\)の導出が激ムズで
    結局公式暗記しかない!
    有限母集団近似って何?
    \(\frac{N-n}{N-1}\)項の導出も激ムズで
    有限母集団近似する・しないの判断も難しい
    問題文から\(V(\bar{\bar{x}})\)の式をどういじって、値を代入すればいいか躊躇する!

    ですよね。

    QC検定®1級のサンプリング問題はほぼ点数がとれず困っている
    だから受験もしたくない。。。

    ですよね。

    効率よく最小限の内容でカバーしたい

    と言っても、

    ●品質管理の仕事をしているから不合格は格好悪い
    ●データサイエンティストを目指すから勉強しないわけにいかない
    ●資格が1つでもほしい

    という、プレッシャーもありますよね。

    だから、

    なるべく少ない問題数で、
    QCや統計の基礎がマスターできる教材はないの?

    と探したくなりますよね!

    ご安心ください。
    QCプラネッツが作りました!

    サンプリングを理解するために必要な3要素

    QCプラネッツはQC検定®1級合格しましたが、
    合格しただけで、何もわかっていない状態でした。

    なので、3年以上研究して、650のブログ記事を書き上げて、
    QCを究めました!

    そして、わかったことがあります。

    サンプリングを理解するために必要な3要素がある

    「3要素」を具体的に書くと、

    1. まず、V⇒Vか、V⇒V/nの区別がつくこと
    2. サンプリングの分散を実データで計算体験をすること
    3. パターン問題と公式代入に慣れること

    の3つがベースです。

    今回の、サンプリング問題集は、
    QC検定®1級向けの
    2段サンプリングの分散公式攻略を
    中心にまとめました。

    数少ないサンプリング問題から20題まで拡張して作り上げた問題集です!

    では、商品を紹介します!

    ➁問題集のメリット

    本問題集を学ぶメリット

    1. 基本である、標本分散と標本平均の分散の違いを理解する
    2. 2段サンプリングの分散公式に慣れる
    3. 難しいけど、有限母集団近似、2段サンプリングの分散公式を導出する

    逆にデメリットは

    1. 勉強しないと習得できない
      ⇒それはしゃーない!ですよね(笑)

    是非、ご購入いただきたいです。
    次に、全問題の内容を紹介します!

    ➂内容の範囲

    QCのサンプリング問題集の全問題を紹介!

    20題の問題内容と単元を紹介します!

    苦手な問題があれば、勉強して強化しましょう!
    どこが苦手かをチェックしながら各問を見ましょう。
    問題 内容
    1 あるデータとその平均値の期待値と分散1
    2 あるデータとその平均値の期待値と分散2
    3 あるデータとその平均値の期待値と分散3
    4 有限集団の分散
    5 検定問題
    6 あるデータとその平均値の期待値と分散4
    7 あるデータとその平均値の期待値と分散5
    8 2段サンプリングの分散公式1
    9 2段サンプリングの分散公式2
    10 2段サンプリングの分散公式3
    11 2段サンプリングの分散公式4
    12 2段サンプリング1
    13 層別(比例)サンプリング
    14 2段サンプリング2
    15 2段サンプリングの費用関数1
    16 2段サンプリングの費用関数2
    17 2段サンプリング3
    18 2段サンプリングの費用計算3
    19 有限母集団の修正項の導出
    20 2段サンプリングの分散公式を導出

    特に、紹介したいのが、

    1. 標本と標本平均のばらつきの違いを理解
    2. 標本平均の分散公式を練習
    3. 2段サンプリングの演習問題

    という20題です。

    解説も充実!

    丁寧な解説ページやQCプラネッツのブログ記事を活用してわかりやすく解けますので、ご安心ください。

    全問解いた結果、結局
    標本分散と標本平均の分散の区別から
    確率変数、検定と推定への理解が増すこと

    サンプリングの問題はクリアーできます!

    是非、ご購入ください。

    ➃【問題集ご購入方法】

    本ブログとnoteから販売しております。
    「QCプラネッツ」で検索ください。

    本ブログでの販売


    [asp_product id=”21555″]

    1500円/1冊
    とさせていただきます。ご購入よろしくお願いいたします。

    問題集の閲覧アクセスのみ可とさせていただきます。(転売防止のため)
    ご購入後、メールにて、アクセス先をご案内させていただきます。

    noteでの販売

    電子販売もしています。こちらへアクセスください。

    【QC検定®1級,2級合格!】QCに必要なサンプリング問題集を発売します!

    まとめ

    「【QC検定®合格】サンプリング問題集を販売します」、ご購入よろしくお願いいたします。。

  • 2段サンプリングの費用関数で最適配分の式が導出できる

    2段サンプリングの費用関数で最適配分の式が導出できる

    「2段サンプリングの費用関数で最適配分の式の求め方がわからない」、と困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    2段サンプリングの費用関数で最適配分の式が導出できる
    • ①2段サンプリングの費用関数
    • ➁最適配分の式を導出

    QC・統計に勝てるためのサンプリング問題集を販売します!

    QC検定®1級、2級でサンプリングの問題で苦戦していませんか?本記事では、QC・統計に勝てるためのサンプリング問題集(20題)を紹介します。

    [themoneytizer id=”105233-2″]
    【2段サンプリングの費用関数】
    \(C=c_0+c_1m+c_2m\bar{n}\)
    としたとき、
    【最適配分の式】
    \(\bar{n}^2\)=\(\frac{c_1}{c_2} \frac{σ_w^2}{σ_b^2}\)
    を使って計算しますが、
    どうやって
    \(\bar{n}^2\)=\(\frac{c_1}{c_2} \frac{σ_w^2}{σ_b^2}\)
    が出て来るの?
    を解説します!

    ①2段サンプリングの費用関数

    費用関数をよく次のように定義します。

    【2段サンプリングの費用関数】
    \(C=c_0+c_1m+c_2m\bar{n}\)
    ●\(c_0\):初期コスト
    ●\(c_1\):1次サンプルの費用
    ●\(m\):1次サンプルの大きさ
    ●\(c_2\):2次サンプルの費用
    ●\(\bar{n}\):2次サンプルの大きさ
    と定義します。

    確かに、1次サンプルしてから、2次サンプルしますから、費用は加算されていくイメージですね。

    ➁最適配分の式を導出

    最適配分

    最適配分の式は、

    【最適配分の式】
    \(\bar{n}^2\)=\(\frac{c_1}{c_2} \frac{σ_w^2}{σ_b^2}\)

    最適配分の式を導出

    上の式をよく使いますが、導出します。

    導出過程は、

    1. 費用関数の式を変形する
    2. 2段サンプリングの標本平均の分散\(σ_{\bar{\bar{x}}}^2\)を定義する
    3. 標本平均の分散を\(\bar{n}\)の変数として偏微分=0の条件を作る

    で解いていきます。

    (i)費用関数の式を変形する

    費用関数
    \(C=c_0+c_1m+c_2m\bar{n}\)
    を\(m\)の式に直します。

    \(m\)=\(\frac{C-c_0}{c_1+c_2 \bar{n}}\)=(式1)

    (ii)標本平均の分散

    2段サンプリングの標本平均の分散を有限集団近似せずに次の式のようにおきます。計算がシンプルになるためです。

    \(σ_{\bar{\bar{x}}}^2\)=\(\frac{σ_b^2}{m}\)+\(\frac{σ_w^2}{n}\)
    とします。なお、\(n\)=\(m\bar{n}\)の関係から
    \(σ_{\bar{\bar{x}}}^2\)=\(\frac{σ_b^2}{m}\)+\(\frac{σ_w^2}{ m\bar{n}}\)=(式2)

    (式2)に(式1)を代入します。
    (式2)
    =\(σ_{\bar{\bar{x}}}^2\)=\(\frac{c_1+c_2 \bar{n}}{C-c_0}\)+\(\frac{c_1+c_2 \bar{n}}{ C-c_0} \frac{1}{\bar{n}} σ_w^2\)
    =\((\frac{c_1}{C-c_0}σ_b^2+\frac{c_2}{C-c_0}σ_w^2)\)+\(\frac{c_2 σ_b^2}{C-c_0} \bar{n}\)+\(\frac{c_1 σ_w^2}{C-c_0} \frac{1}{\bar{n}}\)
    =(式3)

    (iii)偏微分=0の条件

    (式3)において、偏微分\(\displaystyle \frac{\partial σ_{\bar{\bar{x}}}^2}{\partial \bar{n}} \)=0を解きます。

    \(\displaystyle \frac{\partial σ_{\bar{\bar{x}}}^2}{\partial \bar{n}} \)=\(\frac{c_2 σ_b^2}{C-c_0}-\frac{c_1 σ_w^2}{C-c_0} \frac{1}{\bar{n}^2}\)=0

    整理すると、
    \(c_2 σ_b^2\)=\(\frac{c_1 σ_w^2}{\bar{n}^2}\)
    となり、
    \(\bar{n}^2\)=\(\frac{c_1}{c_2} \frac{σ_w^2}{σ_b^2}\)
    より、最適配分の条件式が導出できました。

    公式暗記より導出を理解して、自力でできるようにしましょう!

    まとめ

    「2段サンプリングの費用関数で最適配分の式が導出できる」をわかりやすく解説しました。

    • ①2段サンプリングの費用関数
    • ➁最適配分の式を導出

  • 【必読】「標本の分散」と「標本平均の分散」の違いがわかる

    【必読】「標本の分散」と「標本平均の分散」の違いがわかる

    「サンプリングするとなんで分散VがV/nになるのかがわからない」、と困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    【必読】「標本の分散」と「標本平均の分散」の違いがわかる
    • ①サンプリングするとなぜV/nなのか?
    • ➁標本の分散と標本平均の分散の違いを理解する
    • ➂標本平均の分散を実際に計算する
    • ➃ばらつきを減らすにはサンプル数を増やせばいいの?

    QC・統計に勝てるためのサンプリング問題集を販売します!

    QC検定®1級、2級でサンプリングの問題で苦戦していませんか?本記事では、QC・統計に勝てるためのサンプリング問題集(20題)を紹介します。

    [themoneytizer id=”105233-2″]
    統計学、QC検定®を勉強すると必ず出て来るV/n
    nが大きくなると分散0になるけどいいの?
    有限なサンプル数で分散求めると母集団の分散からちょっとはずれるのはわかりけど、何でnで割るの?
    元の母集団と同じデータだから、どうサンプリングしても分散はVのままじゃないの?

    と混乱していませんか?

    QCプラネッツもずっと混乱していましたが、この記事書いてようやく区別できました!
    ●商標使用について、
    ①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
    ➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
    ➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

    関連記事でも記述しましたが、今回はさらにパワーアップさせます!

    【本記事限定】標本平均の分散の注意点(nで割るな!)
    標本平均の分散や検定統計量では分散をサンプル数で割りますね。でも「サンプル数が大きいと分散が低減される」のは不思議だと思いませんか?本記事では、教科書やwebサイトに載っていない、標本平均の分散の注意点をわかりやすく解説します。公式としてサンプル数で割るべきかどうかを確認したい方は必見です。

    ①サンプリングするとなぜV/nなのか?

    設問文章にある何気ない文字が重要!

    サンプリングや、検定と推定の問題文を上げてみましょう。

    ●サンプリング
    12個のロットをランダムに取り出し、各々から1個の製品をランダムにサンプリングして12個のデータより標本平均を求めて特性の母平均を推定する。このとき、標本平均の推定精度(分散)はいくらか。
    ●検定と推定
    ある部品の特性は、母集団が正規分布に従っている。そのうち10個を抜き出して特性を測定した。次の結果が得られた場合,
    a1,a2,…,a10
    母平均がaといえるかを検定せよ。

    どこがキーポイントかわかりますか?

    慣れないと違和感は感じないのですが。

    ここです!

    ●サンプリング
    12個のロットをランダムに取り出し、各々から1個の製品をランダムにサンプリングして12個のデータより標本平均を求めて特性の母平均を推定する。このとき、標本平均の推定精度(分散)はいくらか。
    ●検定と推定
    ある部品の特性は、母集団が正規分布に従っている。そのうち10個を抜き出して特性を測定した。次の結果が得られた場合,
    a1,a2,…,a10
    平均がaといえるかを検定せよ。
    わかりましたね!
    そうです! 「平均」です。

    なので、もし、

    ●サンプリング
    12個のロットをランダムに取り出し、各々から1個の製品をランダムにサンプリングして12個のデータより標本平均を求めて特性の母平均を推定する。このとき、標本平均の推定精度(分散)はいくらか。
    ●検定と推定
    ある部品の特性は、母集団が正規分布に従っている。そのうち10個を抜き出して特性を測定した。次の結果が得られた場合,
    a1,a2,…,a10
    母平均母集団のデータがaといえるかを検定せよ。

    となっていたら、

    母集団の分散と同じです。
    標本の平均だから分散の式が変わるんです!

    V/nは数学的に正しい

    でも、1つ疑問が有ります。

    標本平均の分散V/nの式って実は正しくない?

    でも、

    数学的に正しいです。

    下の例題で確認しましょう。

    【例題】
    よく、母集団からn個抜き取る場合の、分散をVからV/nにするが、その理由を数式で説明せよ。

    実際に解いてみましょう。
    確率変数\(x_1\),\(x_2\),…, \(x_n\)において、それぞれ独立と仮定すると、
    \(V(\bar{x})\)=\(V(\frac{x_1+x_2+…+x_n}{n})\)
    =\(\frac{1}{n^2}(V(x_1)+V(x_2)+…+V(x_n))\)
    =\(\frac{n}{n^2}(V)\)
    =\(\frac{V}{n}\)
    と、数学的に正しいので、どうしてもこの式を避けることができません!

    1つ値に決まる平均にばらつきがあるのはなぜか?

    サンプリングすると母集団のデータよりばらつき(荒)があるから分散は母集団から変わるのは理解できるが、サンプル数nで割るのは納得できない!
    でも、数式は正しい。
    何か、しっくりこない!
    さまざまなデータ値を総和して個数で割った唯一の値である平均に、ばらつきがあるのはなぜか?もわからないし、この分散がV/nってさらに混乱する!

    ですよね!

    1つ値に決まる平均にばらつきがあるのはなぜか?

    この理由は、

    サンプリングする選び方がたくさんあるから、サンプリングの平均がたくさんできる

    例えば、下図のように、元データがあり、そこから無作為で、サンプリングしたデータの束を、番号1,2,…,nとします。平均は番号分n個あるので、

    標本平均の分散

    \(V(\bar{x})\)は\(\bar{x_1}\),\(\bar{x_2}\),…, \(\bar{x_n}\)のデータのばらつきを見ているわけです。

    まとめると

    ●標本分散は元データ\(x_i\)の集団のばらつきで母集団分散と同じ
    ●標本平均分散は\(V(\bar{x})\)は\(\bar{x_1}\),\(\bar{x_2}\),…, \(\bar{x_n}\)のデータのばらつき
    と、全く別物です。

    「平均」という言葉があるかどうかで判断しましょう。
    折角なので、練習してみましょう。

    ➁標本の分散と標本平均の分散の違いを理解する

    演習1

    問1
    ある部品が1000 個ある。その特性は正規分布N(\(μ,σ^2\))その中から、以下の条件で抜取り、その特性を測定した場合、あるデータ期待値EとVがいくらになるかを2人の部下に聞いた。
    部下A:もともと正規分布N(\(μ,σ^2\))に従うデータなので、どう抜き取っても、E=\(μ\)、V=\(σ^2\)である。
    部下B:教科書の公式からいうと、E=\(μ\)、V=\(\frac{σ^2}{n}\)である。
    どちらの言い分が正しいか? 判断せよ。

    意外と混乱しますよね。分散において、何を指しているかが両部下は違っています。
    ●Aさんは、抜き取ったデータ(標本)そのものの期待値と分散を言っている。
    ●Bさんは、抜き取ったデータ(標本)の平均についての期待値と分散を言っている。

    演習2

    検定と推定の問題もやってみましょう。途中のヒントまで解説しますので、解いてみてください。

    問2
    ある部品の特性は、母集団が正規分布N(100,0.2)に従っている。そのうち10個を抜き出して特性を測定した。次の結果が得られた場合、
    99.9、99.7、100.0、99.9、99.8、99.4、100.0、100.2、99.8、100.1 (平均:99.88)
    (1) 母平均が100.0mmといえるかを検定せよ。
    (2) データ値は100.0mmといえるかを検定せよ。
    ただし、抜き取ったロットの標準偏差はσ=0.2mmと母集団と同じとする。

    実は、
    (1) は教科書でもQC検定®でも必ず載っている問題
    (2) はないので、QCプラネッツが作成

    検定統計量\(z\)=\(\frac{\bar{x}-μ}{σ/\sqrt{n}}\)と暗記しますよね。ここに\(σ/\sqrt{n}\)があります。(1)(2)の違いが理解できるかを確認しましょう。

    (2)はQC検定®でも出題してほしいですね。そしたら面白い!

    ➂標本平均の分散を実際に計算する

    サンプリングがいまいち理解できない理由

    サンプリングがいまいち理解できない、難しいとする理由は

    実データがなく、変な公式しかないので、
    「この式でいいのか? 式の意味がよくわからない」
    まま、代入して終わるので、何を解いているかピントこない。

    なので、実際にデータを用意して、サンプリング後の、「標本平均」の分散を計算してみましょう。

    実際に計算しよう!

    よく、母集団から\(n\)個抜き取る場合の、分散を\(V\)から\(\frac{V}{n}\)にするが、正しいのかどうか、実際にデータを使って確認したい。そのため、母集団100個のデータを用意した。母集団から\(n\)個抜き取る場合の分散は、その\(n\)個ずつ抜き取った\(n\)個のデータの平均値\(\bar{x}\)が100/\(n\)パターンあるので、その\(\bar{x}\)に関する期待値E[\(\bar{x}\)]と分散V[\(\bar{x}\)]を計算すればよい。以下、\(n\)に値を代入して、実際の期待値E[\(\bar{x}\)]と分散V[\(\bar{x}\)]を公式の値と比較せよ。
    (1) n=5の場合(No.1~5,No.6~10,…,No.96~100のデータに区切る)
    (2) n=10の場合(No.1~10,No.11~20,…,No.91~100のデータに区切る)
    (3) n=20の場合(No.1~20,No.21~40,…,No.81~100のデータに区切る)
    (4) n=50の場合(No.1~50,No.51~100のデータに区切る)
    No data No data No data No data No data
    1 11 21 68 41 58 61 75 81 87
    2 2 22 4 42 82 62 45 82 82
    3 35 23 34 43 22 63 18 83 18
    4 34 24 24 44 46 64 26 84 71
    5 52 25 30 45 35 65 88 85 13
    6 54 26 13 46 22 66 51 86 34
    7 25 27 63 47 21 67 68 87 55
    8 57 28 29 48 48 68 32 88 55
    9 84 29 12 49 28 69 69 89 33
    10 95 30 20 50 44 70 31 90 83
    11 51 31 89 51 26 71 48 91 22
    12 49 32 69 52 61 72 50 92 65
    13 9 33 55 53 6 73 25 93 83
    14 85 34 30 54 29 74 50 94 29
    15 24 35 15 55 37 75 57 95 27
    16 19 36 41 56 57 76 81 96 75
    17 64 37 98 57 71 77 86 97 97
    18 83 38 44 58 4 78 64 98 77
    19 78 39 18 59 46 79 43 99 10
    20 65 40 1 60 67 80 23 100 17

    解説

    実際に計算してみましょう。

    結果をまとめると

    n 実際 公式V/n
    1 665.62 665.62
    5 115.98 297.67
    10 50.37 210.49
    20 33.33 148.84
    50 10.76 94.13

    グラフにすると、実際に計算したものと公式では値は異なりますが、傾向は同じことがわかり、サンプル数が増えると、標本平均の分散は小さくなることがわかります。

    また、期待値Eはサンプル数に関係なく同じですね。

    分散

    実際に計算した分散と、公式V/nの値にずれがありますが、公式は理想系なデータである場合、つまり、データが無限になる母集団の場合なので、実際のデータを無限に増やして、サンプル数も無限に増やすと両者は一致します。それを実際に示すのはムリですが、今回データ100個で実演しました。

    ➃ばらつきを減らすにはサンプル数を増やせばいいの?

    ばらつきを小さくしたいからサンプル数を増やすわけではない

    これ、よく勘違いしてしまいますが、

    ばらつきを小さくしたいからサンプル数を増やすわけではない!
    標本平均の分散が小さく見えるだけで、標本そのものの分散は生データのばらつきそのもの

    サンプル数をどの程度取ると、標本分散と標本平均の分散に差が出るかがわかる程度で、
    ばらつきを小さくしたいからサンプル数を増やすわけではない点に注意しましょう。

    「標本の分散」と「標本平均の分散」の違いがわかりましたね!

    まとめ

    「【必読】「標本の分散」と「標本平均の分散」の違いがわかる」をわかりやすく解説しました。

    • ①サンプリングするとなぜV/nなのか?
    • ➁標本の分散と標本平均の分散の違いを理解する
    • ➂標本平均の分散を実際に計算する
    • ➃ばらつきを減らすにはサンプル数を増やせばいいの?

  • error: Content is protected !!