カテゴリー: 手法

  • 同時確率分布の分散、共分散の導出がわかる(離散系&連続系)

    同時確率分布の分散、共分散の導出がわかる(離散系&連続系)

    本記事のテーマ

    同時確率分布の分散、共分散の導出がわかる
    • ①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容
    • ➁【何度も復習しよう!】離散型確率分布の場合
    • ➂【何度も復習しよう!】連続型確率分布の場合

    QC・統計に勝てるためのサンプリング問題集を販売します!

    QC検定®1級合格したい方、QCに必要なサンプリングをしっかり学びたい方におススメです。
    QC検定®1級、2級でサンプリングの問題で苦戦していませんか?本記事では、QC・統計に勝てるためのサンプリング問題集(20題)を紹介します。

    ①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容

    2段サンプリングの分散の式

    「2段サンプリングの分散」の式があります。

    E(\(\bar{\bar{x}}\))=μ
    V(\(\bar{\bar{x}}\))=\(\frac{M-m}{M-1}・\frac{σ_b^2}{m}\)+\(\frac{N-n}{N-1}・\frac{σ_w^2}{mn}\)
    ・\(m\):1次サンプルの大きさ
    ・\(n\):2次サンプルの大きさ
    ・\(σ_b^2\):1次単位間の特性xの分散
    ・\(σ_w^2\):1次単位内の特性xの分散
    ・M:1次単位の総数
    ・N:1次単位の大きさ
    ・\(\frac{M-m}{M-1},\frac{N-n}{N-1}\):有限修正項
    となりますよね。

    でも、

    この式は何なの?
    何でこんな難しい式なの?
    覚えられない。。。

    と困ってしまいますよね。QCプラネッツも苦労しました。

    そこで、

    せめて、「2段サンプリングの分散」の式を導出したい!

    という思いで、解説していきます。

    2段サンプリングの分散の式に必要な内容

    まとめると、以下を理解しておく必要があります。

    1. 条件付き確率
    2. 2変数の確率分布関数(同時確率質量関数)
    3. 同時確率分布の分散、共分散の導出
    4. 条件付き確率の期待値・分散
    5. 全分散の公式の導出
    6. 2段サンプリングの分散の公式導出
    2段サンプリングは式が複雑!
    公式暗記・代入だけでは意味不明!
    サンプリングの分散はみんな苦手

    なので、1つ1つ解説します。

    今回は第3弾として「同時確率分布の分散、共分散の導出」を解説します。

    ➁【何度も復習しよう!】離散型確率分布の場合

    ●まず、わかりやすい「離散型」の場合で、数列∑を使った計算を解説します。

    例題

    ●2次元の確率変数(X,Y)が、下表のような分布を持っている。

    X/Y 1 2 3
    1 \(\frac{2}{8}\) \(\frac{1}{8}\) \(\frac{1}{8}\) \(\frac{1}{2}\)
    2 \(\frac{1}{8}\) \(\frac{1}{8}\) \(\frac{2}{8}\) \(\frac{1}{2}\)
    \(\frac{3}{8}\) \(\frac{2}{8}\) \(\frac{3}{8}\) 1

    (1)期待値E[X],E[Y],E[X+Y],E[XY]を求めよ。
    (2)分散V[X],V[Y],共分散COV[X,Y]を求めよ。

    期待値と分散のフルセットを計算してみましょう。

    解法に必要な公式集

    離散系の場合の期待値と分散の解法に慣れるために必要な公式集をまとめます。以下の式を使って、解いていきます。なお、連続系の場合は∑を∫に変えればOKです。

    期待値の公式

    ●E[X]=∑X・Pr(X)
    ●E[Y]=∑X・Pr(Y)
    ●E[X+Y]=∑(X+Y)・Pr(X+Y)
    ●E[XY]=∑XY・Pr(XY)

    分散の公式

    ●V[X]=E[\((X-μ_X)^2\)]
    ●V[Y]=E[\((Y-μ_Y)^2\)]
    ●COV[X,Y]=E[\((X-μ_X)(Y-μ_Y)\)]
    ●Cov[X,Y]= E[XY]- E[X]E[Y]

    解法(期待値)

    (1)期待値E[X],E[Y],E[X+Y],E[XY]を求めよ。

    では、解いていきましょう。

    E[X]の解法

    表から、X=1の確率が1/2、X=2の確率が1/2ですから期待値は、
    E[X]=1×1/2+2×1/2=3/2

    簡単ですね!

    E[Y]の解法

    表から、Y=1の確率が3/8、Y=2の確率が2/8、Y=3の確率が3/8ですから期待値は、
    E[Y]=1×3/8+2×2/8+3×3/8=2

    簡単ですね!

    E[X+Y]の解法

    X+Yの場合について下表を追加しましょう。

    X/Y 1 2 3
    1 X+Y=2 X+Y=3 X+Y=4
    \(\frac{2}{8}\) \(\frac{1}{8}\) \(\frac{1}{8}\)
    2 X+Y=3 X+Y=4 X+Y=5
    \(\frac{1}{8}\) \(\frac{1}{8}\) \(\frac{2}{8}\)

    表から、
    X+Y=2の確率が2/8、
    X+Y=3の確率が2/8、
    X+Y=4の確率が2/8、
    X+Y=5の確率が2/8
    ですから期待値は、
    E[X+Y]=2×2/8+3×2/8+4×2/8+5×2/8=3.5

    表を追加すれば簡単ですね!

    E[XY]の解法

    同様にXYの場合について下表を追加しましょう。

    X/Y 1 2 3
    1 XY=1 XY=2 XY=3
    \(\frac{2}{8}\) \(\frac{1}{8}\) \(\frac{1}{8}\)
    2 XY=2 XY=4 XY=6
    \(\frac{1}{8}\) \(\frac{1}{8}\) \(\frac{2}{8}\)

    表から、
    XY=1の確率が2/8、
    XY=2の確率が2/8、
    XY=3の確率が1/8、
    XY=4の確率が1/8、
    XY=6の確率が2/8
    ですから期待値は、
    E[XY]=1×2/8+2×2/8+3×1/8+4×1/8+6×2/8=25/8

    表を追加すれば簡単ですね!

    期待値をまとめると、
    E[X]=3/2、E[Y]=2、E[X+Y]=3.5、E[XY]=25/8
    となります。

    また、
    E[X+Y]= E[X]+ E[Y] は成り立ちますが、
    E[XY]= E[X] E[Y] は成り立ちません。
    X,Yは互いに独立ではないからですね。

    解法(分散)

    (2)分散V[X],V[Y],共分散COV[X,Y]を求めよ。

    V[X]の解法

    ●ここで、分散V[X]の式をおさえましょう。
    V[X]=E[\((X-μ_X)^2\)]
    ですね。

    次に、Xの平均\(μ_X\)を求めましょう。
    平均\(μ_X\)はX=1,2の平均ですから3/2ですね。

    表から、X=1の確率が1/2、X=2の確率が1/2ですから分散は、

    V[X]=E[\((X-μ_X)^2\)]=E[\((X-1.5)^2\)]
    =\((1-1.5)^2\)×1/2+\((2-1.5)^2\)×1/2
    =1/4

    ちょっと難しいですね。

    V[Y]の解法

    ●ここで、分散V[Y]の式をおさえましょう。
    V[Y]=E[\((Y-μ_Y)^2\)]
    ですね。

    次に、Yの平均\(μ_Y\)を求めましょう。
    平均\(μ_Y\)はY=1,2,3の平均ですから2ですね。

    表から、Y=1の確率が3/8、Y=2の確率が2/8、Y=3の確率が3/8ですから分散は、

    V[Y]=E[\((Y-μ_Y)^2\)]=E[\((Y-2)^2\)]
    =\((1-2)^2\)×3/8+\((2-2)^2\)×2/8+\((3-2)^2\)×3/8
    =3/4

    ちょっと難しいですね。

    共分散COV[X,Y]の解法

    ●ここで、共分散COV[X,Y]の式をおさえましょう。
    COV[X,Y]=E[\((X-μ_X)(Y-μ_Y)\)]
    ですね。

    共分散は、
    COV[X,Y]=E[\((X-μ_X)(Y-μ_Y)\)]= E[\((X-1.5)(Y-2)\)]
    =(1-1.5)(1-2)×2/8+(1-1.5)(2-2)×1/8+(1-1.5)(3-2)×1/8+
    (2-1.5)(1-2)×1/8+(2-1.5)(2-2)×1/8+(2-1.5)(3-2)×2/8
    =1/8

    なお、共分散Cov[X,Y]はもう1つ公式があり、
    Cov[X,Y]= E[XY]- E[X]E[Y]
    1/8=25/8-3/2・3
    が成り立ちます。

    ちょっと難しいですが、解き方は1パターンなので、何度も復習しましょう。

    分散をまとめると、
    V[X]=1/4、V[Y]=3/4、Cov[X,Y]=1/8
    となります。

    ➂【何度も復習しよう!】連続型確率分布の場合

    ●「連続型」の場合で、積分を使った計算を解説します。

    例題

    2次元の確率変数(X,Y)の同時確率密度関数が
    \(f(x,y)=\frac{1}{4}(x+2y)\) (0 ≤ \(x\) ≤ 2, 0 ≤ \(y\) ≤ 1)
    で表されている。
    (1)X,Yの周辺確率密度関数\(f_X(x)\), \(f_Y(y)\)を求めよ。
    (2)期待値E[X]、E[Y]、E[X+Y]、E[XY]を求めよ。
    (3)分散V[X]、V[Y]、共分散Cov[X,Y]を求めよ。

    本記事は、(2)(3)を解説します。

    解法に必要な公式集

    連続系の場合の期待値と分散の解法に慣れるために必要な公式集をまとめます。以下の式を使って、解いていきます。なお、離散系の場合は∫を∑に変えればOKです。

    期待値の公式

    ●E[X]=\(\int_0^2 xf_X(x)dx\)
    ●E[Y]=\(\int_0^1 yf_Y(y)dy\)

    ●E[X+Y]=E[X]+E[Y]
    または、
    ●E[X+Y]=\(\int_0^2 \int_0^1 (x+y)f(x,y)dydx\)

    ●E[XY]=\(\int_0^2 \int_0^1 xyf(x,y)dydx\)
    (E[XY]とE[X]E[Y]が一致しない場合もあるので注意!)

    分散の公式

    ●E[X2]=\(\int_0^2 x^2 f_X(x)dx\)
    ●E[Y2]=\(\int_0^1 y^2 f_Y(y)dy\)

    ●V[X]=E[X2]-E[X]2
    ●V[Y]=E[Y2]-E[Y]2

    ●Cov[X,Y]= E[XY]- E[X]E[Y]

    解法(期待値)

    (2)期待値E[X]、E[Y]、E[X+Y]、E[XY]を求めよ。

    では、解いていきましょう。

    E[X]の解法

    \(\begin{eqnarray}
    \int_0^2 xf_X(x) dx \\
    &= \frac{1}{4} \int_0^2 x(x+1) dx \\
    &= \frac{1}{4} \left[ \frac{x^3}{3}+\frac{x^2}{2} \right]_0^2 dx\\
    \end{eqnarray}\)
    =\(\frac{7}{6}\)
    となります。

    E[Y]の解法

    \(\begin{eqnarray}
    \int_0^1 yf_Y(y) dy \\
    &= \frac{1}{2} \int_0^1 y(1+2y) dy \\
    &= \frac{1}{2} \left[ \frac{y^2}{2}+\frac{2y^3}{3} \right]_0^1 dy\\
    \end{eqnarray}\)
    =\(\frac{7}{12}\)
    となります。

    E[X+Y]の解法

    E[X+Y]=E[X]+E[Y]=\(\frac{7}{4}\)

    この解法でもいいですが、せっかくなので積分からでも算出しましょう。

    \(\begin{eqnarray}
    \int_0^2 \int_0^1 (x+y)f(x,y)dydx \\
    &= \frac{1}{4} \int_0^2 \int_0^1 (x+y)(x+2y)dydx \\
    \end{eqnarray}\)
    =\(\frac{7}{4}\)
    となります。
    (途中経過は計算してみてください)

    積分の計算の詳細はここをご覧ください。

    E[XY]の解法

    \(\begin{eqnarray}
    \int_0^2 \int_0^1 xyf(x,y)dydx \\
    &= \frac{1}{4} \int_0^2 \int_0^1 xy(x+2y)dydx \\
    \end{eqnarray}\)
    =\(\frac{2}{3}\)
    となります。
    (途中経過は計算してみてください)

    積分の計算の詳細はここをご覧ください。

    期待値をまとめると、
    E[X]=7/6、E[Y]=7/12、E[X+Y]=7/4、E[XY]=2/3
    となります。

    また、
    E[X+Y]= E[X]+ E[Y] は成り立ちますが、
    E[XY]= E[X] E[Y] は成り立ちません。
    X,Yは互いに独立ではないからですね。

    解法(分散)

    (3)分散V[X]、V[Y]、共分散Cov[X,Y]を求めよ。

    V[X]の解法

    ●ここで、分散V[X]の式をおさえましょう。
    まず、E[X2]が必要です。

    \(\begin{eqnarray}
    \int_0^2 x^2 f_X(x) dx \\
    &= \frac{1}{4} \int_0^2 x^2 (x+1) dx \\
    &= \frac{1}{4} \left[ \frac{x^4}{4}+\frac{x^3}{3} \right]_0^2 dx\\
    \end{eqnarray}\)
    =\(\frac{5}{3}\)
    となります。

    よって、
    V[X]=E[X2]-E[X]2
    =\(\frac{5}{3}\)-\((\frac{7}{6})^2\)
    =11/36

    V[Y]の解法

    ●ここで、分散V[Y]の式をおさえましょう。
    まず、E[Y2]が必要です。

    \(\begin{eqnarray}
    \int_0^1 y^2 f_Y(y) dy \\
    &= \frac{1}{2} \int_0^1 y^2 (1+2y) dy \\
    &= \frac{1}{2} \left[ \frac{y^3}{3}+\frac{y^4}{2} \right]_0^1 dy\\
    \end{eqnarray}\)
    =\(\frac{5}{12}\)
    となります。

    よって、
    V[Y]=E[Y2]-E[Y]2
    =\(\frac{5}{12}\)-\((\frac{7}{12})^2\)
    =11/144

    共分散COV[X,Y]の解法

    ●ここで、共分散COV[X,Y]の式をおさえましょう。
    COV[X,Y]=E[XY]-E[X]E[Y]
    =\(\frac{2}{3}\)-\(\frac{7}{6}\)・\(\frac{7}{12}\)
    =\(\frac{-1}{72}\)

    ちょっと難しいですが、解き方は1パターンなので、何度も復習しましょう。

    積分の計算の詳細はここをご覧ください。

    分散をまとめると、
    V[X]=11/36、V[Y]=11/144、Cov[X,Y]=-1/72
    となります。

    連続系は、ひたすら積分すればOKです。

    まとめ

    同時確率分布の分散、共分散の導出をわかりやすく解説しました。

    • ①【共通】2段サンプリングの分散公式を導出するために知っておくべき内容
    • ➁【何度も復習しよう!】離散型確率分布の場合
    • ➂【何度も復習しよう!】連続型確率分布の場合
  • 【必読】有限母集団の修正項の導出ができる

    【必読】有限母集団の修正項の導出ができる

    本記事のテーマ

    【必読】有限母集団の修正項の導出ができる
    • ①有限母集団からのランダムサンプリング
    • ②有限母集団の標本平均の導出
    • ③修正項の導出に必要な数式
    • ④有限母集団の標本分散の修正項への導出
    「有限母集団の修正項\(\frac{N-n}{N-1}\)」
    ●E[\(\bar{x}\)]=μ
    ●V(\(\bar{x}\))=\(\frac{N-n}{N-1}\)\(\frac{σ}{n}\)
    を丁寧に導出します。

    QC・統計に勝てるためのサンプリング問題集を販売します!

    QC検定®1級合格したい方、QCに必要なサンプリングをしっかり学びたい方におススメです。
    QC検定®1級、2級でサンプリングの問題で苦戦していませんか?本記事では、QC・統計に勝てるためのサンプリング問題集(20題)を紹介します。

    ①有限母集団からのランダムサンプリング

    下図のように、データ数N、平均μ、分散\(σ^2\)の有限母集団から、n個のデータをランダムサンプリングします。

    サンプリング

    n個のデータの平均ではない、標本平均の期待値E[\(\bar{x}\)]と、
    分散ではない、標本分散の期待値V(\(\bar{x}\))を導出します。

    ②有限母集団の標本平均の導出

    導出します。

    E[\(\bar{x}\)]=E[\(\frac{1}{n}\)\(\sum_{i=1}^{n}x_i\)]
    =\(\frac{1}{n}\)E[\(\sum_{i=1}^{n}x_i\)]
    =\(\frac{1}{n}\){E[\(x_1+x_2+…+x_n\)]}
    =\(\frac{1}{n}\){E[\(x_1\)]+ E[\(x_2\)]+…+ E[\(x_n\)]}
    =\(\frac{1}{n}\){μ+μ+…+μ}
    =\(\frac{nμ}{n}\)

    なお、すべてのiについて、
    E[\(x_i\)]=μ
    を使いました。

    ●E[\(\bar{x}\)]=μ
    と有限母集団の平均μと一致しました。

    ②修正項の導出に必要な数式

    次に標本分散V(\(\bar{x}\))を導出しますが、導出過程に必要な式があります。先に紹介して導出しておきましょう。

    【数式その1】
    \((\sum_{i=1}^{n}x_i)^2\)=\(\sum_{i=1}^{n}x_i ^2\)+\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)
    同様にnをNに、xをXに変えて
    \((\sum_{i=1}^{N}X_i)^2\)=\(\sum_{i=1}^{N}X_i ^2\)+\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{N}X_i X_j\)

    「なんじゃこりゃ!」という式ですが、展開すれば成立します。あとで導出しますね。

    【数式その2】
    \(\frac{1}{n}\)E[\(\sum_{i=1}^{n}x_i ^2\)]=\(\frac{1}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]
    \(\frac{1}{_{n}C_2}\)E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]= \(\frac{1}{_{N}C_2}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]

    【数式その1】の導出

    実際に展開しましょう。

    \((\sum_{i=1}^{n}x_i)^2\)
    =\((x_1+x_2+…+x_n)^2\)
    =(あ)

    和の2乗の展開は、
    自身の2乗と、互いの積の和ですね。これは高校1年数学レベルです。

    (あ)式は
    (あ)=(\(x_1^2+x_2^2+…+x_n^2\) (2乗和)
    +\(x_1( なし+x_2+x_3+…+x_{n-1}+x_n)\) (互いの積)
    +\(x_2(x_1+なし+x_3+…+x_{n-1}+x_n)\) (互いの積)

    +\(x_{n-1}(x_1+x_2+x_3+…+x_{n-2}+なし+x_n)\) (互いの積)
    +\(x_n (x_1+x_2+x_3+…+x_{n-2}+x_{n-1}+なし)\) (互いの積)
    =(い)

    (あ)式の「互いの積」項にある「なし」は2乗和の項に入れたため、ありません。「ない」ことを明確にするために「なし」と入れました。

    (い)式をまとめましょう。

    2乗和は簡単で
    (\(x_1^2+x_2^2+…+x_n^2\)=\(\sum_{i=1}^{n} x_i^2\)
    ですね。

    互いの積は、それぞれの組み合わせの積だけど、自分自身同士の積はないので、
    \(x_1( なし+x_2+x_3+…+x_{n-1}+x_n)\) (互いの積)
    +\(x_2(x_1+なし+x_3+…+x_{n-1}+x_n)\) (互いの積)

    +\(x_{n-1}(x_1+x_2+x_3+…+x_{n-2}+なし+x_n)\) (互いの積)
    +\(x_n (x_1+x_2+x_3+…+x_{n-2}+x_{n-1}+なし)\) (互いの積)
    =\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)
    とまとめることができます。

    【数式その1】
    \((\sum_{i=1}^{n}x_i)^2\)=\(\sum_{i=1}^{n}x_i ^2\)+\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)

    できましたね。

    【数式その2】の導出

    【数式その2】
    \(\frac{1}{n}\)E[\(\sum_{i=1}^{n}x_i ^2\)]=\(\frac{1}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]

    期待値Eを使って、ズルく導出します。数式よりは論理で両辺を等号に持ち込みます。

    もともとデータ\( X_i \)も\( x_i \)も同じ集合におり、平均、分散も同じですね。だとしたら、
    期待値E[\( X_i \)]= E[\( x_i \)]と
    期待値E[\( X_i^2 \)]= E[\( x_i^2 \)]と
    してもよいですね。期待値だから、似たデータなら期待値は同じ。ちょっと強引ですか?

    あとは、個数の平均を考えればOK。よって、

    【数式その2】
    \(\frac{1}{n}\)E[\(\sum_{i=1}^{n}x_i ^2\)]=\(\frac{1}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]

    数学的には正しいけど、ちょっと強引ですね。

    同様に、

    【数式その2】
    \(\frac{1}{_{n}C_2}\)E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]= \(\frac{1}{_{N}C_2}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]

    以上、下ごしらえは終わりです。では、標本分散を導出しましょう。

    ③有限母集団の標本分散の修正項への導出

    標本分散V(\(\bar{x}\))の式

    分散の公式は、

    V(\(\bar{x}\))=E[\(\bar{x^2}\)]-E[\(\bar{x}\)]2

    E[\(\bar{x}\)]はすでに、E[\(\bar{x}\)]=μとわかっています。

    E[\(\bar{x^2}\)]を導出します。分散はいつもE[\(x^2\)]の導出が難しいですよね。

    期待値E[\(\bar{x^2}\)]の導出

    E[\(\bar{x^2}\)]=E[\((\frac{1}{n}\sum_{i=1}^{n}x_i)^2\)]
    =\(\frac{1}{n^2}\)E[\((\sum_{i=1}^{n}x_i)^2\)]
    =(ア)

    (ア)の式で、\((\sum_{i=1}^{n}x_i)^2\)は、【数式その1】そのものですね。使いましょう。

    (ア)= \(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}x_i ^2\)+\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]
    =\(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}x_i ^2\)]+\(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]
    =(イ)

    次に、【数式その2】を使って\(x_i\)から\(X_i\)の式に変換します。
    E[\(\sum_{i=1}^{n}x_i ^2\)]=\(\frac{n}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]
    E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]= \(\frac{_{n}C_2}{_{N}C_2}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]

    (イ)
    =\(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}x_i ^2\)]+\(\frac{1}{n^2}\)E[\(\sum_{i=1}^{n}\sum_{j=1(i≠j)}^{n}x_i x_j\)]
    =\(\frac{1}{n^2}\)\(\frac{n}{N}\)E[\(\sum_{i=1}^{N}X_i ^2\)]+\(\frac{1}{n^2}\)\(\frac{_{n}C_2}{_{N}C_2}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]
    =(ウ)

    整理すると、
    (ウ)
    =\(\frac{1}{nN}\)E[\(\sum_{i=1}^{N}X_i ^2\)]+\(\frac{1}{n^2}\)\(\frac{n(n-1)}{N(N-1)}\)E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]
    =(エ)

    ここで、\(X_i\)は母集団のデータなので、期待値Eが外せます。つまり、
    E[\(\sum_{i=1}^{N}X_i ^2\)]=\(\sum_{i=1}^{N}X_i ^2\)
    E[\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)]=\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)
    です。なお、サンプリングした方の\(x_i\)は期待値Eが外せません。

    (エ)
    =\(\frac{1}{nN}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{1}{n^2}\)\(\frac{n(n-1)}{N(N-1)}\)\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)
    =(オ)

    次に、よくわからない式、\(\sum_{j=1(i≠j)}^{n}X_i X_j\)を別の式に書き換えましょう。

    ここで、よく考えると、
    \(\frac{1}{N}\sum_{i=1}^{N}X_i\)=μより、
    ●\(\sum_{i=1}^{N}X_i\)=Nμ
    ●\((\sum_{i=1}^{N}X_i)^2\)=\((Nμ)^2\)
    が成り立ちますね。

    【数式その1】を見ると、

    【数式その1】
    \((\sum_{i=1}^{N}X_i)^2\)=\(\sum_{i=1}^{N}X_i ^2\)+\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{N}X_i X_j\)

    つまり、
    \((\sum_{i=1}^{N}X_i)^2\)=\(\sum_{i=1}^{N}X_i ^2\)+\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{N}X_i X_j\)=\((Nμ)^2\)
    が成り立ちます。式変形すると、
    \(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{N}X_i X_j\)=\((Nμ)^2\)-\(\sum_{i=1}^{N}X_i ^2\)
    =(カ)
    が成り立ちます。

    ちょっと前の(オ)式に(カ)式を代入します。

    (オ)
    =\(\frac{1}{nN}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{1}{n^2}\)\(\frac{n(n-1)}{N(N-1)}\)\(\sum_{i=1}^{N}\sum_{j=1(i≠j)}^{n}X_i X_j\)
    =\(\frac{1}{nN}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{1}{n^2}\)\(\frac{n(n-1)}{N(N-1)}\)[\((Nμ)^2\)-\(\sum_{i=1}^{N}X_i ^2\)]
    =(キ)

    (キ)式はμと\(\sum_{i=1}^{N}X_i ^2\)について式変形しましょう。その結果は

    (キ)
    =E[\(\bar{x^2}\)]
    =\(\frac{1}{nN}\)\(\frac{N-n}{N-1}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{N(n-1)}{n(N-1)}\)\(μ^2\)
    となります。長かったですね。もうちょっとで完成です。

    標本分散の修正項への導出

    標本分散V(\(\bar{x}\))の式は

    V(\(\bar{x}\))=E[\(\bar{x^2}\)]-E[\(\bar{x}\)]2

    代入しましょう。
    V(\(\bar{x}\))=\(\frac{1}{nN}\)\(\frac{N-n}{N-1}\)\(\sum_{i=1}^{N}X_i^2\)+\(\frac{N(n-1)}{n(N-1)}\)\(μ^2\)-\(μ^2\)
    =(ク)

    (ク)式をまとめると
    (ク)=\(\frac{N-n}{N-1}\)[\(\frac{1}{N}\sum_{i=1}^{N}X_i^2\)-\(μ^2\)]\(\frac{1}{n}\)
    =(ケ)

    (ケ)式の中の、[\(\frac{1}{N}\sum_{i=1}^{N}X_i^2\)-\(μ^2\)]はよく見ると、
    [\(\frac{1}{N}\sum_{i=1}^{N}X_i^2\)-\(μ^2\)]=E[x2]-E[x]2
    =\(σ^2\)
    ですから、まとめると、

    (ケ)つまり、標本分散V(\(\bar{x}\))は
    V(\(\bar{x}\))=\(\frac{N-n}{N-1}\)\(\frac{σ^2}{n}\)

    無限母集団の標本分散は\(\frac{σ^2}{n}\)ですから、修正項は、

    修正項は、\(\frac{N-n}{N-1}\)

    できましたね。お疲れさまでした。

    まとめ

    有限母集団の修正項の導出をわかりやすく解説しました。

    • ①有限母集団からのランダムサンプリング
    • ②有限母集団の標本平均の導出
    • ③修正項の導出に必要な数式
    • ④有限母集団の標本分散の修正項への導出
  • 【まとめ】簡単だけど難しい管理図を究める

    【まとめ】簡単だけど難しい管理図を究める

    本記事のテーマ

    【まとめ】簡単だけど難しい管理図を究める
    • ①管理図を究めるのは難しい
    • ②管理図を究める道
    • ③管理図を究める関連記事の紹介

    ●Youtube動画でも解説しています。ご確認ください。

    ①管理図を究めるのは難しい

    管理図の本質を確認する問い

    管理図の理論は実はとても難しい

    【あなたに問います】管理図について次の問いが答えられますか?

    1. 「管理図=シューハート管理図」と頭がセットされていませんか?
    2. 管理図係数表の値の導出はできますか?
    3. 管理図係数表の値はnが6以上でないと使えない理由は説明できますか?
    4. 管理図係数表が計量値管理図しかない理由は説明できますか?
    5. 管理図で、群内データnを∞にしたら管理図はどうなるか説明できますか?
    6. 分散公式\(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)と\(σ_\bar{x^2}\)=\(\frac{σ_w^2}{n}\)+\(σ_b^2\)は導出できますか?
    7. データを層別していったら、群内・群間変動は追って計算できますか?
    8. JISにある異常判定ルールはどのように決まっているか説明できますか?
    9. 第1種の誤り、第2種の誤りと管理図の管理限界との関係、検出力への影響が説明できますか?
    10. 実験計画法、検定・推定、χ2乗分布などと管理図を組み合わせた応用事例が解けますか?
    11. 「X-Rs管理図」、「\(\bar{x_s}-Rs\)管理図」、「減点数の管理図」、「カイ2乗管理図」などの管理図は知っていますか?

    管理図の本質をまとめるQCプラネッツの熱い思い

    上の問いが答えられないのは、管理図の作り方だけしか勉強していない証拠です。管理図の理論や特性を知らずに、手法だけ解けても、意味はありません。
    QC検定®では、3級、2級は公式代入だけでOK
    1級は群内、群間分散まで出題してくる。
    でも、群内、群間分散の問題が良くないため、正解が導き出せにくいし、解説読んでも理解できない。

    QCプラネッツの経験上

    1. QC検定® 3級&2級の管理図は簡単で得点源!
    2. QC検定®1級では管理図が一番難しい

    だから【簡単だけど難しい管理図】という思いで、管理図の本質にQCプラネッツが迫ります!

    ●商標使用について、
    ①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
    ➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
    ➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

    ②管理図を究める道

    本記事を併せて26記事(11ブログ+15PDFテキスト)をまとめました。管理図の本質をここまで書いたサイトや教科書は、無いでしょう。なお、管理図の教科書には載っていない内容ばかり解説しています。必読!です。

    管理図の究め方

    次の8つに分類できます。上から読んでいけば本質に迫れるようにまとめています。また、各分類に属す関連記事を紹介します。

    1. 管理図の導入
    2. 管理図係数表を導出
    3. 群内・群間変動を分割
    4. 工程異常判定ルールを考える
    5. 検出力を管理図で考える
    6. 管理図以外の単元と組み合わせた応用事例
    7. 特殊な管理図
    8. 管理図に関する良書

    QCプラネッツの管理図プレミアムテキストのご紹介

    以前は、ブログ記事でまとめていましたが、PDFとしてまとめました。ダウンロードして学習ください。

    【QCプラネッツ管理図 プレミアム勉強プリント(14記事必見です!)】

    No 記事
    1 【注意】管理図はシューハートの管理図だけではない
    2 管理図係数値でnが6以上でないと使えない係数がある理由がわかる
    3 管理図の各係数値の極限値(n⇒∞)がわかる
    4 【必読】管理図と実験計画法を使ってばらつき低減効果を確認する
    5 【必読】管理図の第1種の誤りと第2種の誤り(検出力)がわかる
    6 【本記事限定】計数値データにR管理図やs管理図が必要な場合がある
    7 工程変化と検出力の関係をOC曲線で表現できる
    8 R管理図で範囲Rの平均差の検定ができる
    9 管理図の平均値Xbarの差の検定ができる
    10 u管理図の欠点数の差の検定ができる
    11 管理図で「工程が管理状態である」がわかる
    12 2つのデータを管理図にするときの注意点(分散の加法性と検出力のバランス)
    13 減点数の管理図の作り方がわかる(ポアソン分布、分散の加法性)
    14 カイ2乗管理図がわかる

    一緒に勉強しましょう。

    ③管理図を究める関連記事の紹介

    (1)管理図の導入

    ●「管理図=シューハート管理図」と思い込んでいませんか?管理図は本来自分で考えるものです。試験勉強に染まると、シューハート管理図に突っ込んでいってしまいます。

    【QCプラネッツ管理図 プレミアム勉強プリント(14記事必見です!)】

    記事「【注意】管理図はシューハートの管理図だけではない」でご確認ください。

    (2)管理図係数表を導出

    ここでは、7記事を紹介します。そろそろ表や数値を使うだけの勉強は卒業しましょう。数値や式は導出して理解するのが最も重要ですよ。

    計量値管理図の係数値の変数の導出をまとめました。変な式が多く、導出が困難な印象を受けますね。

    【重要】管理図(計量値)の変数の導出がわかる
    シューハートの管理図の計量値の各係数表の求め方を解説します。A,B,D,d2とかいっぱい変数がありますが、すべて期待値±倍数×標準偏差で表記できます。

    計数値管理図の係数表一覧を作りました。JISのハンドブックまで戻らなくてもすぐ見えるようにしました。

    【試験対策】シューハート管理図の管理線公式と係数表を確認する
    シューハートの管理図の中心・管理限界公式と、係数表をまとめました。大学の試験やQC検定®対策に活用ください。

    s管理図の係数c4と管理限界の導出を解説します。χ2乗分布、平方和、正規分布の関係から完璧に導出できます。

    【必読】s管理図の変数c4と管理限界の導出がわかる
    s管理図の管理限界を求めるc4と管理限界値の導出を解説します。χ2乗分布、平方和、標準偏差の関係式を使って、意外と簡単に係数c4が導出できます。

    R管理図の係数d2,d3の導出を解説します。これは、完璧な導出ができなかったのですが、わかったところまで解説します。こんな難解すぎて正しいかどうかわからない係数は使いたくないですね。また、範囲R自体が「絶対値」という不自然な値だから導出が難しいのです。

    【必読】R管理図の変数d2,d3の導出がわかる
    R管理図の係数d2,d3はどうやって求めるか説明できますか?本記事では、範囲Rの確率密度関数を順序統計量の同時分布を使って導出し、途中までですが、d2,d3の導出方法を解説します。

    プレミアムテキストで解説します。

    1. 管理図係数値でnが6以上でないと使えない係数がある理由がわかる
    2. 管理図の各係数値の極限値(n⇒∞)がわかる
    3. 【本記事限定】計数値データにR管理図やs管理図が必要な場合がある

    ●「管理図係数値はnが6以上でないと使えない」を暗記ではなく、理由が説明できるようになってください。係数が負だからです。計算して確認したら、説明できるようになるはずです。

    ●管理図の群内データ数nを∞に持って行ったら管理図はどうなるか?考えてみましょう。nの極限値をみることで、nと係数値の関係が妥当なのか?チェックできるからです。

    ●計量値管理図は2種類、計数値管理図は1種類管理図があります。種類が違い理由は説明できますか?計数値管理図にR管理図やs管理図が必要なケースを考えてみてください。いい勉強になります。

    【QCプラネッツ管理図 プレミアム勉強プリント(14記事必見です!)】

    (3)群内・群間変動を分割

    ここでは、2記事を紹介します。

    群内変動、群間変動の分割公式を導出します。公式暗記せず、導出が理解を早めます。

    【必読】管理図の分散σ(x)とσ(xbar)の違いがわかる(群内変動と群間変動)
    群内変動と群間変動の分散の導出において、Xbarの分散公式とXの分散公式の違いや、公式の導出方法を平方和、実験計画法を活用して導出します。。

    QC検定®1級対策用です。1級の群内変動、群間変動の分割問題は良問ではありませんが、試験合格が目的なので、それに対応した演習問題を紹介します。

    【必読】計量値管理図の群内変動と群間変動の分散が推定できる
    R管理図から群内変動と群間変動の分散を導出する方法を詳細に解説します。

    (4)工程異常判定ルールを考える

    ここでは、2記事を紹介します。連、傾向など8つの異常判定ルールがJISにあります。しかし、なぜ、それらが異常と言えるのか?理由を説明できますか?本来は、工程管理対象の特徴に合わせて異常判定を設定すべきです。

    異常ルールはJISに頼る前に、自分で考える必要があります。異常判定条件の考え方をまとめました。

    【重要】管理図の異常判定ルールは自分で設計すべき(JISに頼るな!)
    管理図の異常判定ルールは8種類ありますが、各々のルールである理由を説明できるように解説します。

    「工程が管理状態であり、σ=0」とよく教科書に書いています。この状態を管理図で表現するとどうなるか?を解説しました。理想的な管理状態を管理図で見ておくことは重要です。

    ●「工程が管理状態であり、σ=0」とよく教科書に書いています。この状態を管理図で表現するとどうなるか?を解説しました。理想的な管理状態を管理図で見ておくことは重要です。

    【QCプラネッツ管理図 プレミアム勉強プリント(14記事必見です!)】

    記事「管理図で「工程が管理状態である」がわかる」でご確認ください。

    (5)検出力を管理図で考える

    ●管理限界は基本的には正規分布の±3σの点です。ここから第1種の誤り、第2種の誤り、検出力を確認することができます。

    第1種の誤り,第2種の誤り,検出力 【必読】管理図の第1種の誤りと第2種の誤り(検出力)がわかる
    本記事では、管理図から、第1種の誤り、第2種の誤り、検出力を求める方法を詳細に解説します。

    ●工程変化と検出力の関係をOC曲線で表現することができます。抜取検査の主役であるOC曲線が管理図でも出て来ます!

    【QCプラネッツ管理図 プレミアム勉強プリント(14記事必見です!)】

    (6)管理図以外の単元と組み合わせた応用事例

    ここでは、6記事を紹介します。

    p管理図から不良率の差を検定します。管理図、正規分布、χ2乗分布を組み合わせた応用事例を解説します。

    p管理図の不良率の差の検定ができる
    p管理図を用いて、不良率の差の検定について解説します。正規分布を使った検定方法と、χ2乗分布を使った検定方法を解説します。

    プレミアムテキストで解説します。

    1. R管理図で範囲Rの平均差の検定ができる
    2. u管理図の欠点数の差の検定ができる
    3. 管理図の平均値Xbarの差の検定ができる
    4. 2つのデータを管理図にするときの注意点(分散の加法性と検出力のバランス)
    5. 【必読】管理図と実験計画法を使ってばらつき低減効果を確認する

    ●R管理図で範囲Rの平均差の検定できることを解説します。平均差の検定はt分布を使いますが、正規分布でも検定ができることも解説します。

    ●u管理図の欠点数の差の検定を解説します。正規分布、管理図、検定・推定を組み合わせた応用事例を解説します。

    ●管理図の平均値Xbarの差の検定を解説します。差の検定はt分布を使いますが、正規分布でも使えることを解説します。

    ●2つのデータを組み合わせた場合の管理図を考えます。分散の加法性と管理限界の関係性を解説します。

    ●工程管理を改善すると管理図のグラフは変化します。それ同時に、各因子・効果の変動がどの程度変化するかを実験計画法・分散分析を使って数値化します。管理図と実験計画法を使った応用事例を解説します。

    【QCプラネッツ管理図 プレミアム勉強プリント(14記事必見です!)】

    ここまで読めば、かなり管理図の応用力がつきますね。

    (7)特殊な管理図

    ここでは、4記事を紹介します。

    X-Rs管理図を解説します。QC検定®1級では、過去に1回だけ出題されるくらいのレアですが、データが1つしかない場合の範囲Rをどう計算するかが注目ポイントです。

    【必読】X-Rs管理図が作れる
    シューハートの管理図の計量値の各係数表の求め方を解説します。データが1つしかない場合のレアな管理図は必見!

    移動平均と移動範囲の管理図を解説します。レアな管理図ですが、QCプラネッツはここまで広く深く解説します!

    移動平均と移動範囲の管理図(xs-Rs管理図)がわかる
    移動平均と移動範囲の管理図を解説します。特殊な管理図ですが、Xbar-R管理図との違い、xs-Rs管理図の描き方を解説します。

    プレミアムテキストで解説します。

    1. 減点数の管理図の作り方がわかる(ポアソン分布、分散の加法性)
    2. カイ2乗管理図がわかる

    ●減点数の管理図の作り方を解説します。p管理図やnp管理図のように「不良」、「良」の2択ではなく、3択以上の複数の選択がある場合に活用する管理図です。レアな管理図ですが、QCプラネッツはここまで広く深く解説します!

    ●「χ2乗管理図」って聞いたことがありますか?あるんです!np管理図やp管理図のように、「不良」、「良」の2択ではなく、3つ以上の選択がある場合、まとめて工程管理図を作る場合に考えたのがカイ2乗管理図です。レアな管理図ですが、QCプラネッツはここまで広く深く解説します!

    【QCプラネッツ管理図 プレミアム勉強プリント(14記事必見です!)】

    (8)管理図に関する良書

    良書を紹介しますが古書ばかりで
    QCプラネッツの記事を読む方をお薦めします。

    最近の本は、公式代入するだけの使い方しか書いていないものばかりです。理論をしっかり学びたいところです。

    【1】管理図法―品質管理教程 (1962年) 【評価:◎】

    【評価理由】管理図の使い方、事例、理論が最も詳しい。1962年、1986年版があるが、理論多めの1962年の方がベター。

    【2】新編統計数値表 河出書房 1952 【評価:〇】

    【評価理由】R管理図のd2,d3の導出過程を最も詳しく書いている。しかし、それでも導出の途中経過がわからない。その他多くの統計の数理が紹介されている。

    【3】1回で合格!QC検定®2級テキスト&問題集【評価:〇】

    【評価理由】使い方は理解できる。入門書としては良い。

    【4】【新レベル表対応版】QC検定®受検テキスト1級 (品質管理検定集中講座[1])【評価:〇】

    【評価理由】群内、群間変動、工程異常ルールなど管理図全体を網羅している。試験対策には必須。でも理論はわからない。QC検定®1級で管理図を使った問題が一番苦労するはず。

    【5】管理図の作り方と活用 (新版QC入門講座) 日本規格協会【評価:△】

    【評価理由】使い方は理解できるが、理論がわからない。ほとんどの教科書が、管理図の使い方ばかり説明なので、理論・本質が理解できず悩ましいです。

    【6】管理図活用の基本と応用 管理図を見直そう 日本規格協会 1986【評価:△】

    【評価理由】使い方は理解できるが、理論がわからない。ほとんどの教科書が、管理図の使い方ばかり説明なので、理論・本質が理解できず悩ましいです。

    以上、(1)~(8)の計26記事を紹介しました。これを全部理解すれば、日本で最も管理図が詳しいレベルにすぐ到達できます。必読です!公式暗記で済ませる管理図からさよならしてください。

    まとめ

    管理図の究め方について解説しました。

    • ①管理図を究めるのは難しい
    • ②管理図を究める道
    • ③管理図を究める関連記事の紹介
  • 移動平均と移動範囲の管理図(xs-Rs管理図)がわかる

    移動平均と移動範囲の管理図(xs-Rs管理図)がわかる

    本記事のテーマ

    移動平均と移動範囲の管理図(\(\bar{x_s}-R_s\)管理図)がわかる
    • ①移動平均と移動範囲のデータのとり方
    • ②移動平均と移動範囲の管理図(\(\bar{x_s}- R_s\)管理図)の描き方
    • ③\(\bar{x_s}- R_s\)管理図のメリット、デメリット

    QC・統計に勝てるための「管理図と工程能力指数」問題集を販売します!

    QC検定®1級合格したい方、QCに必要な「管理図と工程能力指数」をしっかり学びたい方におススメです。
    QC検定®1級、2級で「管理図と工程能力指数」の問題で苦戦していませんか?本記事では、QC・統計に勝てるための「管理図と工程能力指数」問題集を紹介します

    ①移動平均と移動範囲のデータのとり方

    基本は、平均と範囲なので、代表的な\(\bar{X}\)-R管理図さえあればOK。それの特別版な管理図である\(\bar{x_s}-R_s\)管理図をお楽しみください。

    平均移動とは?平均範囲とは?

    ●平均移動⇒次々と出て来るデータを、ある個数n個ずつ順にずらして群分けした場合の平均値
    ●平均範囲⇒次々と出て来るデータを、ある個数n個ずつ順にずらして群分けした場合の範囲

    言葉にすると非常にわかりにくいので下表で説明します。

    ●まず、データを用意します。Noごとに1つのデータxを測定します。

    No データx
    1 15
    2 20
    3 24
    4 23
    5 15
    6 18
    7 11
    8 12
    9 19
    10 14

    ●次に、群分けの方法ですが、
    次々と出て来るデータを、ある個数n個ずつ順にずらして群分けとあります。
    n=3とすると、
    ●3個ずつ順にずらすので、
    (i)1群目:1個目、2個目、3個目のデータ
    (ii)2群目:2個目、3個目、4個目のデータ
    (iii)3群目:3個目、4個目、5個目のデータ

    と区分けしていくことです。

    すると、次の表に変形できますね。

    No データx 群分け(n=3)
    1 15 1
    2 20 1 2
    3 24 1 2 3
    4 23 2 3
    5 15 3
    6 18
    7 11
    8 12 8
    9 19 8
    10 14 8

    移動平均と移動範囲のデータのとり方

    データを群内、群間の2軸にまとめ直します

    データx
    1 15 20 24
    2 20 24 23
    3 24 23 15
    8 12 19 14

    上表の横方向のデータの作り方が、\(\bar{X}\)-R管理図と異なります。

    ②移動平均と移動範囲の管理図(\(\bar{x_s}-R_s\))理図)の描き方

    \(\bar{x_s}-R_s\)管理図の注意点

    \(\bar{x_s}-R_s\)管理図自体は、\(\bar{X}\)-R管理図と同じ描き方です。

    管理限界は
    ●\(\bar{x_s}\)管理図: \(\bar{\bar{x}}±A_2 \bar{R_s}\)
    (\(\bar{\bar{x}}\)は群分けする前の全データの平均。重複するデータは無い点に注意)
    ●\(R_s\)管理図: \(D_3 \bar{R_s}\),\(D_4 \bar{R_s}\)
    と\(\bar{X}\)-R管理図と同じ

    \(\bar{x_s}-R_s\)管理図の描き方

    元のデータを再掲します。

    データx
    1 15 20 24
    2 20 24 23
    3 24 23 15
    8 12 19 14

    この表に、\(\bar{x_s}\)、\(\bar{\bar{x}}\)、\(R_s\)を追加します。

    データx \(\bar{x_s}\) \(\bar{\bar{x}}\) \(R_s\)
    1 15 20 24 19.67 17.1 9
    2 20 24 23 22.33 17.1 4
    3 24 23 15 20.67 17.1 9
    4 23 15 18 18.67 17.1 8
    5 15 18 11 14.67 17.1 7
    6 18 11 12 13.67 17.1 7
    7 11 12 19 14 17.1 8
    8 12 19 14 15 17.1 7

    ここで、\(\bar{x_s}\)、\(\bar{\bar{x}}\)、\(R_s\)の計算方法を解説します。
    ●第1群の\(\bar{x_s}\)=(15+20+24)/3=19.67
    (他の群も同様に計算)
    ●\(\bar{\bar{x}}\)=(15+20+24+23+15+18+11+12+19+14)/10=17.1
    (群分けしない。データが重複しないため)
    ●第1群の\(R_s\)=(24-15)=9
    (他の群も同様に計算)
    また、
    ●\(\bar{R_s}\)=全群の\(R_s\)の平均
    =7.375

    (\bar{x_s}\)管理図

    ●管理限界、LCL,UCLを計算します。
    ◎LCL=\(\bar{\bar{x}}-A_2 \bar{R_s}\)
    =17.1-1.023×7.375
    =9.56
    ◎UCL=\(\bar{\bar{x}}+A_2 \bar{R_s}\)
    =17.1+1.023×7.375
    =24.64

    \(\bar{x_s}\)管理図のデータを下表にまとめます。

    \(\bar{x_s}\) \(\bar{\bar{x}}\) LCL UCL
    1 19.67 17.1 9.56 24.64
    2 22.33 17.1 9.56 24.64
    3 20.67 17.1 9.56 24.64
    4 18.67 17.1 9.56 24.64
    5 14.67 17.1 9.56 24.64
    6 13.67 17.1 9.56 24.64
    7 14 17.1 9.56 24.64
    8 15 17.1 9.56 24.64

    グラフは下図になります。

    xs管理図

    \(R_s\)管理図

    ●管理限界、LCL,UCLを計算します。
    ◎LCL=無しというか0
    ◎UCL=\(D_4 \bar{R_s}\)
    =2.575×7.375
    =18.99

    \(\bar{x_s}管理図のデータを下表にまとめます。

    Rs \(\bar{R_s}\) LCL UCL
    1 9 7.375 0 18.99
    2 4 7.375 0 18.99
    3 9 7.375 0 18.99
    4 8 7.375 0 18.99
    5 7 7.375 0 18.99
    6 7 7.375 0 18.99
    7 8 7.375 0 18.99
    8 7 7.375 0 18.99

    グラフは下図になります。

    Rs管理図

    管理図が完成しましたね。

    ③\(\bar{x_s}- R_s\)管理図のメリット、デメリット

    \(\bar{x_s}- R_s\)管理図のメリット

    どんなメリットがあるでしょうか?

    ●1回に1つしか出ないデータをX-R管理図のように表現できる。
    でもX管理図だけ描けばいいじゃんと突っ込まれるとその通り。
    ●横軸の区切る期間を工程、機械、材料の違いによって区切り方を分けてその平均の動きが見える。

    \(\bar{x_s}- R_s\)管理図のデメリット

    どんなデメリットがあるでしょうか?

    ●群内、群間分けができない。同じデータが他の群に重複するから。

    まとめると、私の感触では、\(\bar{X}\)-R管理図ほど便利なものではない気がします。でも、こういう管理図も考えられることを知っておいてください。

    まとめ

    移動平均と移動範囲の管理図\(\bar{x_s}- R_s\)について、解説しました。

    • ①移動平均と移動範囲のデータのとり方
    • ②移動平均と移動範囲の管理図(\(\bar{x_s}- R_s\)管理図)の描き方
    • ③\(\bar{x_s}- R_s\)管理図のメリット、デメリット
  • 管理図は「使えない、役に立たない、使い道がない」と思ったら読むべき記事

    管理図は「使えない、役に立たない、使い道がない」と思ったら読むべき記事

    本記事のテーマ

    管理図は「使えない、役に立たない、使い道がない」と思ったら読むべき記事
    • ①管理図はそもそも必要なのか?
    • ②管理限界外があっても原因がわからない
    • ③異常があっても管理図ではわからない場合がある
    • ④管理図の評価と検査結果が一致しない

    管理図は「使えない、役に立たない、使い道がない」と思う理由

    次の4つがあると考えます。

    1. 管理図のメリットが感じないから
    2. 管理限界外があっても原因がわからないから
    3. 異常があっても管理図ではわからない場合があるから
    4. 管理図の評価と検査結果が一致しないから

    それぞれの理由の背景と対策を解説します。

    ●Youtube動画でも解説しています。ご確認ください。

    QC・統計に勝てるための「管理図と工程能力指数」問題集を販売します!

    QC検定®1級合格したい方、QCに必要な「管理図と工程能力指数」をしっかり学びたい方におススメです。
    QC検定®1級、2級で「管理図と工程能力指数」の問題で苦戦していませんか?本記事では、QC・統計に勝てるための「管理図と工程能力指数」問題集を紹介します

    ①管理図はそもそも必要なのか?

    管理図の御利益を簡単に考えると、3つあります。

    1. 管理図を描くと、工程異常がはっきりわかる
    2. 長期間にわたりグラフ化すると、どこで異常が出たか?出やすいかがわかる
    3. 異常時の処置方法や処置対応したかどうかチェックしやすい

    毎日、同じモノを製造、購買しても、いろいろ変化します。
    ●そのモノの品質特性のばらつき
    ●担当者、機械、測定のばらつき
    ●天変地異、季節などの外的環境の変化

    ●いつ、どこで、どんな異常が生じたか、
    ●いつも違う傾向がみられる
    ●偏った傾向が出始める

    などを長期間、可視化できるツールを共有しておけば、異常時の処置、異常が起こるパターンなどがわかり、現場は冷静に判断できます。

    管理図の管理初期は、管理図の価値があまり無いと感じやすいでしょうが、異常・事故・不適合に遭遇した場合、後から振り返るときに工程管理の観点から役立つツールになります。

    ②管理限界外があっても原因がわからない

    これは、2つケースが考えられます。

    1. 原因特定する風土が社内に無い
    2. 管理図の描き方が良くない

    原因特定する風土が社内に無い

    管理図から異常があるのは明らかであるが、原因を特定しようとしないから、原因がわからない!場合です。

    管理図ツールより、社内の問題です。

    (i)原因を特定しようと動かない理由

    1. 責任と権限が不明確
    2. 異常処置する風土が無い

    上の2つを解決すれば、異常処置を社内で対処する動きが生まれます。ただし、これは2つやることがあります。

    ①仕組みで解決
    ②モチベーションアップ

    (ii)責任と権限を明確に与える

    異常処置の担当者、責任者を明確化し、彼らに権限を与えることです。
    処置をしなければならない強制力と、処置方法は彼らに任せる自由度を社内のトップが決めて、サポートすることが必要です。

    トップの指示で担当者・責任者を任命し、社内規定・ルールにどの部門のどの役職者をアサインするかを明確化します。

    まず、社内の仕組みができました。しかし、これだけでは、「やらされ感」満載なので、社員自ら異常処置する動機付けが必要です。

    (iii) 異常処置する風土を作る

    やりたくないことをやりたくなるようにするにはどうすればよいか?を考えましょう

    ①上が自ら動く
    ②下の良い動きを褒める
    ③良い事例を展開して競争させる

    ●まず、異常処置を対処するトップの姿勢がないと、誰も動きません。
    ●次に、やりたくないことなので、「褒める、評価する、成績に反映する」ことが大事ですね。
    ●そうすれば、社員のモチベーションアップにつながり、少しずつですが、異常処置への行動が加速されます。

    単に管理図で異常が出ているからと言って、簡単に動けるものではない

    管理図の描き方が良くない

    ●2つ問題があります。

    1. データのまとめ方が良くない可能性
    2. 層別の仕方が良くない可能性

    (i)データのまとめ方が良くない可能性

    データのまとめ方が良くない可能性があります。縦軸、横軸の設定、全データのうち、どのデータをサンプリングして管理図に載せたのか?などをチェックしましょう。管理図の設計が妥当なのか?を担当者間で確認が必要です。

    (ii)層別の仕方が良くない可能性

    層別の仕方が良くない可能性があります。工程、工場、機械、人、日など層別する変数はいろいろありますが、どの変数で層別するかによって、管理限界線(LCL,UCL)の位置が変化するため、管理図の正常・異常の結果は変わります。いくつか管理図を作って、ターゲットとなる工程異常がわかりやすい変数で層別した方が良いでしょう。

    管理図の設計や、調べたい目的を満たす管理図を選ぶことが大切

    ③異常があっても管理図ではわからない場合がある

    管理図は異常があるのに、点が限界外へ飛び出さない場合がある

    異常があるのに、管理限界外に飛び出さない理由は2つあります。

    1. 第2種の誤りが数%あるので仕方がない
    2. 管理図の管理限界幅が広い

    (i)第2種の誤り

    これが、第2種の誤りですね。関連記事にも解説しています。

    【必読】管理図の第1種の誤りと第2種の誤り(検出力)がわかる
    本記事では、管理図から、第1種の誤り、第2種の誤り、検出力を求める方法を詳細に解説します。管理図をマスターしたい方は必見です。

    管理図から異常が出ない場合は、他から異常が発見されることになります。第2種の誤りが確率として数%はあるため、仕方がないとして対処しましょう。

    (ii) 管理図の管理限界幅が広い

    管理限界幅が広いと、異常となりにくいですね。各管理図の管理限界を決める変数は、群内のサンプル数nで変化するため、どのnがベストかを関係者で協議した方がよいでしょう。

    なお、変数については関連記事をご覧ください。

    【重要】管理図(計量値)の変数の導出がわかる
    シューハートの管理図の計量値の各係数表の求め方を解説します。A,B,D,d2とかいっぱい変数がありますが、すべて期待値±倍数×標準偏差で表記できます。

    管理図は異常があるのに、点が限界外へ飛び出さない場合があるため、管理図以外で気づいた異常を処置しつつ、正常と判断した管理図との関係を確認しておく必要があります。

    ④管理図の評価と検査結果が一致しない

    よく、混同しますが、

    管理図の評価と検査結果は別物です。
    ●管理図は工程管理を調べるもので、品質検査の合否には使わない
    ●検査結果、出荷合否判定するもので、検査基準で合否を決めるべき

    工程が標準通りであれば、不良品が出ても、現場の責任でありません。製造、材料、設計、機械など他の原因を調べるべきです。

    製品合格率が低下する原因の1つには、管理図からわかる工程管理の不備がありますが、管理図で検査結果はわかりません。

    管理図はわかりやすいので、万能に思いたいですが、管理図の用途やできることをしっかり理解して使いましょう。

    本記事の結論

    まとめます。

    • ①管理図はそもそも必要なのか?
      ⇒管理図のメリットを理解する
    • ②管理限界外があっても原因がわからない
      ⇒異常処置するよう社内の活性化と管理図の設計が重要
    • ③異常があっても管理図ではわからない場合がある
      ⇒第2種の誤りを考慮しつつ、管理図の設計を見直す
    • ④管理図の評価と検査結果が一致しない
      ⇒管理図と品質検査は別物

    まとめ

    管理図は「使えない、役に立たない、使い道がない」と思ったら読むべき内容を解説しました。

    • ①管理図はそもそも必要なのか?
    • ②管理限界外があっても原因がわからない
    • ③異常があっても管理図ではわからない場合がある
    • ④管理図の評価と検査結果が一致しない
  • p管理図の不良率の差の検定ができる

    p管理図の不良率の差の検定ができる

    本記事のテーマ

    p管理図の不良率の差の検定ができる
    • ①不良率の差の検定事例
    • ②正規分布を使った検定統計量で不良率の差の検定を解く
    • ③χ2乗分布を使った検定統計量で不良率の差の検定を解く
    正規分布、χ2乗分布それぞれの検定統計量を使って解説します。

    QC・統計に勝てるための「管理図と工程能力指数」問題集を販売します!

    QC検定®1級合格したい方、QCに必要な「管理図と工程能力指数」をしっかり学びたい方におススメです。
    QC検定®1級、2級で「管理図と工程能力指数」の問題で苦戦していませんか?本記事では、QC・統計に勝てるための「管理図と工程能力指数」問題集を紹介します

    ●商標使用について、
    ①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
    ➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
    ➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

    ①不良率の差の検定事例

    事例問題

    次の問いを考えます。管理図から検定・推定につなぐ重要な応用問題としてとらえてください。QC検定®1級で出題されてもよい良問です。

    演習問題

    5000個の電子部品を調べ、100個ずつ群に小分けする。
    ただし、ある月に生産したものをA(群1~25)、
    別の月に生産したものをB(群26~50)に分ける。
    A、Bのある品質特性の不良率に差があるかどうかを確認したい。
    (1) A、B合わせた全体のp管理図を描け。
    (2)A、Bのある品質特性の不良率に差があるかどうか、有意水準5%で検定せよ。
    群番号 群の
    大きさn
    不良個数
    pn
    不良率p 群番号 群の
    大きさn
    不良個数
    pn
    不良率p
    1 100 8 0.08 26 100 1 0.01
    2 100 11 0.11 27 100 2 0.02
    3 100 6 0.06 28 100 3 0.03
    4 100 9 0.09 29 100 2 0.02
    5 100 8 0.08 30 100 5 0.05
    6 100 9 0.09 31 100 4 0.04
    7 100 5 0.05 32 100 5 0.05
    8 100 12 0.12 33 100 7 0.07
    9 100 7 0.07 34 100 6 0.06
    10 100 8 0.08 35 100 4 0.04
    11 100 9 0.09 36 100 5 0.05
    12 100 11 0.11 37 100 4 0.04
    13 100 4 0.04 38 100 3 0.03
    14 100 5 0.05 39 100 2 0.02
    15 100 8 0.08 40 100 4 0.04
    16 100 8 0.08 41 100 5 0.05
    17 100 9 0.09 42 100 6 0.06
    18 100 12 0.12 43 100 4 0.04
    19 100 14 0.14 44 100 3 0.03
    20 100 15 0.15 45 100 4 0.04
    21 100 7 0.07 46 100 3 0.03
    22 100 5 0.05 47 100 2 0.02
    23 100 4 0.04 48 100 2 0.02
    24 100 5 0.05 49 100 3 0.03
    25 100 7 0.07 50 100 5 0.05
    平均 0.06

    QC検定®2級レベルの問題ですが、一部、QC検定®1級レベルのものもあります。

    (1)(2)は基本問題で、(3)が本記事のメイン問題となります。

    一度は、実際に演習してくださいね。良問ですよ!

    p管理図を作成

    必要な値を計算します。
    ●全体平均\(\bar{p}\)=0.06
    ●LCL=\(\bar{p}\)-3\(\sqrt{\frac{\bar{p}(1-\bar{p})}{n}}\)
    =0.06-3\(\sqrt{\frac{0.06×(1-0.06)}{50}}\)
    =-0.041
    ●UCL=\(\bar{p}\)+3\(\sqrt{\frac{\bar{p}(1-\bar{p})}{n}}\)
    =0.06+3\(\sqrt{\frac{0.06×(1-0.06)}{50}}\)
    =0.161

    p管理図を作成します。

    p管理図

    なお、A,Bの違いがわかるようにp管理図を分けてみます。

    p管理図

    差がありそうですよね!

    AとBの違いを検定しましょう。

    ②正規分布を使った検定統計量で不良率の差の検定を解く

    検定統計量

    教科書に絶対ある式なので、使いこなせてください。

    検定統計量
    u=\(\frac{p_A-p_B}{\sqrt{\bar{p}(1-\bar{p})(\frac{1}{N_A}+\frac{1}{N_B})}}\)

    代入しましょう。各値は、
    ●\(p_A\)=0.0824
    ●\(p_B\)=0.0376
    ●\(\bar{p}\)=0.06
    ●\(N_A\)=2500
    ●\(N_B\)=2500

    よって、検定統計量uは
    u=\(\frac{p_A-p_B}{\sqrt{\bar{p}(1-\bar{p})(\frac{1}{N_A}+\frac{1}{N_B})}}\)
    =\(\frac{0.0824-0.0376}{\sqrt{0.06×(1-0.06)(\frac{1}{2500}+\frac{1}{2500})}}\)
    =6.67

    u=6.67 < 1.96=u(0.05)より
    AとBの不良率に差があると言えるとなります。

    ③χ2乗分布を使った検定統計量で不良率の差の検定を解く

    検定統計量の復習

    教科書の定番である、分割表を使った検定で、χ2乗分布を使います。

    分割表は下表ですね。

    X,Y Y1 Y2
    X1 a b a+b
    x2 c d c+d
    a+c b+d N=a+b+c+d

    ところで、なぜ分割表の検定に、関係なさそうなχ2乗分布を使うのか説明できますか?わからない時は関連記事で確認しましょう。

    【6】分割表(χ2乗分布)に関する検定【QC検定®2級対策】
    QC検定®2級で頻出な、分割表に関する検定と推定の解法を解説します。検定から推定区間まで5分以内に解けるための流れとテクニックについて解説します。

    検定統計量を計算

    今回は、検定統計量を変形したバージョンで解いてみましょう。

    もう一度、分割表を描きます。

    A,B 不良品数 良品数
    A a b a+b
    B c d c+d
    a+c b+d N=a+b+c+d

    検定統計量は、

    検定統計量
    \(χ^2\)=\(\frac{N(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}\)

    各値について分割表に代入して確認します。

    A,B 不良品数 良品数
    A 206 2294 2500
    B 94 2406 2500
    300 4700 5000

    代入しましょう。各値は、
    ●a=206
    ●b=2294
    ●c=94
    ●d=2406
    ●N=5000

    よって、検定統計量は
    \(χ^2\)=\(\frac{N(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}\)
    =\(\frac{5000(206×2406-2294×94)^2}{(206+2294)(94+2406)(206+94)(2294+2406)}\)
    =44.48

    \(χ^2\)=44.48 < 3.81=\(χ^2\)(1,0.05)より
    AとBの不良率に差があると言えるとなります。

    分割表の自由度の導出

    分割表から考える方法

    ここで、分割表にて、自由度が1になる理由も説明できますか?関連記事に書いていますね。

    【6】分割表(χ2乗分布)に関する検定【QC検定®2級対策】
    QC検定®2級で頻出な、分割表に関する検定と推定の解法を解説します。検定から推定区間まで5分以内に解けるための流れとテクニックについて解説します。

    いくつかの解法を使って比較すると理解が深まりますね。

    まとめ

    p管理図で、不良率の差を検定する方法を解説しました。

    • ①不良率の差の検定事例
    • ②正規分布を使った検定統計量で不良率の差の検定を解く
    • ③χ2乗分布を使った検定統計量で不良率の差の検定を解く
  • 【重要】管理図の異常判定ルールは自分で設計すべき(JISに頼るな!)

    【重要】管理図の異常判定ルールは自分で設計すべき(JISに頼るな!)

    本記事のテーマ

    【重要】管理図の異常判定ルールは自分で設計すべき(JISに頼るな!)
    • ①JISZ9020の異常判定ルールは確率で定義している
    • ②確率論で異常判定してよいか?
    • ③異常判定ルールは自分で設計すべし
    「管理図の異常判定ルールがなぜ8種類決まっているのか?」
    「なぜ、一列になって交互に上下する14点があると異常なのか?」など
    をわかりやすく解説!

    大事なのは

    教科書やサイトの内容をそのまま暗記せず、自分で考えてみよう。疑問がわけば、新発見につながる!

    ●Youtube動画でも解説しています。ご確認ください。

    QC・統計に勝てるための「管理図と工程能力指数」問題集を販売します!

    QC検定®1級合格したい方、QCに必要な「管理図と工程能力指数」をしっかり学びたい方におススメです。
    QC検定®1級、2級で「管理図と工程能力指数」の問題で苦戦していませんか?本記事では、QC・統計に勝てるための「管理図と工程能力指数」問題集を紹介します

    ①JISZ9020の異常判定ルールは確率で定義している

    異常判定ルールの紹介

    JISZ9020-2 附属書B 図B-1 突き止められる原因に対する異常判定ルールに、8種類の異常判定ルールがあります。

    No 異常パターン
    1 ゾーンAを超えた1つの点
    2 中心線の片側上ゾーンCの中で
    又はそれを超えて、一列になった9点
    3 一列になって上下方向に増加又は減少する6点
    4 一列になって交互に上下する14点
    5 中心線の片側上ゾーンAの中で
    又はそれを超えて、一列になった3つのうちの2つの点
    6 中心線の片側上のゾーンBの中で
    又はそれを超えて、一列になった5つのうちの4つの点
    7 中心線の上下のゾーンの中で一列になった15点
    8 中心線の両側上で一列になった8つの点で、
    ゾーンCにはない

    教科書に必ず載っていますが、他のサイトにもあります。参考にリンクを入れておきます。

    正規分布を確認

    異常判定の理由を説明する前に、正規分布と各ゾーンの確率を確認しましょう。

    正規分布

    まとめると、
    ●ゾーンAは 68%/2=34%
    ●ゾーンBは 27%/2=13/5%
    ●ゾーンCは 4.5%/2=2.25%
    となります。

    異常判定とする確率の計算と判断基準

    確率が0.5%以下なら、めったに起きないとして異常と判断する
    そうです。。。

    個別に見てきます。

    ①ゾーンAを超えた1つの点

    ⇒確率Prは0.5%以下に1点あるため、異常と判断します。

    ②中心線の片側上ゾーンCの中で
    又はそれを超えて、一列になった9点

    ⇒中心線の片側は上下それぞれあり、それぞれの領域は50%ですから、確率は、
    Pr=2×\((\frac{1}{2})^9\)=\(\frac{1}{256}\)=0.39%
    と低確率なので異常と判断します。

    ③一列になって上下方向に増加又は減少する6点

    ⇒6点が連続して順番に並ぶ確率と考えて、
    Pr=2×\(\frac{1}{6!}\)=0.28%
    と低確率なので異常と判断します。

    ④一列になって交互に上下する14点

    ⇒計算式が不明ですが、何かの14乗に2を書けると確率が0.5%以下なのでしょう。
    低確率なので異常と判断します。

    ⑤中心線の片側上ゾーンAの中で又はそれを超えて、一列になった3つのうちの2つの点

    ⇒Aゾーンに2点ある確率なので、
    Pr=2×\((0.025)^2\) =0.1%
    と低確率なので異常と判断します。

    ⑥中心線の片側上のゾーンBの中で又はそれを超えて、一列になった5つのうちの4つの点

    ⇒5点中4点がBゾーンにあると考えると確率Prは
    Pr=2×\({}_5C_4\)×\((0.135)^4\)=0.16%
    と低確率なので異常と判断します。

    ⑦中心線の上下のゾーンの中で一列になった15点

    ⇒両方のCゾーンに連続して15点ある確率Prは
    Pr=\((0.68)^{15}\)=0.3%
    と低確率なので異常と判断します。

    ⑧中心線の両側上で一列になった8つの点で、ゾーンCにはない

    ⇒両方のCゾーンにない点が8つあるので、確率Prは
    Pr=\((0.32)^8\)=0.01%
    と低確率なので異常と判断します。

    よって、どの場合も確率0.5%以下と、稀なケースなので、「稀なケース=異常」として判定しているようです。場合によっては、点の数を変えても良いでしょう。

    ②確率論で異常判定してよいか?

    「稀なケース=異常」として判定してよいか?

    と疑問に思うはずです。本来は、
    工程に異常となる要因があるから異常と判定するべきで、
    確率論ではないと考えるべきです。

    確率論ではなく、工程異常要因を探るべき

    工程が異常と考えるケースをJISに頼らず自分で考えましょう。次が挙げられます。

    1. 基本は管理限界内にあれば異常ではない
    2. 例外がいくつかある
    3. 例外1:工程に入ってはいけない要因が含まれ、上昇・下降など、途中でばらつき方が明らかに異なるなどが見られる
    4. 例外2:周期的な変動がある
    管理図を作って、JISの異常判定ルールに準拠するだけではなく、管理対象の特性を見て想定しないデータがあれば何が異常の原因かを関係者と考えて協議して改善活動するのがベスト

    ③異常判定ルールは自分で設計すべし

    JISの異常判定ルールの是非を評価

    No 異常パターン 理由 評価
    1 ゾーンAを超えた1つの点 管理限界外
    2 中心線の片側上ゾーンCの中で
    又はそれを超えて、一列になった9点
    低確率 ×
    3 一列になって上下方向に増加又は減少する6点 低確率、工程異常可能性有
    4 一列になって交互に上下する14点 低確率 ×
    5 中心線の片側上ゾーンAの中で
    又はそれを超えて、一列になった3つのうちの2つの点
    低確率 ×
    6 中心線の片側上のゾーンBの中で
    又はそれを超えて、一列になった5つのうちの4つの点
    低確率 ×
    7 中心線の上下のゾーンの中で一列になった15点 低確率 ×
    8 中心線の両側上で一列になった8つの点で、
    ゾーンCにはない
    低確率 ×

    確率が低いから異常という理由は、論理性が低いです。明らかに異常な点や、異常な要因が含まれているもの以外は、管理限界内にあれば、基本正常と判断してもよいでしょう。

    ①ゾーンAを超えた1つの点
    ③一列になって上下方向に増加又は減少する6点
    以外は、正常と判断してもよい。

    自分で考えた異常判定ルールを作るべき

    JISの異常判定ルール①③以外に自分で考えた異常判定ルールを併せましょう。

    ⑨「周期的な異常が含まれる」を追加します。下表が、自分で考えた異常判定ルールとなります。

    No 異常パターン 理由
    1 ゾーンAを超えた1つの点 管理限界外は異常とみなす
    2 一列になって上下方向に
    増加又は減少する6点
    上下傾向から工程異常要因が
    含まれる可能性あり
    9 周期性がある 工程や工程外に予期しない異常が
    含まれる可能性あり

    表の「…」は、実際の管理対象の特性をみながら、個別に異常ルールを追加してください。
    ●顧客要求仕様で異常と判定するもの
    ●トラブル・故障で是正処置した際に追加したルール
    などから判定ルールが追加するはずです。

    JISの異常判定ルールの理由を理解し、
    あなたが必要とする異常判定ルールを考えて管理図を使ってください。

    まとめ

    管理図の異常判定ルールを自分で考える重要さを解説しました。

    • ①JISZ9020の異常判定ルールは確率で定義している
    • ②確率論で異常判定してよいか?
    • ③異常判定ルールは自分で設計すべし
  • 【必読】X-Rs管理図が作れる

    【必読】X-Rs管理図が作れる

    本記事のテーマ

    【必読】X-Rs管理図が作れる
    • ①X-Rs管理図用データで考える
    • ②管理限界の係数の導出
    • ③範囲Rsの求め方
    • ④管理限界の求め方
    • ⑤工程管理の確認の仕方
    X-Rs管理図は珍しいけど、過去のQC検定®1級で出題されるとみんなノーマークだから撃沈しますね。なので、ブログで解説します。必読です。

    QC・統計に勝てるための「管理図と工程能力指数」問題集を販売します!

    QC検定®1級合格したい方、QCに必要な「管理図と工程能力指数」をしっかり学びたい方におススメです。
    QC検定®1級、2級で「管理図と工程能力指数」の問題で苦戦していませんか?本記事では、QC・統計に勝てるための「管理図と工程能力指数」問題集を紹介します

    ●商標使用について、
    ①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
    ➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
    ➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

    ①X-Rs管理図用データで考える

    実際のデータを使いながら、X-Rs管理図を作ってみましょう。

    No X Rs No X Rs
    1 31.72 ?? 11 32.43 ??
    2 33.26 ?? 12 32.53 ??
    3 33.42 ?? 13 32.46 ??
    4 32.22 ?? 14 32 ??
    5 32.59 ?? 15 32.71 ??
    6 31.75 ?? 16 31 ??
    7 31.86 ?? 17 30.33 ??
    8 31.37 ?? 18 31.15 ??
    9 31.27 ?? 19 33.41 ??
    10 32.45 ?? 20 30.07 ??
    合計 640 ??
    平均 32 ??

    ②管理限界の係数の導出

    管理限界の係数については、関連記事にまとめていますので、確認ください。

    【重要】管理図(計量値)の変数の導出がわかる
    シューハートの管理図の計量値の各係数表の求め方を解説します。A,B,D,d2とかいっぱい変数がありますが、すべて期待値±倍数×標準偏差で表記できます。

    X管理図はA3,R管理図はD3,D4を使う

    X管理図はA3(n=2)

    X管理図はおもに、A1,A2,A3の係数があります。

    ●A=\(\frac{k}{\sqrt{n}}\)
    ●\(A_2\)=\(\frac{k}{d_2 \sqrt{n}}\)
    ●\(A_3\)=\(\frac{k}{c_4 \sqrt{n}}\)

    X管理図では、1つのデータしかないので、範囲Rから算出する\(d_2\)ではなく、標準偏差sから算出する\(c_4\)を使います。JISZ9020に準拠します。

    また、データは1つしかありませんが、n=2のときのA3の値を使います。その理由は完全にはわかりませんが、1に近い2だからでしょうか?

    X管理図はA3(n=2)
    ●\(A_3\)=\(\frac{k}{c_4 \sqrt{n}}\)
    =2.659

    Rs管理図はD3,D4 (n=2)

    Rs管理図では、管理限界を\(\bar{R}\)の定数倍として表現したいため、係数はD3,D4を使います。なお、係数DについてはD1~D4がありますが、比で表現したD3,D4を使います。

    ●\(D_1\)=\(max(0,d_2-kd_3)\)
    ●\(D_2\)=\(d_2+kd_3\)
    ●\(D_3\)=\(max(0,1-\frac{kd_3}{d_2})\)
    ●\(D_4\)=\(1+\frac{kd_3}{d_2}\)

    ただし、D3は負になる場合があるため、0と大きい方を使います。サンプル数nが6以上でD3が正になります。よって、D3は使わないとします。実際はD3=0です

    また、データは1つしかありませんが、n=2のときのD3, D4の値を使います。その理由は完全にはわかりませんが、1に近い2だからでしょうか?

    Rs管理図はD3,D4(n=2)
    ●\(D_3\)=\(max(0,1-\frac{kd_3}{d_2})\)
    =0(なし)
    ●\(D_4\)=\(1+\frac{kd_3}{d_2}\)
    =3.267(n=2)

    ③範囲Rsの求め方

    他のR管理図と異なる求め方になる点が注意です。

    Rsの定義

    X管理図ではデータが1つしかないため、群内で範囲Rを計算するとデータがないため、R=0になってしまう。そこで、前後の差(絶対値)をRsとして定義する。
    Rs=|x(n)-x(n-1)|
    とする。

    Rsを計算する。

    先ほどのデータで、
    Rs=|x(n)-x(n-1)|
    から求めてみましょう。

    No X Rs No X Rs
    1 31.72 11 32.43 0.02
    2 33.26 1.54 12 32.53 0.1
    3 33.42 0.16 13 32.46 0.07
    4 32.22 1.2 14 32 0.46
    5 32.59 0.37 15 32.71 0.71
    6 31.75 0.84 16 31 1.71
    7 31.86 0.11 17 30.33 0.67
    8 31.37 0.49 18 31.15 0.82
    9 31.27 0.1 19 33.41 2.26
    10 32.45 1.18 20 30.07 3.34
    合計 640 16.15
    平均 32 0.85

    ●ここで、Rsの具体的な算出方法を確認します。
    Rs(1)=|X(1)-X(0)|=なし(X(0)がないのでRs(1)=0ではなく、「Rs(0)=無し」とします。

    Rs(2)=|X(2)-X(1)|=|33.26-31.72|=1.54

    Rs(19)=|X(20)-X(19)|=|30.07-33.41|=3.34
    Rsのデータは19個

    ③管理限界の求め方

    X管理図について

    ●平均\(\bar{X}\)は32
    ●LCL,UCLは\(\bar{X}\)±2.659\(\bar{R_s}\)
    =32±2.659×0.85
    より、
    LCL=29.74
    UCL=34.26

    Rs管理図について

    ●平均\(\bar{R_s}\)は0.85
    ●LCLは0(無し)
    ●UCLは3.267\(\bar{R_s}\)
    =3.267×0.85
    =2.777

    ④工程管理の確認の仕方

    管理図を図示

    X管理図

    X-Rs管理図

    Rs管理図

    X-Rs管理図

    工程管理の分析結果

    Rs管理図を見ると1点工程異常な点があります。工程異常とするか、第1種の誤りの範囲とするかは関係者で協議する必要があるます。

    まとめ

    X-Rs管理図の作り方について、解説しました。

    • ①X-Rs管理図用データで考える
    • ②管理限界の係数の導出
    • ③範囲Rsの求め方
    • ④管理限界の求め方
    • ⑤工程管理の確認の仕方
  • 【必読】管理図の第1種の誤りと第2種の誤り(検出力)がわかる

    【必読】管理図の第1種の誤りと第2種の誤り(検出力)がわかる

    本記事のテーマ

    【必読】管理図の第1種の誤りと第2種の誤り(検出力)がわかる
    • ①工程が変化した場合に注意する
    • ②第1種の誤りと管理図の関係
    • ③第2種の誤り&検出力と管理図の関係
    • ④誤りと検出力を計算する演習問題
    「第1種の誤り、第2種の誤りと管理図の関係」、「工程変化によって管理図から不良確率を求める方法」を詳しく解説します!

    QC・統計に勝てるための「管理図と工程能力指数」問題集を販売します!

    QC検定®1級合格したい方、QCに必要な「管理図と工程能力指数」をしっかり学びたい方におススメです。
    QC検定®1級、2級で「管理図と工程能力指数」の問題で苦戦していませんか?本記事では、QC・統計に勝てるための「管理図と工程能力指数」問題集を紹介します

    ●You tube動画でも解説しています。ご覧ください。

    ●商標使用について、
    ①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
    ➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
    ➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

    ①工程が変化した場合に注意する

    2点注意しましょう。

      工程平均がシフトした場合
    1. 工程ばらつきが変化(特に増大)した場合

    工程変化によって、管理限界を超える不良が増大する点に注意すればOKです。図で理解しましょう。

    工程平均がシフトした場合

    管理図

    工程ばらつきが増大した場合

    管理図

    ②第1種の誤りと管理図の関係

    第1種の誤り(生産者危険)とは?

    復習になりますが、検定と推定や抜取検査でも出て来るので、再度確認しましょう。
    関連記事でも確認しましょう。

    第1種の誤り(生産者危険)とは、
    工程は異常がないのに、管理図で異常点が発見され、異常と誤判断する確率

    第1種の誤り(生産者危険)と管理図について

    図で説明します。

    管理図

    図のとおり、工程自体は安定で問題ないのですが、わずかな確率でも管理限界外な点をとることがあります。管理図で異常となったからとして、すぐに工程を見直すのではなく、そのデータの確からしさを吟味する必要があります。

    なお、管理限界を3σとする正規分布で仮定する場合、第1種の誤りとなる確率は0.26%(Kp=3のとき、p=0.13%)です。

    ③第2種の誤りと管理図の関係

    第2種の誤り(消費者危険)とは?

    復習になりますが、検定と推定や抜取検査でも出て来るので、再度確認しましょう。
    関連記事でも確認しましょう。

    第2種の誤り(消費者危険)とは、
    工程に異常(改善が必要)なのに、管理図で異常がみられず、正常と誤判断する確率

    第2種の誤り(消費者危険)と管理図について

    図で説明します。

    管理図

    図のとおり、工程自体は問題なのですが、管理図でチェックして異常でないことがわかります。異常を検知できないリスクとなります。

    図の注意点

    第2種の誤り(消費者危険)(β)と検出力(1-β)の図が教科書と逆にしています。

    教科書では、
    ●管理限界外の領域を検出力1-β
    ●管理限界内の領域を第2種の誤り(消費者危険)(β)
    としています。

    しかし、第2種の誤り(消費者危険)(β)や検出力(1-β)は検定と推定、抜取検査などにも出る概念で、それらと整合性を取ると逆になると考えます。

    検出力

    母平均の検定における棄却域をグラフで描くと、
    管理限界外:第2種の誤り(消費者危険)(β)
    管理限界内:検出力(1-β)
    です。

    第2種の誤り(消費者危険)(β)と検出力(1-β)の図が教科書と逆にしています。
    どちらか正解かではなく、どちらを正にするかはよく考える必要があります。

    ④誤りと検出力を計算する演習問題

    以下の問いを例に解いてみましょう。QC検定®1級の頻出問題なので、必読です。

    1. 工程平均μが変化した場合の管理限界外となる確率の計算
    2. 工程ばらつきσが変化した場合の管理限界外となる確率の計算
    3. 工程変化した場合の検出力の計算

    例題

    ある工場では、製品Zの出荷検査に、ある品質特性Xのデータを測っている。毎日管理図でXのデータを管理している。1日のデータ数がn=6である。データは正規分布に従うと仮定し、管理限界線は平均±3σとしている。
    (1)工程が変化しない場合、第1種の誤りとなる確率はいくらか。
    (2)工程平均が0.4σ大きくなった場合、管理図で管理限界線を超える(異常となる)確率と、検出力はそれぞれいくらか。
    (3)工程ばらつきがσ⇒1.2σと大きくなった場合、管理図で管理限界線を超える(異常となる)確率と、検出力はそれぞれいくらか。

    例題の解説

    (1)

    ●上下の管理限界線を超える確率を求めます。
    平均を中心とした対称性がある分布なので、
    上側の確率の2倍でよいです。

    上側の確率はKp=3の時の確率です。
    正規分布表でKp=3のときは、p=0.13%です。
    よって、答えは0.26%です。

    管理図

    (2)

    ●検定統計量Kp=\(\frac{\bar{x}-μ}{σ/\sqrt{n}}\)を考えます。
    もともと3σで管理限界を設けていますので、
    Kp=3,\(\bar{x}\)=UCLまたはLCL,μは平均として、
    検定統計量Kp=3=\(\frac{\bar{x}-μ}{σ/\sqrt{n}}\)が成り立っています。

    そこに、工程平均が0.4σ大きくなったので、式を追加します。
    検定統計量Kp’=\(\frac{\bar{x}-(μ+0.4σ)}{σ/\sqrt{n}}\)
    =\(\frac{\bar{x}-(μ)}{σ/\sqrt{n}}\)-\(\frac{0.4σ}{σ/\sqrt{n}}\)
    となり、
    Kp’=\(\frac{\bar{x}-(μ)}{σ/\sqrt{n}}\)-0.4\(\sqrt{n}\)
    =3-0.4\(\sqrt{6}\)
    =2.02となります。
    この式はQC検定®1級攻略に必須な式です。

    工程が上側にシフトしたので、下側の確率は0として無視します。

    管理図

    Kp=2.02となる確率は正規分布表からP=0.0217(2.1%)⇒第2種の誤り。
    検出力は1-β=1-0.0217=0.9783(97.8%)

    (3)

    ●(2)と同様に
    検定統計量Kp=3=\(\frac{\bar{x}-μ}{σ/\sqrt{n}}\)が成り立っています。

    そこに、工程ばらつきが1.2倍大きくなったので、式を追加します。
    検定統計量Kp’=\(\frac{\bar{x}-(μ)}{1.2σ/\sqrt{n}}\)
    =Kp/1.2=3/1.2
    =2.5となります。

    異常確率は管理限界の上下の両側を求めます。

    管理図

    Kp=2.5となる確率は正規分布表からP=0.0062(0.62%)
    確率は2倍してP=0.0124(1.24%))⇒第2種の誤り。
    検出力は1-β=1-0.0124=0.99876(99.9%)

    管理図で、工程の平均やばらつきが変化した場合も、落ち着いて、管理限界となる確率が計算できますね。

    まとめ

    管理図における第1種の誤りと第2種の誤りについて、解説しました。

    • ①工程が変化した場合に注意する
    • ②第1種の誤りと管理図の関係
    • ③第2種の誤り&検出力と管理図の関係
    • ④誤りと検出力を計算する演習問題
  • 【必読】管理図の分散σ(x)とσ(xbar)の違いがわかる(群内変動と群間変動)

    【必読】管理図の分散σ(x)とσ(xbar)の違いがわかる(群内変動と群間変動)

    本記事のテーマ

    【必読】管理図の群内変動と群間変動の分散公式がわかる
    • ①群内変動、群間変動の分散を計算してみる
    • ②群内変動、群間変動\(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)の証明
    • ③群内変動、群間変動\(\frac{σ_w^2}{n}\)+\(σ_b^2\)を\(σ_\bar{x}^2\)とする。

    本記事の結論

    ●\(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)は正しく導出できる。
    ●\(σ_\bar{x^2}\)=\(\frac{σ_w^2}{n}\)+\(σ_b^2\)は導出できず、(右辺)の合計を(左辺)と定義しただけ。
    本記事を読んで、実験計画法と平方和の分解に慣れてください。

    QC・統計に勝てるための「管理図と工程能力指数」問題集を販売します!

    QC検定®1級合格したい方、QCに必要な「管理図と工程能力指数」をしっかり学びたい方におススメです。
    QC検定®1級、2級で「管理図と工程能力指数」の問題で苦戦していませんか?本記事では、QC・統計に勝てるための「管理図と工程能力指数」問題集を紹介します

    ①群内変動、群間変動の分散を計算してみる

    例題

    下表には、縦列(群内)、横列(群間)としてデータを並べている。
    ①全体の分散\(σ_x^2\)を求めよ。
    ②群内変動の分散\(σ_w^2\)を求めよ。
    ③群間変動の分散\(σ_b^2\)を求めよ。
    ④分散\(σ_\bar{x}^2\)を求めよ。
    群内j/群間i i=1 i=2 i=3 i=4 i=5 i=6
    j=1 18 14 18 12 15 13
    j=2 15 10 14 16 14 12
    j=3 14 19 18 18 13 16
    j=4 13 11 17 10 16 19
    j=5 14 16 11 13 18 14
    平均\(\bar{x_{i・}}\) 14.8 14 15.6 13.8 15.2 14.8
    総平均\(\bar{\bar{x}}\) 14.7

    ●平方和の計算大丈夫でしょうか?
    不安な方は関連記事で確認しましょう。

    平方和の関連記事

    平方和 【簡単】統計学最初の関門「平方和」がマスターできる【初心者向け】
    平方和の式の意味、公式変形やデータ変換と平方和の関係をわかりやすく解説します!

    実験計画法の関連記事

    実験計画法 【まとめ】究める!実験計画法
    多元配置実験、乱塊法、分割法、直交表など多くの手法をデータの構造式だけですべて導出できる実験計画法を解説!

    では、解いていきます。

    文字の定義

    ●\(x_{ij}\):各値
    ●\(\bar{x_{i・}}\):各群の平均値
    ●\(\bar{\bar{x}}\):全平均

    あとで証明しますが、
    \(x_{ij}\)-\(\bar{\bar{x}}\)=(\(\bar{x_{i・}}\)-\(\bar{\bar{x}}\))+(\(x_{ij}\)-\(\bar{x_{i・}}\))
    として、各々の2乗和を取ると、
    \(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{\bar{x}})^2\)=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\) (\(\bar{x_{i・}}\)-\(\bar{\bar{x}})^2\)+\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)(\(x_{ij}-\bar{x_{i・}})^2\)
    が成り立ちます。

    ●\(x_{ij}\)-\(\bar{\bar{x}}\)
    ●(\(\bar{x_{i・}}\)-\(\bar{\bar{x}}\))
    ●(\(x_{ij}\)-\(\bar{x_{i・}}\))
    についての平方和を算出します。

    それぞれの平方和の計算

    ①全体の分散\(σ_x^2\)

    平方和S
    =\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{\bar{x}})^2\)
    =\((18-14.7)^2\)+…+\((14-14.7)^2\)
    =204.3
    ★よって、分散\(σ_x^2\)は、
    \(σ_x^2\)=S/30=6.81

    ②群内変動の分散\(σ_w^2\)

    平方和S
    =\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)(\(x_{ij}-\bar{x_{i・}})^2\)
    =\((18-14.8)^2\)+…+\((14-14.8)^2\)
    =192.4
    ★よって、分散\(σ_w^2\)は、
    \(σ_w^2\)=S/30=6.41

    ③群間変動の分散\(σ_b^2\)

    平方和S
    =\(\sum_{i=1}^{a}\sum_{j=1}^{b}\) (\(\bar{x_{i・}}\)-\(\bar{\bar{X}})^2\)
    =\((14.8-14.7)^2\)+…+\((14.8-14.7)^2\)
    =11.9
    ★よって、分散\(σ_b^2\)は、
    \(σ_b^2\)=S/30=0.40

    ここで、確かに、
    \(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)
    6.81=6.41+0.40
    が成立しています。

    ④分散\(σ_\bar{x}^2\)

    平方和Sが定義できないですが、公式
    \(σ_\bar{x}^2\)=\(\frac{σ_w^2}{n}\)+\(σ_b^2\)
    から計算します。

    \(σ_\bar{x}^2\)=\(\frac{σ_w^2}{n}\)+\(σ_b^2\)
    =6.41/5+0.40=1.68

    \(σ_\bar{x}^2\)=\(\frac{σ_w^2}{n}\)+\(σ_b^2\)
    は数学的に証明して出た公式ではなく、
    \(\frac{σ_w^2}{n}\)+\(σ_b^2\)を\(σ_\bar{x}^2\)と
    としてみたら、\(\bar{x}\)の分散は\(σ_x /n\)的になるとしたようです。

    具体例を計算したので、公式を数学的に証明します。

    ②群内変動、群間変動\(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)の証明

    ここで慣れてほしい計算を列挙します。

    1. データの構造式\(x_{ij}\),\(\bar{x_{i・}}\),\(\bar{\bar{x}}\)に慣れること
    2. データの構造式の2乗和をΣを使って展開すること
    3. 実験計画法と平方和の分解に慣れること
    群内と群間の分散の分け方・計算は
    ●サンプリング
    ●管理図
    ●実験計画法
    ●回帰分析
    で必ず出ます。品質管理上級を目指すには必須なスキルです。

    証明の流れ

    1. データの構造式を作る(実験計画法と同じ)
    2. 平方和を分解(全体=部分の合計)の式を作る
    3. 2乗和では「互いの積和=0」を狙う
    4. 平方和/データ数=分散に直す

    データの構造式を作る(実験計画法と同じ)

    すでに書きましたが、データ\(x_{ij}\)は群間方向\(i\)と群内方向\(j\)に分かれます。

    ●\(x_{ij}\):各値
    ●\(\bar{x_{i・}}\):各群の平均値
    ●\(\bar{\bar{x}}\):全平均
    と定義して、データの構造式を作ります。

    ●データの構造式
    \(x_{ij}\)-\(\bar{\bar{x}}\)=(\(\bar{x_{i・}}\)-\(\bar{\bar{x}}\))+(\(x_{ij}\)-\(\bar{x_{i・}}\))

    平方和を分解(全体=部分の合計)の式を作る

    機械的にデータの構造式の両辺に\(\sum_{i=1}^{a}\sum_{j=1}^{b}(●-〇)^2\)の形を取ります。

    \(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{\bar{x}})^2\)=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\) (\((\bar{x_{i・}}\)-\(\bar{\bar{x}})\)+\((x_{ij}-\bar{x_{i・}}))^2\)

    (右辺)を展開します。
    (右辺)
    =\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)
    \(((\bar{x_{i・}}-\bar{\bar{x}})^2\)
    +\(2(\bar{x_{i・}}-\bar{\bar{x}})(x_{ij}-\bar{x_{i・}})\)
    +\((x_{ij}-\bar{x_{i・}})^2)\)

    2乗和では「互いの積和=0」を狙う

    次に、第2項に注目します。

    第2項
    =\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((\bar{x_{i・}}-\bar{\bar{x}})(x_{ij}-\bar{x_{i・}})\)
    実際にΣの中身を書き出してみましょう。これも慣れてください。

    ●第2項
    =[\((x_{11}-\bar{x_{1・}}\))+…+\((x_{1b}-\bar{x_{1・}}\))]\((\bar{x_{1・}}-\bar{\bar{x}})\)
    +[\((x_{21}-\bar{x_{2・}}\))+…+\((x_{2b}-\bar{x_{2・}}\))]\((\bar{x_{2・}}-\bar{\bar{x}})\)

    +[\((x_{a1}-\bar{x_{a・}}\))+…+\((x_{ab}-\bar{x_{a・}}\))]\((\bar{x_{a・}}-\bar{\bar{x}})\)

    ここで、[]の長~い式をじっくり見ると、すべての\(i\)について
    (\(x_{i1}+ x_{i2}+…+ x_{ib}\))-b(\(\bar{x_{i・}}\))
    となります。この式をよーく見ると、
    (合計)―(個数)×(平均)
    です。これは0になりますね。

    よって(右辺)は、
    (右辺)
    =\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)
    \(((\bar{x_{i・}}-\bar{\bar{x}})^2\)+\((x_{ij}-\bar{x_{i・}})^2)\)
    となります。

    平方和/データ数=分散に直す

    平方和の式を再掲します。

    \(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{\bar{x}})^2\)
    =\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((\bar{x_{i・}}-\bar{\bar{x}})^2\)+\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{x_{i・}})^2\)

    両辺をabで割ります

    \(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{\bar{x}})^2\)
    =\(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((\bar{x_{i・}}-\bar{\bar{x}})^2\)+\(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{x_{i・}})^2\)

    ●(左辺)はまさに、\(σ_x^2\)ですね。つまり、
    \(σ_x^2\)=\(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{\bar{x}})^2\)

    ●(右辺)の第1項を少し変形します。
    実は、Σの中の変数は\(i\)しかありません。つまり、
    \(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((\bar{x_{i・}}-\bar{\bar{x}})^2\)
    =\(\frac{b}{ab}\)\(\sum_{i=1}^{a}\)\((\bar{x_{i・}}-\bar{\bar{x}})^2\)
    =\(\frac{1}{a}\)\(\sum_{i=1}^{a}\)\((\bar{x_{i・}}-\bar{\bar{x}})^2\)
    と変形できます。これって、
    群間変動の分散\(σ_b^2\)となります。わかりますか?じっくり見ましょう。

    ●(右辺)の第2項を考えます。
    単純に、
    群内変動の分散\(σ_w^2\)
    =\(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{x_{i・}})^2\)
    としてもいいのですが、各群\(i\)の群内は変数\(j\)で表現できます。

    ここで変数\(i\)によらず、群内分散は等しいと仮定すると、
    \(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{x_{i・}})^2\)
    =\(\frac{a}{ab}\)\(\sum_{j=1}^{b}\)\((x_{ij}-\bar{x_{i・}})^2\)
    =\(\frac{1}{b}\)\(\sum_{j=1}^{b}\)\((x_{ij}-\bar{x_{i・}})^2\)
    =\(σ_w^2\)
    と見やすくなります。

    まとめると、
    ●平方和の分解が成り立ち、
    ●個数で割ると、
    \(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)
    が成り立ちます。
    数学的に証明できたので、納得できますね。

    ③群内変動、群間変動\(\frac{σ_w^2}{n}\)+\(σ_b^2\)を\(σ_\bar{x}^2\)とする。

    \(σ_\bar{x}^2\)は何者か?わからない

    もともと数学的には、次の等式が成立して、
    \(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{\bar{x}})^2\)
    =\(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((\bar{x_{i・}}-\bar{\bar{x}})^2\)+\(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{x_{i・}})^2\)
    から
    \(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)
    の関係が成り立ちます。

    さて、\(σ_x^2\)ではなく、\(σ_\bar{x}^2\)とした場合、
    データの構造式を立てて、平方和の分解から分散公式の導出がうまくできません。

    平均\(\bar{x}\)の分散を普通に考えると、
    \(\bar{X}\)管理図から、平均\(\bar{x}\)と全体の平均\(\bar{\bar{X}}\)
    の差をイメージする。
    でもこれは、群間分散になる。

    数学を使って、
    \(σ_\bar{x}^2\)=\(\frac{σ_w^2}{n}\)+\(σ_b^2\)
    を証明しようとしてもうまくいきません。

    数学的には成り立たないので、あえて定義したものととらえる

    \(\frac{σ_w^2}{n}\)+\(σ_b^2\)の和を\(σ_\bar{x}^2\)と定義したものと考える方がよいでしょう。

    ●先の例題をみると、
    ●\(σ_w^2\)=6.41
    ●\(σ_b^2\)=0.40
    ●\(σ_x^2\)
    =\(σ_w^2\)+\(σ_b^2\)=6.81
    ●\(σ_\bar{x}^2\)
    =\(\frac{σ_w^2}{n}\)+\(σ_b^2\)
    =6.41/5+0.40=1.68

    変数xの分散が少ないという意味で、変数\(\bar{x}\)の分散を作っているのです。
    ただし、
    \(σ_\bar{x}^2\)=\(\frac{σ_w^2}{n}\)+\(σ_b^2\)
    を数学的に証明されていませんので、注意が必要です。
    この式を暗記する意味は無いでしょう。

    まとめると

    ●\(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)は数学的に証明できる。正しい。
    〇\(σ_\bar{x}^2\)=\(\frac{σ_w^2}{n}\)+\(σ_b^2\)は数学的に証明されていない、慣習的な式。

    私は、数学的に証明された正しい、
    ●\(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)
    を使うべきと考えます。

    公式の丸暗記ではなく、公式を導出してその意味を理解して使いこなしましょう。

    まとめ

    群内変動、群間変動の分散の導出について、解説しました。

    • ①群内変動、群間変動の分散を計算してみる
    • ②群内変動、群間変動\(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)の証明
    • ③群内変動、群間変動\(\frac{σ_w^2}{n}\)+\(σ_b^2\)を\(σ_\bar{x}^2\)とする。
  • error: Content is protected !!