【必読】管理図の分散σ(x)とσ(xbar)の違いがわかる(群内変動と群間変動)
「\(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)の導出がわからない」、「\(σ_\bar{x}^2\)=\(\frac{σ_w^2}{n}\)+\(σ_b^2\)の導出がわからない」と困っていませんか?
こういう疑問に答えます。
本記事のテーマ
本記事の結論
●\(σ_\bar{x^2}\)=\(\frac{σ_w^2}{n}\)+\(σ_b^2\)は導出できず、(右辺)の合計を(左辺)と定義しただけ。
本記事のテーマ
- ①群内変動、群間変動の分散を計算してみる
- ②群内変動、群間変動\(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)の証明
- ③群内変動、群間変動\(\frac{σ_w^2}{n}\)+\(σ_b^2\)を\(σ_\bar{x}^2\)とする。
記事の信頼性
記事を書いている私は、管理図の係数表、群内変動・群間変動の解き方に疑問が残りました。そこで、管理図の理論を研究しました。その成果をブログで解説します。
①群内変動、群間変動の分散を計算してみる
データを用意
例題
①全体の分散\(σ_x^2\)を求めよ。
②群内変動の分散\(σ_w^2\)を求めよ。
③群間変動の分散\(σ_b^2\)を求めよ。
④分散\(σ_\bar{x}^2\)を求めよ。
群内j/群間i | i=1 | i=2 | i=3 | i=4 | i=5 | i=6 |
j=1 | 18 | 14 | 18 | 12 | 15 | 13 |
j=2 | 15 | 10 | 14 | 16 | 14 | 12 |
j=3 | 14 | 19 | 18 | 18 | 13 | 16 |
j=4 | 13 | 11 | 17 | 10 | 16 | 19 |
j=5 | 14 | 16 | 11 | 13 | 18 | 14 |
平均\(\bar{x_{i・}}\) | 14.8 | 14 | 15.6 | 13.8 | 15.2 | 14.8 |
– | – | – | – | – | 総平均\(\bar{\bar{x}}\) | 14.7 |
●平方和の計算大丈夫でしょうか?
不安な方は関連記事で確認しましょう。
【簡単】統計学最初の関門「平方和」がマスターできる【初心者向け】
【まとめ4】実験計画法は平方和の分解が重要である
では、解いていきます。
文字の定義
●\(x_{ij}\):各値
●\(\bar{x_{i・}}\):各群の平均値
●\(\bar{\bar{x}}\):全平均
あとで証明しますが、
\(x_{ij}\)-\(\bar{\bar{x}}\)=(\(\bar{x_{i・}}\)-\(\bar{\bar{x}}\))+(\(x_{ij}\)-\(\bar{x_{i・}}\))
として、各々の2乗和を取ると、
\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{\bar{x}})^2\)=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\) (\(\bar{x_{i・}}\)-\(\bar{\bar{x}})^2\)+\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)(\(x_{ij}-\bar{x_{i・}})^2\)
が成り立ちます。
●\(x_{ij}\)-\(\bar{\bar{x}}\)
●(\(\bar{x_{i・}}\)-\(\bar{\bar{x}}\))
●(\(x_{ij}\)-\(\bar{x_{i・}}\))
についての平方和を算出します。
それぞれの平方和の計算
●①全体の分散\(σ_x^2\)
平方和S
=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{\bar{x}})^2\)
=\((18-14.7)^2\)+…+\((14-14.7)^2\)
=204.3
★よって、分散\(σ_x^2\)は、
\(σ_x^2\)=S/30=6.81
●②群内変動の分散\(σ_w^2\)
平方和S
=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)(\(x_{ij}-\bar{x_{i・}})^2\)
=\((18-14.8)^2\)+…+\((14-14.8)^2\)
=192.4
★よって、分散\(σ_w^2\)は、
\(σ_w^2\)=S/30=6.41
●③群間変動の分散\(σ_b^2\)
平方和S
=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\) (\(\bar{x_{i・}}\)-\(\bar{\bar{X}})^2\)
=\((14.8-14.7)^2\)+…+\((14.8-14.7)^2\)
=11.9
★よって、分散\(σ_b^2\)は、
\(σ_b^2\)=S/30=0.40
\(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)
6.81=6.41+0.40
が成立しています。
●④分散\(σ_\bar{x}^2\)
平方和Sが定義できないですが、公式
\(σ_\bar{x}^2\)=\(\frac{σ_w^2}{n}\)+\(σ_b^2\)
から計算します。
\(σ_\bar{x}^2\)=\(\frac{σ_w^2}{n}\)+\(σ_b^2\)
=6.41/5+0.40=1.68
は数学的に証明して出た公式ではなく、
\(\frac{σ_w^2}{n}\)+\(σ_b^2\)を\(σ_\bar{x}^2\)と
としてみたら、\(\bar{x}\)の分散は\(σ_x /n\)的になるとしたようです。
具体例を計算したので、公式を数学的に証明します。
②群内変動、群間変動\(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)の証明
ここで慣れてほしい計算を列挙します。
- データの構造式\(x_{ij}\),\(\bar{x_{i・}}\),\(\bar{\bar{x}}\)に慣れること
- データの構造式の2乗和をΣを使って展開すること
- 実験計画法と平方和の分解に慣れること
●サンプリング
●管理図
●実験計画法
●回帰分析
で必ず出ます。品質管理上級を目指すには必須なスキルです。
証明の流れ
- データの構造式を作る(実験計画法と同じ)
- 平方和を分解(全体=部分の合計)の式を作る
- 2乗和では「互いの積和=0」を狙う
- 平方和/データ数=分散に直す
データの構造式を作る(実験計画法と同じ)
すでに書きましたが、データ\(x_{ij}\)は群間方向\(i\)と群内方向\(j\)に分かれます。
●\(x_{ij}\):各値
●\(\bar{x_{i・}}\):各群の平均値
●\(\bar{\bar{x}}\):全平均
と定義して、データの構造式を作ります。
●データの構造式
\(x_{ij}\)-\(\bar{\bar{x}}\)=(\(\bar{x_{i・}}\)-\(\bar{\bar{x}}\))+(\(x_{ij}\)-\(\bar{x_{i・}}\))
平方和を分解(全体=部分の合計)の式を作る
機械的にデータの構造式の両辺に\(\sum_{i=1}^{a}\sum_{j=1}^{b}(●-〇)^2\)の形を取ります。
\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{\bar{x}})^2\)=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\) (\((\bar{x_{i・}}\)-\(\bar{\bar{x}})\)+\((x_{ij}-\bar{x_{i・}}))^2\)
(右辺)を展開します。
(右辺)
=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)
\(((\bar{x_{i・}}-\bar{\bar{x}})^2\)
+\(2(\bar{x_{i・}}-\bar{\bar{x}})(x_{ij}-\bar{x_{i・}})\)
+\((x_{ij}-\bar{x_{i・}})^2)\)
2乗和では「互いの積和=0」を狙う
次に、第2項に注目します。
第2項
=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((\bar{x_{i・}}-\bar{\bar{x}})(x_{ij}-\bar{x_{i・}})\)
実際にΣの中身を書き出してみましょう。これも慣れてください。
●第2項
=[\((x_{11}-\bar{x_{1・}}\))+…+\((x_{1b}-\bar{x_{1・}}\))]\((\bar{x_{1・}}-\bar{\bar{x}})\)
+[\((x_{21}-\bar{x_{2・}}\))+…+\((x_{2b}-\bar{x_{2・}}\))]\((\bar{x_{2・}}-\bar{\bar{x}})\)
…
+[\((x_{a1}-\bar{x_{a・}}\))+…+\((x_{ab}-\bar{x_{a・}}\))]\((\bar{x_{a・}}-\bar{\bar{x}})\)
ここで、[]の長~い式をじっくり見ると、すべての\(i\)について
(\(x_{i1}+ x_{i2}+…+ x_{ib}\))-b(\(\bar{x_{i・}}\))
となります。この式をよーく見ると、
(合計)―(個数)×(平均)
です。これは0になりますね。
よって(右辺)は、
(右辺)
=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)
\(((\bar{x_{i・}}-\bar{\bar{x}})^2\)+\((x_{ij}-\bar{x_{i・}})^2)\)
となります。
平方和/データ数=分散に直す
平方和の式を再掲します。
\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{\bar{x}})^2\)
=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((\bar{x_{i・}}-\bar{\bar{x}})^2\)+\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{x_{i・}})^2\)
両辺をabで割ります
\(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{\bar{x}})^2\)
=\(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((\bar{x_{i・}}-\bar{\bar{x}})^2\)+\(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{x_{i・}})^2\)
●(左辺)はまさに、\(σ_x^2\)ですね。つまり、
\(σ_x^2\)=\(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{\bar{x}})^2\)
●(右辺)の第1項を少し変形します。
実は、Σの中の変数は\(i\)しかありません。つまり、
\(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((\bar{x_{i・}}-\bar{\bar{x}})^2\)
=\(\frac{b}{ab}\)\(\sum_{i=1}^{a}\)\((\bar{x_{i・}}-\bar{\bar{x}})^2\)
=\(\frac{1}{a}\)\(\sum_{i=1}^{a}\)\((\bar{x_{i・}}-\bar{\bar{x}})^2\)
と変形できます。これって、
群間変動の分散\(σ_b^2\)となります。わかりますか?じっくり見ましょう。
●(右辺)の第2項を考えます。
単純に、
群内変動の分散\(σ_w^2\)
=\(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{x_{i・}})^2\)
としてもいいのですが、各群\(i\)の群内は変数\(j\)で表現できます。
ここで変数\(i\)によらず、群内分散は等しいと仮定すると、
\(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{x_{i・}})^2\)
=\(\frac{a}{ab}\)\(\sum_{j=1}^{b}\)\((x_{ij}-\bar{x_{i・}})^2\)
=\(\frac{1}{b}\)\(\sum_{j=1}^{b}\)\((x_{ij}-\bar{x_{i・}})^2\)
=\(σ_w^2\)
と見やすくなります。
●平方和の分解が成り立ち、
●個数で割ると、
\(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)
が成り立ちます。
③群内変動、群間変動\(\frac{σ_w^2}{n}\)+\(σ_b^2\)を\(σ_\bar{x}^2\)とする。
\(σ_\bar{x}^2\)は何者か?わからない
もともと数学的には、次の等式が成立して、
\(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{\bar{x}})^2\)
=\(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((\bar{x_{i・}}-\bar{\bar{x}})^2\)+\(\frac{1}{ab}\)\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{x_{i・}})^2\)
から
\(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)
の関係が成り立ちます。
さて、\(σ_x^2\)ではなく、\(σ_\bar{x}^2\)とした場合、
データの構造式を立てて、平方和の分解から分散公式の導出がうまくできません。
\(\bar{X}\)管理図から、平均\(\bar{x}\)と全体の平均\(\bar{\bar{X}}\)
の差をイメージする。
でもこれは、群間分散になる。
数学を使って、
\(σ_\bar{x}^2\)=\(\frac{σ_w^2}{n}\)+\(σ_b^2\)
を証明しようとしてもうまくいきません。
数学的には成り立たないので、あえて定義したものととらえる
\(\frac{σ_w^2}{n}\)+\(σ_b^2\)の和を\(σ_\bar{x}^2\)と定義したものと考える方がよいでしょう。
●先の例題をみると、
●\(σ_w^2\)=6.41
●\(σ_b^2\)=0.40
●\(σ_x^2\)
=\(σ_w^2\)+\(σ_b^2\)=6.81
●\(σ_\bar{x}^2\)
=\(\frac{σ_w^2}{n}\)+\(σ_b^2\)
=6.41/5+0.40=1.68
変数xの分散が少ないという意味で、変数\(\bar{x}\)の分散を作っているのです。
ただし、
\(σ_\bar{x}^2\)=\(\frac{σ_w^2}{n}\)+\(σ_b^2\)
を数学的に証明されていませんので、注意が必要です。
この式を暗記する意味は無いでしょう。
まとめると
〇\(σ_\bar{x}^2\)=\(\frac{σ_w^2}{n}\)+\(σ_b^2\)は数学的に証明されていない、慣習的な式。
私は、数学的に証明された正しい、
●\(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)
を使うべきと考えます。
まとめ
群内変動、群間変動の分散の導出について、解説しました。
- ①群内変動、群間変動の分散を計算してみる
- ②群内変動、群間変動\(σ_x^2\)=\(σ_w^2\)+\(σ_b^2\)の証明
- ③群内変動、群間変動\(\frac{σ_w^2}{n}\)+\(σ_b^2\)を\(σ_\bar{x}^2\)とする。
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119