2つのデータを管理図にするときの注意点(分散の加法性と検出力のバランス）

「2つのデータを管理図にするとき、何に注意すればよいかわからない」、などと困っていませんか？

こういう期待に答えます。

本記事のテーマ

2つのデータを管理図にするときの注意点

①2つのデータの平均(期待値）と分散
②分散の加法性と検出力のバランスに注意
③計量値の管理図の注意点
④計数値の管理図の注意点は無い

管理図と分散の加法性、検出力をまぜた応用事例を解説します。

教科書やサイトの内容をそのまま暗記せず、自分で考えてみよう。疑問がわけば、新発見につながる！

記事の信頼性

記事を書いている私は、管理図の係数表、群内変動・群間変動の解き方に疑問が残りました。そこで、管理図の理論を研究しました。その成果をブログで解説します。

[themoneytizer id=”105233-2″]

①2つのデータの平均(期待値）と分散

2つのデータのそれぞれの平均(期待値)と分散

2つデータを用意します。それぞれ正規分布に従うと仮定します。
●データA：　平均E[\(x_A\)]=\(μ_A\)、分散V[\(x_A\)]=\(σ_A^2\)
●データB：　平均E[\(x_B\)]=\(μ_B\)、分散V[\(x_B\)]=\(σ_B^2\)

2つのデータの和、差したデータを合成

データA,Bをそれぞれ和、差すると、平均(期待値）と分散はいくらになるか？を考えます。分散の加法性を使えばよいですね。

●和A+Bの場合
◎平均E[\(x_A+x_B\)]= E[\(x_A\)]+ E[\(x_B\)]=\(μ_A\)+\(μ_B\)
◎分散V[\(x_A+x_B\)]= V[\(x_A\)]+ V[\(x_B\)]+2Cov(\(x_A\),\(x_B\))
(Covは共分散)
となります。公式どおりですね。

●差A-Bの場合
◎平均E[\(x_A-x_B\)]= E[\(x_A\)]- E[\(x_B\)]=\(μ_A\)-\(μ_B\)
◎分散V[\(x_A-x_B\)]= V[\(x_A\)]+V[\(x_B\)]-2Cov(\(x_A\),\(x_B\))
(Covは共分散)
となります。公式どおりですね。
差の場合の分散はV[\(x_A\)]–V[\(x_B\)]ではなく、V[\(x_A\)]+V[\(x_B\)]に注意が必要ですね。

●一般には定数a,bを使って以下のように表現できます。
◎平均E[\(ax_A±bx_B\)]= aE[\(x_A\)]±b E[\(x_B\)]=\(aμ_A\)±\(bμ_B\)
◎分散V[\(ax_A+bx_B\)]= \(a^2\)V[\(x_A\)]+\(b^2\) V[\(x_B\)]±2\(ab\)Cov(\(x_A\),\(x_B\))
(Covは共分散)
公式どおりですね。

●以下、共分散Covは無視して考えます。

まとめると、
◎平均E[\(x_A±x_B\)]= E[\(x_A\)]±E[\(x_B\)]=\(μ_A\)±\(μ_B\)
◎分散V[\(x_A+x_B\)]=V[\(x_A\)]+V[\(x_B\)]

データを合成すると、
●平均(期待値)はそのまま加減する
●分散はデータの加減によらず加算

これがどう管理図に影響するか、考えてみましょう。

②分散の加法性と検出力のバランスに注意

分散の加法性で注意すべきこと

分散の加法性により、管理限界3σと管理図係数表の値がズレることに注意

管理限界

●上図では、合成する前のデータは、管理限界3σと管理図係数表は一致するように管理図係数表の値は作られています。
しかし、管理図係数表の値は、サンプル数nに変化する値となっているため、データの合成による分散の加法性は加味されません。

もともと管理図に載せるデータは、合成データではなく、１つのデータを管理することを想定しています。

まとめると、

分散の加法性により、管理限界3σと管理図係数表の値がズレることに注意
●管理図係数表を使う、計量値の管理図は注意
●管理図係数表を使わず、σで管理限界を評価する計数値の管理図は特に問題ない
となります。

検出力の影響

データを合成すると、管理限界3σの方が、管理図係数表の値より大きくなるため、管理限界に入る確率が低下します。逆をいえば、管理限界を超える確率が増えます。

管理限界と検出力

図のように、管理限界を超える部分が増えると赤色部がデータの一部しかかからないことがわかります。つまり、検出力が低下することがわかります。

③計量値の管理図の注意点

●計量値の管理図は、X管理図、R管理図、s管理図があります。それぞれ、管理限界は管理図係数表で決まっていますね。

管理図係数表の値の導出方法は、関連記事にあります。ご確認ください。

【重要】管理図(計量値)の変数の導出がわかる
シューハートの管理図の計量値の各係数表の求め方を解説します。A,B,D,d2とかいっぱい変数がありますが、すべて期待値±倍数×標準偏差で表記できます。シューハートの管理図をマスターしたい方は必見です。

ここで、重要なのは、

X管理図、R管理図、s管理図はそれぞれ正規分布、順序統計量、χ2乗分布を仮定。
計数値はサンプル数n(自由度)の変数で導出されている。管理限界は3σに対応する値としているが、データの合成後のσ’までは考えられていない。

つまり、データ合成前のデータだけ、管理図係数表の値が使えるわけです。

データ合成後のσ’を使って計量値の管理図を使いたい場合

データの合成後のσ’をベースに
平均±3σ’を管理限界とする管理図を
自分で定義して管理図を作ればよいです。

JIS規格から離れて、自作の管理図になりますが、特に問題はありません。

管理したい対象と、異常の定義は管理図を管理する人が決めればよいです。JIS規格を活用することもできますが、JISどおりやる義務はありません。

④計数値の管理図の注意点は無い

二項分布、ポアソン分布の管理図の管理限界は標準偏差を使う

計数値においては、二項分布、ポアソン分布を仮定した管理図を作成します。

●二項分布
(i)pn管理図平均μ=pn,標準偏差σ=\(\sqrt{np(1-p)}\)より
管理限界 pn±3\(\sqrt{np(1-p)}\)=μ±3σ
(ii)p管理図平均μ=p,標準偏差σ=\(\sqrt{\frac{p(1-p)}{n}}\)より
管理限界 p±3\(\sqrt{\frac{p(1-p)}{n}}\)=μ±3σ
と平均±3σで管理限界が定義されている。

●二項分布の期待値Eと分散Vはそれぞれ、
E=np
V=np(1-p)
ですね。

●ポアソン分布
(i)c管理図平均μ=c,標準偏差σ=cより
管理限界 c±3\(\sqrt{c}\)=μ±3σ
(ii)u管理図平均μ=u,標準偏差σ=\(\sqrt{\frac{u}{n}}\)より
管理限界 u±3\(\sqrt{\frac{u}{n}}\)=μ±3σ
と平均±3σで管理限界が定義されている。

●ポアソンの期待値Eと分散Vはそれぞれ、
E=c
V=c
ですね。ポアソン分布の確率密度関数は難しい式ですが、期待値と分散が同じとシンプルになるのが特徴的です。

計数値の管理図の管理限界はデータ合成も活用できる

●計量値の場合は、管理限界を決める係数は、管理図係数表から決まっています。しかし、サンプル数nだけ変化する値なので、データの合成には対応していません。

●一方、計数値の場合は、管理限界は自分のデータの標準偏差σで決めるので、データ合成した場合は、データ合成後の標準偏差σを使えばよいです。

まとめると、

計量値の場合は、管理限界はJISの管理図係数表で決めるので、データ合成した場合は、
管理図係数表の値ではなく、データ合成後の標準偏差σ’を使って管理限界を平均±3σ’と自分で定義する。

計数値の場合は、管理限界は自分のデータの標準偏差σで決めるので、データ合成した場合は、データ合成後の標準偏差σ’を使えばよい

データの状態や特徴によって、管理図や管理限界の作り方をよく考える必要があります。

まとめ

2つのデータを管理図にするときの注意点について解説しました。

①2つのデータの平均(期待値）と分散
②分散の加法性と検出力のバランスに注意
③計量値の管理図の注意点
④計数値の管理図の注意点は無い

管理図