QCプラネッツ 品質のプロフェッショナルを育成するサイト

【本記事限定】分散の加法性を使う時の注意点

基本統計量

「データを加減したら、分散は加法性により増大するのはなぜ?」、「機械的に加法して良いか?」 「わずかのデータの加減によって、集合全体の分散は増大するのか?」など、疑問に思っていませんか?

こういう疑問に答えます。

本記事のテーマ

【本記事限定】分散の加法性を使う時の注意点【5分で理解できます】

分散の加法性を使うときの注意点

  • ➀分散の加法性は数学的には正しい
  • ②分散を加法すべきを迷う場合がある
  • ③分散を加法するかどうかはあなたが判断する

記事の信頼性

記事を書いている私は、QC検定®1級合格した後、さらに磨きをかけて分散について研究しています。

●商標使用について、
①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

●You tube動画ご覧ください。

さっそく見ていきましょう。

➀分散の加法性は数学的には正しい

分散の加法性を使ってよいかを迷ったあなたは、最初に「数学的に正しいのか?」を疑うはずです。

分散の加法性は数学的に「正しい」です。

分散の加法性の証明

\(V(aX±bY)=a^2V(X)\)\(±2ab cov(X,Y)+b^2V(Y)\)を証明します。

\(V(aX±bY)\)
=\(E[((aX±bY)-E[aX±bY])^2]\)
=\(E[(a(X-E[X])±b(Y-E[Y]))^2]\)
=\(E[(a(X-E[X])^2]\)\(±E[2ab(X-E[X])(Y-E[Y])]\)\(+b^2E[(Y-E[Y])^2]\)
=\(a^2E[(X-E[X])^2]±2abE[(X-E[X])(Y-E[Y])]\)\(+b^2E[(Y-E[Y])^2]\)
=\(a^2V(X)±2abcov(X,Y)\)+\(b^2V(Y)\)

分散の加法性は、\( aX±bY \)の±に関係なく+\(b^2V(Y)\)の+になる点が特徴ですね。第2項のcovが共分散ですね。共分散covは相関係数も関係してくる係数です。QC検定®で言うと2級では共分散covは扱いませんが、1級では扱いますね

②分散を加法すべきを迷う場合がある

では、機械的に加法性を使うことに迷う場合の事例を挙げてみます。意地悪な記事ですが、きっと悩むはずです。なお、試験では正解を1つにするために、機械的に加法してよい問いしか出ません。でも、実務や生活していると試験のような単純な問いではありません。

分散の加法性のポイント

本記事は試験には出ません。試験では機械的に加法して得点を稼いでください。でも、実際は加法してよいかをよく吟味する段階が必ず来ます。

あなたを悩ます加法性の吟味は次の2つのパターンがあります。

  • (A)大量のデータ群から無視できるほど少ないデータを取り出す場合
  • (B)母集合から一部データを取り出したが元に戻した場合
  • (C)機械的に分散の加法性が使える場合

(A)大量のデータ群から無視できるほど少ないデータを取り出す場合

例題を挙げます。一緒に考えましょう。

1億個のデータからなる集合A(分散\(σ_1^2\))の中に、10個のデータからなる集合B(分散\(σ_2^2\))を混ぜた全体の集合の分散はいくらか?
<答えの選択肢>
(あ) \(σ_1^2\)のままとする
(い) \(σ_1^2+σ_2^2\)と分散の加法性を適応する
あなたなら、(あ)(い)どちらを答えますか?

分散の加法性を機械的に使うなら「(い)」が正解となります。でも、10個のデータはその1000万倍のデータに比べてほぼ無視できるでしょうから、1億個の中に10個異なるデータが入っても何も変わらないといして「(あ)」と選択するのも正しいですよね。

実は分散の加法性を使う際に、集合AとBを合わせる場合に、A+B→A+Bとするか、A+B→Aとするかはあなたが選択するのです。
前者を選ぶと「(い)」と回答し、後者を選ぶと「(あ)」と回答することになります。

(B)母集合から一部データを取り出したが元に戻した場合

例題を挙げます。一緒に考えましょう。

(1)1億個の部品の集合体A(性能の分散\(σ_A^2\)から10個の部品B(性能の分散\(σ_B^2\)を一回抜き出した。残った部品の性能分散をいくらか?
(2) 一回抜き出した10個の部品Bを集合体Aに戻した。全体の集合体Aの部品性能の分散はいくらか?
(3)(1)(2)をn回繰り返した。全体の集合体Aの部品性能の分散はいくらか?
(1)~(3)について、AとBの共分散は無視してよい。

下にイメージ図も載せます。

分散の加法性1

機械的に分散の加法性を使うと、
(1) V(A-B)=V(A)+V(B)= (σ_A^2+σ_B^2)
(2) V(A-B+B)= V(A-B)+V(B)= (σ_A^2+σ_B^2+σ_B^2)=(σ_A^2+2σ_B^2)
(3) V=(σ_A^2+(σ_B^2+σ_B^2)×n)=(σ_A^2+2nσ_B^2)
と分散がどんどん増えていきます。でも元に戻しているのにだんだん分散が増加するのは違和感がありますよね。

よく考えたら、Bを抜いてもAは変わらないと考えても良いし、一旦抜いて戻したら元のAと同じとしてもよい。よって、
V(A-B)=V(A),V(A+B)=V(A)とデータの増減はあっても、
V()の()に入れる変数は変えないと考えて
(1)(2)(3) すべてV=(σ_A^2)
と考えてもよいはずです。

つまり、データの増減をそのまま分散の加法性に適用してよいかは、よく考える必要があります。

 

(C)機械的に分散の加法性が使える場合

大学の試験やQC検定®などの資格試験では、「機械的に分散の加法性」を使ってください。なぜなら、分散の加法性が使えるように配慮した問題が用意されているからです。

下にQC検定®2級で出題された「うまく作られた」問題例を紹介します。何が上手に作られたかを見ましょう。

ペットボトルに500mlの飲料水を入れる。ペットボトルの重さは50g(標準偏差5g)、飲料水は510g(標準偏差12g)である。販売時の全体の重さの標準偏差は何gか?

飲料(液体)とペットボトル(固体)は全く別物です。ここがうまい!ポイントです。データの増減によって全体集合を変えるかどうかを考える必要が全くないからです。

試験問題は、正解は1つしかないため、受験者が混乱しないよう、十分配慮された問題となっています。試験を作る人は神経質になって作問していることが想像できます。

上の問いの答えは、 (5^2+12^2=13^2)より標準偏差は13gですね。

③分散を加法するかどうかはあなたが判断する

分散を加法するかどうかを判断する場合、分散の加法性は数学的に正しいため、V()の()に入る変数を増減するか、しないかをあなたが判断する必要があります。

どの教科書やwebサイトにも書いていないわりに、少し分散の加法性が分かってきたら必ず悩むポイントになるため、本記事限定で解説しました。

試験問題は正解を誘導するために意図して作られたものですが、実務では分散の加法性をそのまま使ってよいかを考える場面が多々あります。勉強できたら実務ができるわけではありません。よく考える必要があります。

まとめ

分散の加法性の使い方で注意すべきポイントを解説しました。試験では機械的に加法性を使ってください。目的は合格することです。でも、実務はよく考えて加法性を使ってください。

  • ➀分散の加法性は数学的には正しい
  • ②分散を加法すべきを迷う場合がある
  • ③分散を加法するかどうかはあなたが判断する


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!