投稿者: QCプラネッツ

  • 【簡単】不偏分散はn-1で割る理由がすぐわかる

    【簡単】不偏分散はn-1で割る理由がすぐわかる

    本記事のテーマ

    【簡単】不偏分散はn-1で割る理由がすぐわかる
    • ➀母集団の推定のために標本から標本分散を算出
    • ②標本分散の期待値は母分散と一致しない
    • ③母分散と一致する不偏分散を導出
    「なぜ、標本分散と不偏分散の2種類あるのか?」、「なぜ、不偏分散はn-1で割るのか?」がわからず、困っていませんか?
    管理図と工程能力指数は決まった解き方しか出題されないので点数化しましょう。

    QC模試受験しよう!

    QC模試(品質技量の腕試し&QC検定®対策)
    品質技量の実力を試したい! QC検定®合格対策に活用したい!オリジナル試験問題を提供します!

    【QC検定® 2級合格対策講座】で必勝!

    QC検定® 2級合格対策講座を販売します。合格だけでなく、各単元の本質も理解でき、QC検定® 1級合格も狙える59題をぜひ活用ください。

    【必勝メモ】と【必勝ドリル】のご紹介

    試験合格に必要最小限エッセンスをまとめた「必勝メモ」と
    何度も解いて合格に導く「必勝ドリル」
    何度も繰り返すから力になる!

    a a a
    a a a
    a a a

    品質管理(QC)を究める数理問題集(初級・中級向け)

    QC検定®3級、QC検定®2級受験の方、QC検定®1級受験挑戦する方への問題集(80問)です。
    数学が苦手で品質管理の数理で苦戦していたら是非勉強しましょう!

    a a
    a a
    a a

    ●商標使用について、
    ①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
    ➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
    ➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

    ➀母集団の推定のために標本から標本分散を算出

    母集団と標本データの違い

    母集団と標本データの違いを説明します。母集団とはデータ全体であり、標本とは母集団から一部を取り出したものですね。

    具体例も紹介します。

    20代の日本人を調べたい。
    ➀母集団は20代の日本人全員→データは絶対入手できない
    ②標本は、100人の20代の日本人→データは絶対入手できる

    母集団は20代の日本人全員のデータを集めるのはムリですね。全員見つけるのは大変ですし、常に人数は増減します。だから、現実に評価可能な範囲の人数を②標本として調べますよね。

    また、標本データに興味はなく、標本から母集団の様子を推定したいはずです。
    なので、標本から母集団を推定するデータ解析が必要になります。それは平均と分散なわけです。

    標本から取り出せる平均は「標本平均」、分散は「標本分散」と呼んでいます。

    手元にある標本の平均と分散から母集団を推定したい

    2つのニーズがあります。

    ・標本平均から母平均(期待値)を推定したい
    ・標本分散から母分散を推定したい

    値を定義します。

    ・標本平均=\(\bar{x}\)
    ・母平均=μ
    ・標本分散=\(s^2\)
    ・母分散=\(σ^2\)

    では、標本と母集団の平均と分散の関係を調べましょう。

    標本 母集団
    平均 標本平均\(\bar{x}\) 母平均μ(=E[\(\bar{x}\)])か?
    分散 標本分散\(s^2\) 母分散\(σ^2\)(=E[\(s^2\)])か?

    ②標本分散の期待値は母分散と一致しない

    平均と分散についてそれぞれ標本と母集団との関係式を見てみましょう。

    標本平均の期待値は母平均と一致する

    E[\(\bar{x}\)]
    =E[\(\frac{1}{n}(x_1+x_2+…+x_n\)]
    =\(\frac{1}{n}\)(E[\(x_1\)]+ E[\(x_2\)]+…+ E[\(x_n\)])
    =\(\frac{1}{n}\)(μ+μ+…+μ)
    = \(\frac{1}{n}\)nμ

    となり、標本平均の期待値は母平均と一致します。

    なお、E[\(x_i\)]=μを使っています。
    各サンプルの平均の推定値である母平均はすべてμになるはずと期待しているからです。

    標本分散の期待値は母分散と一致しない

    式が長く続きますので、ポイントを解説します。

    • (A) \((x_i-\bar{x})\)の式の中に母平均μを入れて展開
    • (B)標本平均の期待値は母平均に一致E[\(x_i\)]=μを使う
    • (C)分散の定義V(X)=E[\((X-E[X])^2\)]を代入
    • (D)分散の加法性V(\(x_i)=σ^2\)、V(\(\bar{X}\))=\(\frac{1}{n}σ^2\)を代入

    ではやってみましょう。数式苦手な方は眺めるだけでOKです。結論だけ見てください。

    (A) \((x_i-\bar{x})\)の式の中に母平均μを入れて展開

    E[\(s^2\)]
    =E[\(\frac{1}{n} \sum^{n}_{i=1}(x_i-\bar{x})^2\)]
    =E[\(\frac{1}{n} \sum^{n}_{i=1}((x_i-μ)-(\bar{x}-μ))^2\)]
    =\(\frac{1}{n}E[\sum^{n}_{i=1}((x_i-μ)^2\)\(-2(x_i-μ)(\bar{x}-μ) \)\(+(\bar{x}-μ)^2)]\)
    =\(\frac{1}{n}E[(\sum^{n}_{i=1}(x_i-μ)^2\)\(-2(\bar{x}-μ)\sum^{n}_{i=1} (x_i-μ) \)\(+(\bar{x}-μ)^2\sum^{n}_{i=1}1]\) (★1)

    ここで、第2項の\(\sum^{n}_{i=1} (x_i-μ)\)は、実際に書き出してみると、

    \(\sum^{n}_{i=1} (x_i-μ)\)
    =\((x_1-μ)+(x_2-μ)+・・・+(x_n-μ) \)
    =\((x_1+・・・+x_n)-nμ\)\(=n(\bar{x}-μ)\)となります。

    また、第3項の\(\sum^{n}_{i=1}1\)は1+1+・・・+1=nとなります。これらを式(★1)に代入します。

    (★1)
    =\(\frac{1}{n}E[\sum^{n}_{i=1}(x_i-μ)^2\)\(-2n(\bar{x}-μ)^2 \)\(+n(\bar{x}-μ)^2]\)
    =\(\frac{1}{n}E[\sum^{n}_{i=1}(x_i-μ)^2\)\(-n(\bar{x}-μ)^2]\) (★2)

    (B)標本平均の期待値は母平均に一致E[\(x_i\)]=μを使う

    式(★2)に,E[\(x_i\)]=μ,E[\(\bar{x}\)]=μを代入します。
    (★2)
    =\(\frac{1}{n}E[\sum^{n}_{i=1}(x_i-E[x_i])^2\)\(-n(\bar{x}-E[\bar{x}])^2]\) (★3)

    (C)分散の定義V(X)=E[\((X-E[X])^2\)]を代入

    E[(\(x_i-E[x_i])^2\)=V(\(x_i\))と
    E[(\(\bar{x}-E[\bar{x}])^2\)]=V(\(\bar{x}\))
    を式(★3)に代入します。
    (★3)
    =\(\frac{1}{n}E[\sum^{n}_{i=1} V(x_i)\)\(-nV(\bar{x})] \) (★4)

    (D)分散の加法性V(\(x_i)=σ^2\)、V(\(\bar{X}\))=\(\frac{1}{n}σ^2\)を代入

    さらに次の2の式
    V(\(x_i)=σ^2\)、
    V(\(\bar{x}\))=\(\frac{1}{n} σ^2\)
    を式(★4)に代入します。
    (★4)
    =\(\frac{1}{n}E[\sum^{n}_{i=1} σ^2 – n \frac{1}{n} σ^2]\)
    =\(\frac{1}{n} (nσ^2-σ^2)\)
    =\(\frac{n-1}{n} σ^2 \)

    まとめると、
    \(E[s^2]=\frac{n-1}{n} σ^2\neq σ^2\)
    となり、標本偏差の期待値は母分散と一致しません。残念!

    ③母分散と一致する不偏分散を導出

    標本平均の期待値は母平均と一致しますが、標本分散の期待値は母分散と一致しません。ではどうするか?

    母分散に一致する分散を定義すればよいわけで、これが不偏分散が出てきた理由です。

    不偏分散を作る

    不偏分散をuとして、式で定義します。
    \(u^2=\frac{n}{n-1} s^2\)
    いかにも母分散に一致させる感じが出てますね。

    不偏分散の期待値を計算

    では、不偏分散の期待値を計算して母分散になるか?調べてみましょう。
    E[\(u^2\)]
    =E[\(\frac{n}{n-1} s^2]\)
    \(=\frac{n}{n-1} E[s^2] \)
    =\(\frac{n}{n-1} \frac{n-1}{n} σ^2 \)
    \(=σ^2\)
    確かにE[\(u^2]=σ^2\)となり、母分散\(σ^2\)に一致しました。

    不偏分散の式をまとめる

    \(u^2=\frac{n}{n-1} s^2\)に
    \(s^2=\frac{1}{n} \sum^{n}_{i=1}(x_i-\bar{x})^2\)を代入します。
    \(u^2\)
    =\(\frac{n}{n-1} \frac{1}{n} \sum^{n}_{i=1}(x_i-\bar{x})^2\)
    =\(\frac{1}{n-1} \sum^{n}_{i=1}(x_i-\bar{x})^2\)
    この式が、教科書でよく見る「n-1で割る」不偏分散の公式ですね。

    以上から、母集団の分散を特定したければ、「n-1で割った不偏分散という変な値を使う」理由がわかりました。

    まとめ

    母集団を推定するために、部分をサンプリングします。標本データの平均と分散の期待値を求めますが、分散だけ一致しません。そのためにn-1で割る不偏分散をよく使います。標本分散の期待値の導出過程をしっかり見ていただきました。

    • ➀母集団の推定のために標本から標本分散を算出
    • ②標本分散の期待値は母分散と一致しない
    • ③母分散と一致する不偏分散を導出
  • 【本記事限定】標本平均の分散の注意点(nで割るな!)

    【本記事限定】標本平均の分散の注意点(nで割るな!)

    本記事のテーマ

    【本記事限定】標本平均の分散の注意点(nで割るな!)【5分で理解できます】
    • ➀数学的に正しい標本平均の分散\(σ^2/n\)の注意点
    • ②標本平均の分散は\(σ^2/n\)で良いのか?
    • ③標本平均の分散はあなたが判断する
    分散を\(σ^2/n\)とサンプル数nで割る公式。でも「サンプル数nが大きいと分散\(σ^2/n\)が低減される」のは不思議だと思いませんか?「数学的に証明された公式だから」といってそのまま計算していませんか?

    さっそく見ていきましょう。

    ➀数学的に正しい標本平均の分散\(σ^2/n\)の注意点

    標本平均の分散\(σ^2/n\)が正しいのかどうかと言われたら、最初に「数学的に正しいのか?」を疑うはずです。まず、標本平均の分散を紹介して、数学的に正しいことを証明します。

    標本平均の分散

    n個の独立した確率変数\(x_i\) (\(i=1,…,n)\)において、それぞれの期待値、分散を\(E(x_i)=μ\),\(V(x_i)=σ^2\)とする。このとき、平均値\(\bar{x}\)を定義すると、平均値\(\bar{x}\)の期待値、分散はそれぞれ\(E(\bar{x})=μ\),\(V(\bar{x})=σ^2/n\)となる。

    \(V(\bar{x})=σ^2/n\) が正規分布や、検定・推定によく出てくる式なので無条件にnで割りますよね。しかも、大数の法則や中心極限定理で数学的に証明されているから、安心して公式を使って良いのです。

    標本平均の分散\(σ^2/n\)の証明

    \(V(\bar{x})
    =V(\frac{x_1+x_2+…+x_n}{n})\)
    =\(\frac{1}{n^2}(V(x_1)+V(x_2)+…+V(x_n))\)
    =\(\frac{1}{n^2} (σ^2+σ^2+…+σ^2)\)
    =\(\frac{1}{n^2} nσ^2\)
    =\(\frac{σ^2}{n}\)

    シンプルに証明できます。

    ②標本平均の分散は\(σ^2/n\)で良いのか?

    標本平均の分散をサンプル数で割って良いかを悩ます例題を紹介します。

    標本平均の分散を悩ます問題

    ある会社の製品の性能データは平均50、母分散\(5^2\)の正規分布に従っている。ある時期から製法を変えたため、いくつか製品サンプルを抜き取り、製法の違いがあるかどうかを有意水準5%の片側検定を使って確かめた。
    (1)サンプルn=4の製品を取り出したところ、性能の平均は51だった。製法の違いが出たといえるか?
    (2)サンプルn=100の製品を取り出したところ、性能の平均は51だった。製法の違いが出たといえるか?

    サンプル数によって検定結果が変わります。。計算して確かめてみましょう。
    検定については、ここを見てください。検定統計量を定義します。
    検定統計量 \(Z=\frac{\bar{x}-μ}{σ/\sqrt{n}}\)
    なお、片側検定の有意水準5%ですからZ0=1.96で判断します。
    (1) \(Z=\frac{\bar{x}-μ}{\sqrt{n}}\)=\(Z=\frac{51-50}{5/\sqrt{4}}\)=0.4
    (2) \(Z=\frac{\bar{x}-μ}{\sqrt{n}}\)=\(Z=\frac{51-50}{5/\sqrt{100}}\)=2 >1.96
    (1)は有意でない(製法に差がない)となりますが、
    (2)は有意である(製法に差がある)となります。

    検定統計量で扱う、分散は\(σ^2/n\)として、母分散をサンプル数で割ります。でもサンプル数によって上の検定の結果が変わるのはおかしいですよね。都合よいサンプル数を取って検査を合格使用する人がいてもおかしくはありません

    標本平均の分散\(V(\bar{x})=σ^2/n\)は、nが大になると分散は小さくなり、その逆もある

    数学的は正しいですが、よく考えると本当?と疑問に思ってしまいます。

    標本平均の分散\(V(\bar{x})\)は母分散と同じ\(σ^2\)ではないのか?

    次の例を見てみましょう

    5個のデータから成る、確率変数\(x_i(i=1,2,3,4)\)がある。
    \(x_1: 55,53,47,44,51 \)
    \(x_2: 55,53,47,44,51 \)
    \(x_3: 55,53,47,44,51 \)
    \(x_4: 55,53,47,44,51 \)
    すべて平均が50,分散は80
    (1)ここで、標本平均\(\bar{x}\)のデータを求めよ。
    (2)標本平均\(\bar{x}\)の分散\(V(\bar{x})\)を求めよ。

    (1)は\(x_1~x_4\)まで同じデータ群なので、\(\bar{x}\)=55,53,47,44,51ですね。
    (2) \(\bar{x}\)=55,53,47,44,51の分散を求めるので、\(V(x_i)\)と同じ\(V(\bar{x})\)=80ですね。

    一方、標本平均の分散\(V(\bar{x})=σ^2/n\)をそのまま使うと、\(V(\bar{x})=80/4\)=20となります。

    同じ標本平均の分散\(V(\bar{x})\)でも、問いかけを変えると答えが変わります

    標本平均の分散\(V(\bar{x})\)の意味と式を考える

    \(V(\bar{x})=V(\frac{x_1+x_2+…+x_n}{n})\)=\(\frac{σ^2}{n}\)
    の式の意味を考えます。
    \(V(\bar{x})= V(\frac{x_1}{n}+\frac{x_2}{n}+…+\frac{x_n}{n})\)と変形します。

    \(V(\bar{x})\)の式は、
    \(x_i\)のデータを1/n倍に圧縮した分散\(V(\frac{x_1}{n})\)をi=1~nまで合わせたもの

    上の事例で当てはめると、次のようになります。

    \(x_1\):55/4,53/4,47/4,44/4,51/4
    \(x_2\):55/4,53/4,47/4,44/4,51/4
    \(x_3\):55/4,53/4,47/4,44/4,51/4
    \(x_4\):55/4,53/4,47/4,44/4,51/4
    どれも(平均50/4,分散80/16)

    分散がn=4の2乗の16で割った80→5に変化します。分散5を4つ加算するため、5→20となったものが、
    \(V(\bar{x})\)=\(\frac{σ^2}{n}\)=80/4=20
    なのです。

    しかし、よく見ると、\(\bar{x}\)=55,53,47,44,51の分散を求めるので、\(V(x_i)\)と同じ\(V(\bar{x})\)=80ですね。

    標本平均の分散の算出ポイント

    母集合(母分散\(σ^2\))からサンプリングして標本を抽出します。標本分散は次の2通り考えるべきです。
    (1) 母集合とデータのばらつきは変わらないから、標本分散も\(σ^2\)とする
    (2) 母集合から個々のデータをサンプル数で割ったデータのついての分散を作る。その分散をサンプル数分加して\(\frac{σ^2}{n}\)とする。

    (1)と(2)の違いがイメージできますか?同じ式ですがイメージが異なります。

    分散を求める式の左辺は\(V(\bar{x})\)ですが、公式どおりに母分散をサンプル数nで割るか、元のデータの母分散と同じとするかはよく考える必要があります。
    でも試験ではとりあえず公式どおりに母分散をサンプル数nで割ってください。

    ③標本平均の分散はあなたが判断する

    標本(サンプル)の分散を母分散\(σ^2/n\)とする前に、nで割るべきかどうかを考えましょう。
    試験対策では、機械的にnで割ってください。でも、分散の値がサンプル数の逆数で変わるのは違和感があります。

    標本平均の分散\(V(\bar{x})\)の式が、
    \(V(\bar{x})=V(\frac{x_1+x_2+…+x_n}{n})\)と違和感なく書けるため、そのまま機械的に\(V(\bar{x})\)=\(\frac{σ^2}{n}\)と導出できます。しかし、実務では

    \(V(\bar{x})=V(x_i)\)=\(σ^2\)とするか、
    \(V(\bar{x})\)=\(\frac{σ^2}{n}\)とするかを
    よく考える必要があります。

    まとめ

    標本平均の分散の求め方で注意すべきポイントを解説しました。試験では機械的にサンプル数nで割ってください。目的は合格することです。でも、実務はよく考えて分散値を求めてください。

    • ➀数学的に正しい標本平均の分散の注意点
    • ②標本平均の分散は\(σ^2/n\)で良いのか?
    • ③標本平均の分散はあなたが判断する
  • 【本記事限定】分散の加法性を使う時の注意点

    【本記事限定】分散の加法性を使う時の注意点

    本記事のテーマ

    分散の加法性を使うときの注意点
    • ➀分散の加法性は数学的には正しい
    • ②分散を加法すべきを迷う場合がある
    • ③分散を加法するかどうかはあなたが判断する
    「データを加減したら、分散は加法性により増大するのはなぜ?」、「機械的に加法して良いか?」 「わずかのデータの加減によって、集合全体の分散は増大するのか?」など、疑問に思っていませんか?

    QC模試受験しよう!

    QC模試(品質技量の腕試し&QC検定®対策)
    品質技量の実力を試したい! QC検定®合格対策に活用したい!オリジナル試験問題を提供します!

    【QC検定® 2級合格対策講座】で必勝!

    QC検定® 2級合格対策講座を販売します。合格だけでなく、各単元の本質も理解でき、QC検定® 1級合格も狙える59題をぜひ活用ください。

    【必勝メモ】と【必勝ドリル】のご紹介

    試験合格に必要最小限エッセンスをまとめた「必勝メモ」と
    何度も解いて合格に導く「必勝ドリル」
    何度も繰り返すから力になる!

    a a a
    a a a
    a a a

    品質管理(QC)を究める数理問題集(初級・中級向け)

    QC検定®3級、QC検定®2級受験の方、QC検定®1級受験挑戦する方への問題集(80問)です。
    数学が苦手で品質管理の数理で苦戦していたら是非勉強しましょう!

    a a
    a a
    a a

    ●商標使用について、
    ①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
    ➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
    ➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

    ●You tube動画ご覧ください。

    さっそく見ていきましょう。

    ➀分散の加法性は数学的には正しい

    分散の加法性を使ってよいかを迷ったあなたは、最初に「数学的に正しいのか?」を疑うはずです。

    分散の加法性は数学的に「正しい」です。

    分散の加法性の証明

    \(V(aX±bY)=a^2V(X)\)\(±2ab cov(X,Y)+b^2V(Y)\)を証明します。

    \(V(aX±bY)\)
    =\(E[((aX±bY)-E[aX±bY])^2]\)
    =\(E[(a(X-E[X])±b(Y-E[Y]))^2]\)
    =\(E[(a(X-E[X])^2]\)\(±E[2ab(X-E[X])(Y-E[Y])]\)\(+b^2E[(Y-E[Y])^2]\)
    =\(a^2E[(X-E[X])^2]±2abE[(X-E[X])(Y-E[Y])]\)\(+b^2E[(Y-E[Y])^2]\)
    =\(a^2V(X)±2abcov(X,Y)\)+\(b^2V(Y)\)

    分散の加法性は、\( aX±bY \)の±に関係なく+\(b^2V(Y)\)の+になる点が特徴ですね。第2項のcovが共分散ですね。共分散covは相関係数も関係してくる係数です。QC検定®で言うと2級では共分散covは扱いませんが、1級では扱いますね

    ②分散を加法すべきを迷う場合がある

    では、機械的に加法性を使うことに迷う場合の事例を挙げてみます。意地悪な記事ですが、きっと悩むはずです。なお、試験では正解を1つにするために、機械的に加法してよい問いしか出ません。でも、実務や生活していると試験のような単純な問いではありません。

    分散の加法性のポイント

    本記事は試験には出ません。試験では機械的に加法して得点を稼いでください。でも、実際は加法してよいかをよく吟味する段階が必ず来ます。

    あなたを悩ます加法性の吟味は次の2つのパターンがあります。

    • (A)大量のデータ群から無視できるほど少ないデータを取り出す場合
    • (B)母集合から一部データを取り出したが元に戻した場合
    • (C)機械的に分散の加法性が使える場合

    (A)大量のデータ群から無視できるほど少ないデータを取り出す場合

    例題を挙げます。一緒に考えましょう。

    1億個のデータからなる集合A(分散\(σ_1^2\))の中に、10個のデータからなる集合B(分散\(σ_2^2\))を混ぜた全体の集合の分散はいくらか?
    <答えの選択肢>
    (あ) \(σ_1^2\)のままとする
    (い) \(σ_1^2+σ_2^2\)と分散の加法性を適応する
    あなたなら、(あ)(い)どちらを答えますか?

    分散の加法性を機械的に使うなら「(い)」が正解となります。でも、10個のデータはその1000万倍のデータに比べてほぼ無視できるでしょうから、1億個の中に10個異なるデータが入っても何も変わらないといして「(あ)」と選択するのも正しいですよね。

    実は分散の加法性を使う際に、集合AとBを合わせる場合に、A+B→A+Bとするか、A+B→Aとするかはあなたが選択するのです。
    前者を選ぶと「(い)」と回答し、後者を選ぶと「(あ)」と回答することになります。

    (B)母集合から一部データを取り出したが元に戻した場合

    例題を挙げます。一緒に考えましょう。

    (1)1億個の部品の集合体A(性能の分散\(σ_A^2\)から10個の部品B(性能の分散\(σ_B^2\)を一回抜き出した。残った部品の性能分散をいくらか?
    (2) 一回抜き出した10個の部品Bを集合体Aに戻した。全体の集合体Aの部品性能の分散はいくらか?
    (3)(1)(2)をn回繰り返した。全体の集合体Aの部品性能の分散はいくらか?
    (1)~(3)について、AとBの共分散は無視してよい。

    下にイメージ図も載せます。

    分散の加法性1

    機械的に分散の加法性を使うと、
    (1) V(A-B)=V(A)+V(B)= \(σ_A^2+σ_B^2\)
    (2) V(A-B+B)= V(A-B)+V(B)= \(σ_A^2+σ_B^2+σ_B^2\)=\(σ_A^2+2σ_B^2\)
    (3) V=\(σ_A^2+(σ_B^2+σ_B^2)×n\)=\(σ_A^2+2nσ_B^2\)
    と分散がどんどん増えていきます。でも元に戻しているのにだんだん分散が増加するのは違和感がありますよね。

    よく考えたら、Bを抜いてもAは変わらないと考えても良いし、一旦抜いて戻したら元のAと同じとしてもよい。よって、
    V(A-B)=V(A),V(A+B)=V(A)とデータの増減はあっても、
    V()の()に入れる変数は変えないと考えて
    (1)(2)(3) すべてV=\(σ_A^2\)
    と考えてもよいはずです。

    つまり、データの増減をそのまま分散の加法性に適用してよいかは、よく考える必要があります。

    (C)機械的に分散の加法性が使える場合

    大学の試験やQC検定®などの資格試験では、「機械的に分散の加法性」を使ってください。なぜなら、分散の加法性が使えるように配慮した問題が用意されているからです。

    下にQC検定®2級で出題された「うまく作られた」問題例を紹介します。何が上手に作られたかを見ましょう。

    ペットボトルに500mlの飲料水を入れる。ペットボトルの重さは50g(標準偏差5g)、飲料水は510g(標準偏差12g)である。販売時の全体の重さの標準偏差は何gか?

    飲料(液体)とペットボトル(固体)は全く別物です。ここがうまい!ポイントです。データの増減によって全体集合を変えるかどうかを考える必要が全くないからです。

    試験問題は、正解は1つしかないため、受験者が混乱しないよう、十分配慮された問題となっています。試験を作る人は神経質になって作問していることが想像できます。

    上の問いの答えは、 \(5^2+12^2=13^2\)より標準偏差は13gですね。

    ③分散を加法するかどうかはあなたが判断する

    分散を加法するかどうかを判断する場合、分散の加法性は数学的に正しいため、V()の()に入る変数を増減するか、しないかをあなたが判断する必要があります。

    どの教科書やwebサイトにも書いていないわりに、少し分散の加法性が分かってきたら必ず悩むポイントになるため、本記事限定で解説しました。

    試験問題は正解を誘導するために意図して作られたものですが、実務では分散の加法性をそのまま使ってよいかを考える場面が多々あります。勉強できたら実務ができるわけではありません。よく考える必要があります。

    まとめ

    分散の加法性の使い方で注意すべきポイントを解説しました。試験では機械的に加法性を使ってください。目的は合格することです。でも、実務はよく考えて加法性を使ってください。

    • ➀分散の加法性は数学的には正しい
    • ②分散を加法すべきを迷う場合がある
    • ③分散を加法するかどうかはあなたが判断する
  • 【簡単】統計学最初の関門「平方和」がマスターできる【初心者向け】

    【簡単】統計学最初の関門「平方和」がマスターできる【初心者向け】

    本記事のテーマ

    【簡単】統計学最初の関門「平方和」がマスターできる【初心者向け】
    • ➀なぜ平方和は2乗和なのかを理解する
    • ②平方和の公式をスムーズに変形できる
    • ③測定データを変換して平方和を算出できる
    統計学や品質管理を学ぶときに、最初につまずくのが「平方和」です。公式を覚えて計算しても、「平方の和である理由」、「平方和の公式の変形」や「測定データを変換して平方和の導出」がわからず、困りますよね。

    記事の信頼性

    記事を書いている私は、QC検定®1級合格し、平方和でつまずきやすい社内のQC検定®2級挑戦者にわかりやすく説明しています。

    ●商標使用について、
    ①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
    ➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
    ➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

    本記事を読んでいるあなたは、平方和、確率分布関数など統計学の基礎をマスターしたいはずです。理解度アップのための必須な関連記事がありますので、関連記事も読んでください。

    確率分布関数の作り方や確率・期待値を積分で計算する理由が簡単にわかるブログ記事

    F分布 【簡単】F分布がすぐ使いこなせる【初心者向け】

    t分布 【簡単】t分布がすぐ使いこなせる【初心者向け】

    カイ2乗分布 【簡単】χ2乗分布がすぐ使いこなせる【初心者向け】

    カイ2乗分布 【簡単】χ2乗分布とt分布とF分布がすぐわかる【初心者向け】

    ポアソン分布 【簡単】わかりやすく理解できるポアソン分布

    QC模試受験しよう!

    QC模試で、腕試ししましょう!
    QC模試(品質技量の腕試し&QC検定®対策)
    品質技量の実力を試したい! QC検定®合格対策に活用したい! 1,000円で提供します!

    品質力が鍛えられる「QC塾」を是非ご利用ください。

    品質のリーダーを育成する「QC塾」
    ブログでは、品質の勉強、実務、QC検定®に役立つ情報をアップして 「わかる」価値を提供していますが、「わかる」を「できる」に変える トレーニング塾「QC塾」を是非ご利用ください。

    さっそく見ていきましょう。

    ➀なぜ平方和は2乗和なのかを理解する

    平方和に入る前に、他の式を考えて比較すると平方和の良さが理解できます。理解してから公式を使うようにしましょう。

    You tubeでもわかりやすく解説しています。ブログも合わせてマスターしましょう。

    1乗和のばらつき算出式を作る

    世の中のデータは、「平均」と「ばらつき」の2つで評価します。平均の式は「合計/個数」です。「合計/個数」以外の式はほぼ使いませんよね。

    では、ばらつきの算出式を「平方和を知らない」人として考えてみましょう。
    ばらつきの定義から考えると、「平均からのズレ」ですよね。式に書きましょう。あるデータ \(x_i\)と平均 \(\bar{x}\)とするとばらつきは
    $$ \sum_{i} (x_i-\bar{x}) $$
    という式になります。

    平方和と違って、2乗しませんから計算は簡単ですね。でも公式として使われていません。なぜでしょうか?

    例を見ればわかります。5個のデータを見ましょう。

    \(x_i\) 53,48,44,57,58
    \(\bar{x}\) 52,52,52,52,52
    \(x_i-\bar{x}\) 1,-4,-8,5,6 →合計0

    なんと、\(\sum_{i} (x_i-\bar{x})\)となります。式は正しそうに書いていますが、式の意味は「全部の合計」と「平均×個数」の差です。どちらも全部の合計になるため、0になります。この式は使えません。残念!

    修正した1乗和のばらつき算出式を作る

    ばらつきの式が0にならないように再考します。ばらつきは「平均からのズレ」であり、この値は常に正になります。そこで、次の式に改良しました。

    あるデータx(i)と平均bar(x)とするとばらつきは
    $$ \sum_{i} |x_i-\bar{x}| $$
    という式になります。苦手意識の高い絶対値記号ですが、大丈夫です!

    例を見てチェックしましょう。同じく5個のデータを見ましょう。

    \(x_i\) 53,48,44,57,58
    \(\bar{x}\) 52,52,52,52,52
    \(|x_i-\bar{x}|\) 1,4,8,5,6 →合計24

    ばらつきの合計が24で平均24/5=4.8と5程度平均からずれる。確かにデータを見ると正しいとわかります。

    実は、ばらつきを評価する式の1つに
    $$ \sum_{i} |x_i-\bar{x}| $$
    もあります。でもなぜ教科書にはいつも平方和の式なのでしょうか?

    計算が楽だからばらつきは平方和で算出

    ばらつきを評価する
    $$ \sum_{i} |x_i-\bar{x}| $$
    は1つ大きな問題があります。それは「絶対値|x|の||を外すのが手間」なんです。

    絶対値|x|はx≧0ならx,x<0なら-xと2通りあります。
    \(\sum_{i} |x_i-\bar{x}|\) =\( |x_1-\bar{x}|+ |x_2-\bar{x}|\)+\(・・・+|x_n-\bar{x}|\)
    とn個の項それぞれに中身の正負を見て絶対値記号を外すのが大変手間です。

    なので、面倒な絶対値記号を外す手間を不要な方法を考えるはずです。

    これは「2乗」すればよいのです。()の中身の正負に関係なく簡単に()を外すことができます。これがばらつきを平方和で評価する理由なのです。

    ばらつきを評価する式は平方和以外にもありますが、平方和が複雑な式ですが、計算の手間が少ないわけです。

    ちなみに上の例の平方和は142となります。

    \(x_i\) 53,48,44,57,58
    \(\bar{x}\) 52,52,52,52,52
    \((x_i-\bar{x})^2\) 1,16,64,25,36 →合計142

    ②平方和の公式をスムーズに変形できる

    平方和は2つの式で表現できます。試験に使いやすい方を覚えておくと便利です。でも数列の和Σの変形に慣れておくと、分散分析、実験計画法、回帰分析の理解が早くなります。式の変形を見ましょう。

    You tubeでも解説しています。ブログも合わせてマスターしてください。

    平方和の式の2つの顔

    平方和の式は「平均からのズレの2乗和」です。式で書くと
    $$ S=\sum_{i} (x_i-\bar{x})^2 $$
    です。この式を変形した、よく使われる式があります。
    $$ S=\sum_{i} x_i^2- (\sum_{i} x_i)^2/n $$

    平方和の式を変形

    教科書では変形過程を見たいところを省くので、本記事は省かずに導出過程を書きます。

    $$ S=\sum_{i} (x_i-\bar{x})^2 $$
    $$ =\sum_{i} (x_i^2-2\bar{x}x_i+(\bar{x})^2) $$

    ここで、\(\bar{x}\)は平均で、\(\bar{x}=(\sum_{i} x_i)/n\)を代入します。

    \( S=\sum_{i} x_i^2\)-\(2((\sum_{i} x_i)/n)(\sum_{i} x_i)\)+\(\sum_{i}((\sum_{i} x_i)/n)^2 \)

    急に難しくなりましたね。眺めるだけでも十分な勉強になるので、まずは見ましょう!
    第2項は、\(2(\sum_{i} x_i)/n)(\sum_{i} x_i)\)=\(2/n(\sum_{i} x_i)^2\)に変形できます。
    第3項は、\(\sum_{i}((\sum_{i} x_i)/n)^2\)=\(n((\sum_{i} x_i)/n)^2\)=\(1/n(\sum_{i} x_i)^2)\)に変形できます。

    まとめると、
    \(S=\sum_{i} x_i^2- 2/n(\sum_{i} x_i)^2\)+\(1/n(\sum_{i} x_i)^2\)=\(\sum_{i} x_i^2-(\sum_{i} x_i)^2/n\)と変形できました。

    大事なのは、第2項、第3項の変形です。実験計画法、回帰分析で活用する分散分析の分散期待値の変形に応用されます。

    公式の当てはめ方

    例題を見ましょう。慣れないうちは2つも平方和の公式を覚えず、1つだけにしましょう。最初は、平方和S=\(\sum_{i} x_i^2-(\sum_{i} x_i)^2/n\)をよく使っていました。

    1. 5個のデータにおける平方和を求めよ。

    \(x_i\) 8,12,6,10,4 (合計40)8
    \(x_i^2\) 64,144,36,100,16 (合計360)

    試験では、データの2乗を与えている場合があります。
    平方和S=\(\sum_{i} x_i^2-(\sum_{i} x_i)^2/n\)を使います。
    S=360-40^2/5=40

    2. 5個のデータにおける平方和を求めよ。

    \(x_i\) 8,12,6,10,4 (合計40)

    平均が8と簡単に求められるので、
    \(S=\sum_{i} (x_i-\bar{x})^2\)を使います。
    S=(8-8)^2+(12-8)^2+(6-8)^2+(10-8)^2+(4-8)^2=40

    ③測定データを変換して平方和を算出できる

    平方和に慣れていないあなたを惑わす試験問題があります。よく、測定データをわざわざ変換して平方和が変換値の2乗に変化する内容です。心理統計学の期末試験やQC検定®3級・2級に頻出問題ですね。

    事例を挙げます。

    測定データが5つあり、その重さを測定した。xの値は大きいので、X=(x-260)×10とするXに変換した。

    x 261.4,267.3,255.3,257.3,258.7
    X 14,73,-47,-27,-13

    xによる平方和Sxと、Xによる平方和SXの関係には Sx=(➀)SXの関係がある。(➀)はいくらか?

    安心してください。慣れている人でも即答できません。一般化した方がわかりやすいので、式で見ましょう。

    ある変数xにXをX=(x-m)×M (x,Xは変数、m,Mは定数)するように変換します。Xによる平方和SXの式を作ります。

    \(SX=\sum(X_i-\bar{X})^2\)
    ここで、 \(X=(x-m)×M\)ですから、
    \(X_i=(x_i-m)×M\),\(\bar{X} =(\bar{x}-m)×M\)
    を代入します。

    \(SX=\sum((x_i-m)×M -(\bar{x}-m)×M)^2\)
    =\(M^2\sum(x_i -m)^2\)=\(M^2Sx\)となりますね。
    なので(➀)はM=10から100が答えとなります。

    変換した平方和の出題は、本質的な内容ではありません。しかし、慣れないあなたに出題される問いなので、平方和の式変形は慣れておくとよいです。

    まとめ

    平方和でつまずきやすいポイントを3つ解説しました。

    • ①なぜ平方和は2乗和なのかを理解する
    • ②平方和の公式をスムーズに変形できる
    • ③測定データを変換して平方和を算出できる
  • 5分でわかる品質用語

    5分でわかる品質用語

    本記事のテーマ

    【初心者向け】難解な品質管理用語が簡単にマスターできる【5分で理解できます】
    • ➀品質,QCD,QCストーリ,PDAC(成績編)
    • ②理念,方針管理,全員の積極的参加(部活編)
    • ③品質管理の企業活動
    「品質管理の用語がわかる!」
    「QCD,関係性管理,継続的改善,ISO9001,プロセスアプローチなどの難解な品質用語がわかる!」

    1つ気にあるのは

    品質管理は概念が難しいわりに、
    【何となくできるもの】ですよね

    なぜかわかりますか?

    それは

    すでに学生時代で習得しているからなのです。

    本記事を読めば、学生時代の思い出に浸りながら品質管理のベースが理解できます。

    さっそく見ていきましょう。

    ➀品質,QCD,QCストーリ,PDAC(成績編)

    品質、QCD、PDCA、QCストーリ、重点指向がわかる!

    品質とは何か?超わかりやすく説明したい!

    最初の問いです。

    品質とは何か説明できますか?

    Wikipediaでは、
    品質(ひんしつ、クオリティ = quality)は、工場で生産された製品や、サービス業が提供するサービスの有する特性、もしくは属性をいう。
    と書いてます。

    こんな説明じゃ、わからない!
    品質管理の最初の「品質」の意味がわからないと、品質管理すべてが嫌いになってしまう!

    品質管理が難しく、距離を置かれる理由が、難しい説明なのです。
    ならば、簡単に説明できればよいのです!

    学校の悪い成績で怒られた思い出に品質管理用語が隠れている!

    学校の成績が悪かったら、親は怒りましたよね! なぜ怒るんでしょうか?

    それは、あなたの親があなたに
    「これくらい点数が取れる」と勝手に期待値を作る
    からです。

    期待値以上なら褒めて、以下なら怒るわけですね。

    ここに「品質」のエッセンスがあると思いませんか?

    つまり、

    「品質」とは、「相手が満足する基準」

    そして、もう1つ大事なことは、

    自分ではなく
    相手の期待値を超えること
    が品質では重要
    なのです。

    次にQCDを考えましょう。学校の成績が悪かったら、向上するよう怒られましたよね。あなたは、向上するために
    「塾行かせて」、「参考書買って」、「来年まで待って」と
    親に相談すると、親は
    「良い成績を」、「お金使わずに」、「すぐ持って来い」と
    言って、かえって怒られてしまうオチが待っていますよね。

    このやりとりにQCDのエッセンスがあります

    QCDでは、
    高い(1)Q(品質)を
    (2)安いC(コスト)で
    (3)すぐD(納期)達成する

    ことが求められる

    QCDを達成するには、ちょっとしんどい!

    でも、絶対できない目標ではなく頑張れば届くから、しんどい!

    ただ、ライバルもみんな同じようにしんどいから、目標達成したら自分の強みになるわけですね

    QCDを高めるコツ

    次は成績向上作戦を考えましょう。ここに、

    QCストーリ、PDCA、重点指向のエッセンスがあります。

    やみくもに勉強しても成績は向上しません。作戦が必要ですよね。

    1. 現状の把握
    2. 目標の設定
    3. 目標とのギャップを把握
    4. 勉強対策を計画・実行
    5. 効果の確認

    重要なところから取り掛かりますよね

    (1)QCストーリは、現状の把握、目標の設定、目標達成に必要な行動を取ること。

    (2)PDCAは行動の計画→実行→評価→次なる行動とサイクルを回すこと。

    (3) 重点指向は、重要な項目から優先的に行動をとること。

    学校の成績向上作戦は、「品質管理」そのものなのです。
    日々、真面目に働くあなたは学生時代に成績向上経験があるから、品質管理を知らなくても品質向上できるのです

    ②理念,方針管理,全員の積極的参加(部活編)

    個人プレーで得られない品質管理もある

    学校の勉強からある程度の品質管理が学べますが個人戦なので、チーム戦で得られる品質管理も必要になります。

    会社で普通に仕事ができるのは、学校の部活経験があるからです。部活を思い出しならが品質管理を見ましょう。

    弱いチームと強いチームの違いを考えてみよう

    強い選手がいる/いない差ではなく、チーム運営の違いを見ましょう。表にまとめます。

    弱いチーム 強いチーム
    1 仲良しが集まる 同じ目標を目指す人が集まる
    2 目標は無い、あいまい 目標設定のメンバーへ周知
    3 毎日何となく練習している 毎日の練習内容・目的を理解
    4 だらだら雑談が多く、動きが遅い 必要な意思疎通と機敏な動き
    5 自己中心的で他責 自責をもってチーム貢献
    6 内省はしない 常に振り返り、成長を促す

    強いチームにするにはどうすればよいでしょうか?

    強いチーム・組織作りが大変なのですが、ここにもたくさんの品質管理の概念が詰まっています。上の表の強いチームの特徴とそれを実現するために必要な要素をまとめます。この要素こそが品質管理の概念です。

    特徴 対策
    1 同じ目標を目指す人が集まる 理念を掲示
    2 目標設定のメンバーへ周知 方針管理を掲示
    3 毎日の練習内容・目的を理解 日常管理の遂行
    4 必要な意思疎通と機敏な動き コミュニケーション
    5 自責をもってチーム貢献 リーダーシップ
    全員の積極的参加
    6 常に振り返り、成長を促す 継続的改善

    品質管理用語がたくさん表にあがりましたが、わかりやすいイメージが部活動にたくさんあることがわかりますね。
    部活の経験が社会人になって活きてくる理由がよくわかります。

    • 「1.理念」は「部員の意識向上、意思統一」や部員募集時に「こういう人に来てほしい、来て欲しくない」を明示して、部員のばらつきを抑える効果があります。
    • 「2.方針管理」は目標を明確に決めて、そこに向かう活動、工程をチームで決めることです。キャプテンや顧問が中心となって部員に展開します。
    • 「3.日常管理」は部員の日々の生活や練習を管理することです。
    • 「4.コミュニケーション」は会話だけではなく、部員間の意思疎通を図るもので、問題や懸案事項があればともに解決します。
    • 「5.リーダシップ、全員の積極的参加」は4のコミュニケーションが成り立って初めて部員自ら行動できる状態になります。やらされ感で行動するのではありません。
    • 「6.継続的改善」は少しずつ改善してレベルが上がっていくことです。

    すべて回れば相当強いチームになりますが、理想的な話でもあります。
    現実はいろいろな価値観をもつ部員間の衝突があったり、甘えによってうまくいかないものです。
    小さな成功を少しずつ勝ち取ることでチームの意識を向上できるようになれます。

    ③品質管理の企業活動

    品質管理の企業活動は 学校の成績編(個人戦)と部活編(チーム戦)の組み合わせでほぼ対応できます。日頃の業務から「品質あるある」を思い出してみましょう。本ブログが役立つ場面がたくさんあるはずです。

    まとめ

    「【初心者向け】難解な品質管理用語が簡単にマスターできる【5分で理解できます】」をわかりやすく解説しました。

    • ➀品質,QCD,QCストーリ,PDAC(成績編)
    • ②理念,方針管理,全員の積極的参加(部活編)
    • ③品質管理の企業活動
  • なぜ、実験計画法は分散で検定するのかが5分でわかる【初心者向け】

    なぜ、実験計画法は分散で検定するのかが5分でわかる【初心者向け】

    本記事のテーマ

    なぜ、実験計画法は分散で検定するのかが5分でわかる【初心者向け】
    • ➀分散で検定する理由を理解する
    • ②帰無仮説と対立仮説を理解する
    • ③F検定のメリット・デメリットを知る
    「なぜ分散分析表を作ってF検定するのがわかる!」
    「F検定する時の「帰無仮説」と「対立仮説」は何か?がわかる!」

    【QC検定®1級合格】実験計画法問題集を販売します!

    QC検定®1級合格したい方におススメです。
    QC検定®1級、過去全回分の問題と実験計画法参考書を研究して、作り上げたオリジナル良問30題を1500円で提供します。ぜひご購入、学習して合格しましょう。

    究める!実験計画法 演習問題を販売します!

    実験計画法を究めた方におススメです。
    実験計画法をマスターしたい方に、必須な演習問題集(2500円)を作成しました。しっかり勉強して究めましょう。

    分散分析、F検定、検定する帰無仮説・対立仮説は何か?
    を疑問に思えるあなたは、センスがいいです。
    よくわからないけど計算方法や公式を暗記しながら、
    徐々に実験計画法の中身をマスターしていきましょう。

    この記事を読むあなたは、いくつか実験計画法の考え方がすぐに理解できず苦労していると思います。
    いくつか関連記事を紹介しますので、関連記事も読んでみてください。

    究める!実験計画法

    実験計画法 究める!実験計画法
    実験計画法のまとめトップページ。実験計画法を究めることができます!

    【簡単】実験計画法とは何かがすぐわかる【初心者向け】

    実験計画法 【簡単】実験計画法とは何かがすぐわかる【初心者向け】
    実験計画法から何が求まるのか?をわかりやすく解説します!

    なぜ、実験計画法は分散で検定するのか?【初心者向け】

    実験計画法の分散分析 なぜ、実験計画法は分散で検定するのか?【初心者向け】
    実験計画法はなんで分散分析するのか?、帰無仮説・対立仮説は何かがすぐ分かります!

    実験計画法のプーリングがわかる

    pooling 実験計画法のプーリングがわかる
    実験計画法のプーリングって何?がすぐにわかります!

    実験計画法の交絡がわかる

    交絡 【簡単】実験計画法の交絡(別名)とはキャラがかぶっていること
    実験計画法の交絡が何かがすぐにわかります!

    さっそく見ていきましょう。

    ➀分散で検定する理由を理解する

    最初に学ぶ検定は「平均差の検定」ですよね。本来は平均差の検定を使うべきです。
    でも、実験計画法では平均差の検定では不十分なため分散を使います。

    要因効果は母平均の差で検定

    例として、一元配置実験(水準数3)の因子Aを考えます。

    水準 データ
    A1 12 13 15 16
    A2 21 22 19 24
    A3 26 25 27 28

    データの取り方については
    関連記事【フィッシャーの3原則】をご覧下さい。

    フィッシャーの3原則 フィッシャーの3原則
    フィッシャーの3原則をわかりやすく解説します!

    因子Aの効果があるかを調べるとき、3つの仮説を立てて、母平均差を検定します。

    ・A1とA2の違いを調べる 帰無仮説:A1=A2、対立仮説:A1≠A2
    ・A1とA3の違いを調べる 帰無仮説:A1=A2、対立仮説:A1≠A2
    ・A2とA3の違いを調べる 帰無仮説:A1=A2、対立仮説:A1≠A2

    検定回数の増加が検出力の低下につながる

    上の場合では、3回検定が必要です。検定回数が増えると検定精度(検定力)が低下します。検定はある確率α(第1種の誤り)で誤判断します。αはよく5%としますね。

    検定回数がn回の場合は、検定結果が正しい確率は \((1-α)^n\) です。
    検定回数が3回の場合は、\((1-0.05)^3\)=84%となり、16%も誤判断します。

    調べたい水準数が多いと正しい判定でできなくなります。

    1回の検定で済ませるF検定(分散を使う理由)

    母平均差の検定では、
    A1-A2=0かつ、A2-A3=0かつ、A3-A1=0
    の3つの式を1つずつ3回検定します。検定回数が増えると検定力が低下します。

    ではどうするか?

    上の3つの式を1つの式で表現できれば、1回の検定で済むのです。

    なるほど!

    では、どうやって変形しますか? 高校数学の問題です。

    答えは、

    2乗和にすればよいのです。
    \( (A1-A2)^2+(A2-A3)^2+(A3-A1)^2\)=0
    を検定すればよいのです。

    2乗は必ず0以上になります。各2乗和の総和が0ならば、各2乗和はすべて0になりますね。
    つまり、
    \((A1-A2)^2+(A2-A3)^2+(A3-A1)^2\)=0ならば、
    \(A1-A2\)=0かつ、\(A2-A3\)=0かつ、\(A3-A1\)=0
    です。

    また、2乗和の式をよくみると分散を求める式と同じです。
    データと平均の差を2乗して足す項が分散にもあります。

    これが、

    分散を検定に使う理由なのです。

    ②帰無仮説と対立仮説を理解する

    主効果、交互作用や反復の分散がそれぞれ0かどうかを調べればOKです。

    1.主効果
    帰無仮説: \(σ_A^2\)=0
    対立仮説: \(σ_A^2\)≠0

    2.交互作用
    帰無仮説: \(σ_{A×B}^2\)=0
    対立仮説: \(σ_{A×B}\)≠0

    3.反復
    帰無仮説: \(σ_R^2\)=0
    対立仮説: \(σ_R^2\)≠0
    などです。

    実験計画法の分散分析において、検定の帰無仮説と対立仮説は分散が0かどうかですが、なぜ分散で検定するのかを理解することが重要です。

    ③F検定のメリット・デメリットを知る

    F検定のメリット

    1.検定力が維持できること
    2.1回の検定で済む。

    F検定のデメリット

    因子の有意性がわかるが、どの水準間で違いがあるのかはわからない。
    でも大した問題ではない。

    \((A1-A2)^2+(A2-A3)^2+(A3-A1)^2\)=0 という式を書きましたね。
    右辺が0出ない場合は、左辺の()のどれかが0でないことがわかります。
    でも、どの()が0でないかまではわかりません

    では、問題なのか?というと大した問題ではありません

    実験計画法では、主効果、交互作用などの因子において有意性を調べますが、
    各因子内の水準までは検定しません。なので、気にしなくてよいのです。

    つまり、

    メリットの効果が高く、デメリットの影響が無いため、
    分散分析とF検定をしているのです。

    これが、F検定する理由です。

    F検定の解き方を覚える前に
    F検定する理由を理解しましょう。
    ここが、一番大事!

    まとめ

    「なぜ、実験計画法は分散で検定するのかが5分でわかる【初心者向け】」を説明しました。

    • ➀分散で検定する理由を理解する
    • ②帰無仮説と対立仮説を理解する
    • ③F検定のメリット・デメリットを知る
  • 【簡単】実験計画法のフィッシャー3原則がすぐわかる方法

    【簡単】実験計画法のフィッシャー3原則がすぐわかる方法

    本記事のテーマ

    【簡単】実験計画法のフィッシャー3原則がすぐわかる方法
    • ➀反復:効果と残差を分ける
    • ②無作為化:適正な残差平方和を求める
    • ③局所管理:適正な効果平方和を求める
    「実験計画法のフィッシャーの3原則の意味がわかる!」
    「フィッシャーの3原則がなぜ必要なのかがわかる!」

    【QC検定®1級合格】実験計画法問題集を販売します!

    QC検定®1級合格したい方におススメです。
    QC検定®1級、過去全回分の問題と実験計画法参考書を研究して、作り上げたオリジナル良問30題を1500円で提供します。ぜひご購入、学習して合格しましょう。

    究める!実験計画法 演習問題を販売します!

    実験計画法を究めた方におススメです。
    実験計画法をマスターしたい方に、必須な演習問題集(2500円)を作成しました。しっかり勉強して究めましょう。

    実験計画法を勉強始めたばかりで、よくわからないことが多いですね。
    初心者の方がつまづきやすいポイントを関連記事にまとめています。

    究める!実験計画法

    実験計画法 究める!実験計画法
    実験計画法のまとめトップページ。実験計画法を究めることができます!

    【簡単】実験計画法とは何かがすぐわかる【初心者向け】

    実験計画法 【簡単】実験計画法とは何かがすぐわかる【初心者向け】
    実験計画法から何が求まるのか?をわかりやすく解説します!

    なぜ、実験計画法は分散で検定するのか?【初心者向け】

    実験計画法の分散分析 なぜ、実験計画法は分散で検定するのか?【初心者向け】
    実験計画法はなんで分散分析するのか?、帰無仮説・対立仮説は何かがすぐ分かります!

    実験計画法のプーリングがわかる

    pooling 実験計画法のプーリングがわかる
    実験計画法のプーリングって何?がすぐにわかります!

    実験計画法の交絡がわかる

    交絡 【簡単】実験計画法の交絡(別名)とはキャラがかぶっていること
    実験計画法の交絡が何かがすぐにわかります!

    フィッシャーの3原則についての記事に加えて、上の関連記事も一通り読んでおきましょう。理解が一気に深まります。

    フィッシャーの3原則は、「その原則が無いと何が困るのか?」を理解すれば
    簡単に理解できます。

    さっそく見ていきましょう。

    ➀反復:効果と残差を分ける

    例題

    反復が面倒なBさんは、反復無しの一元配置実験を実施しました。
    実験データは次のようになりました。因子Aの有意性が判断できるでしょうか?

    水準データ

    A1 12
    A2 15
    A3 19

    評価

    分散分析すると、残差eの自由度と平方和がともに0になります。
    因子Aの効果と残差eが分離できないことを意味します。
    実験からデータの変化は因子Aによるのか、誤差によるのかがわからないのです。

    平方和S 自由度φ
    A 24.67 2
    e 0 0
    T 24.67 24.67

    実験から因子効果と残差効果を分離させるためには、反復が必要です。

    再実験

    Bさんに反復して再実験してもらいましょう。

    水準 データ
    A1 12, 14, 16
    A2 15, 18, 21
    A3 19, 20, 21

    分散分析結果を見ると、因子効果と残差効果が分離できているのがわかります。

    平方和S 自由度φ
    A 56 2
    e 28 6
    T 84 8

    You Tubeにも解説していますので、ご覧ください。

    ②無作為化:適正な残差平方和を求める

    「無作為化」はより「ランダム」と言った方がわかりやすいですね。
    無作為化しないとどんな不都合が出るか見てみましょう。

    例題

    同じくBさんに別の実験をしてもらうと、次の結果が出ました。データを評価しましょう。
    水準 データ
    A1 39, 43, 44
    A2 46, 53, 63
    A3 69, 72, 75

    一見、問題が無さそうなデータですね。

    評価

    分散分析すると、F値が23.1と非常に高いことがわかります。特に、残差平方和Se=178は因子Aの平方和SA=1368と比べて非常に小さいです。
    つまり、実験データが良くありません。

    S φ V F
    A 1368 2 684 23.1
    e 178 6 29.67
    T 1546 8

    (S:平方和、φ:自由度、V:不偏分散(平均平方)、F:F値)

    Bさんに聞くと、次のように話してくれました。

    「実験準備が面倒なので、同じ水準でまとめて複数回実験を繰り返した後、他の水準に移って、その水準内で複数回実験を繰り返しました。似たようなデータ値になったので安心して実験しました。」

    同じ条件で実験を繰り返すと、心理的に似たようなデータ値になって安心したと思われますが、
    これでは適正な残差eを取り出せていません。 良い実験データとは言えません。

    無作為化しない場合、残差平方和が過小評価され、F値が高くなり、有意と結論づけやすくなります

    再実験

    Bさんに無作為化して再実験してもらいましょう。

    水準 データ
    A1 35, 45, 55
    A2 44, 53, 74
    A3 67, 75, 83

    Bさんは再実験で誤差が増えても大丈夫か?と心配してました。
    分散分析の結果を見てみましょう。

    S φ V F
    A 1368 2 684 5.11
    e 802 6 133.67
    T 2170 8

    (S:平方和、φ:自由度、V:不偏分散(平均平方)、F:F値)

    再実験の分散分析の結果、F値が5.11になり、有効な結果であると言えます。
    残差平方和Seが適正な値になりました。

    You Tubeにも解説していますので、ご覧ください。

    ③局所管理:適正な効果平方和を求める

    局所管理はなじみが無い用語です。簡単に言うと「似たもの同士そろえる」ことです。
    似た者同士そろえないとどんな不都合があるか見てみましょう。

    例題

    ある学習塾では「受講科目数が多いと学力向上効果が高い」ことを広告でアピールしており、4科目受講すると成績向上効果は抜群!らしいです。データが広告に載っていました。さて、本当に正しいのでしょうか?
    受講科目数A 生徒の偏差値
    2科目 38, 42, 46
    3科目 44, 46, 48
    4科目 69, 72, 75

    評価

    分散分析すると、F値が82.3と非常に高いことがわかります。特に、因子Aの平方和SA=1592は残差平方和Se=58と比べて非常に大きいです。

    これもデータが良くないことがわかります。このデータのどこが問題なのかがわかりますか?

    S φ V F
    A 1592 2 796 82.3
    e 58 6 9.67
    T 1650 8

    (S:平方和、φ:自由度、V:不偏分散(平均平方)、F:F値)

    問題なのは、4科目受講の生徒の偏差値が高すぎることです。
    4科目受講の生徒は、そもそも優秀で、塾の学習効果に関係なく成績が良い可能性があります。

    つまり、因子に関係のない別の要因の効果の方が大きいことが問題なのです。

    科目数に関係なく、塾通う前の成績が同じくらいの生徒で比較することが重要です。

    これが、局所管理のエッセンスです。つまり、「似た者同士」で比較しないと、他の効果によって「有意性がある」と誤判断します。

    再実験

    学習塾に、似たような学力の生徒で再度比較してもらい、次の結果が出ました。

    受講科目数A 生徒の偏差値
    2科目 38, 42, 46
    3科目 44, 46, 48
    4科目 45, 49, 50

    分散分析の結果、F検定 F=3.11 < 5.14=F(2,6,0.05)となり、有意性はありませんでした。
    つまり、「学習塾の効果は無い」という結果がわかりました。

    S φ V F
    A 56 2 28 3.11
    e 54 6 9
    T 110 8

    (S:平方和、φ:自由度、V:不偏分散(平均平方)、F:F値)

    事例からわかるように、「似た者同士」で比較しないと、他の効果によって「有意性がある」と誤判断する可能性があります。

    You Tubeでも、解説していますので、ご覧ください。

    以上、フィッシャーの3原則について解説しました。

    まとめ

    「【簡単】実験計画法のフィッシャー3原則がすぐわかる方法」を説明しました。

    • ➀反復:効果と残差を分ける
    • ②無作為化:適正な残差平方和を求める
    • ③局所管理:適正な効果平方和を求める
error: Content is protected !!