二元配置実験(繰り返し無し)の分散分析・区間推定が解ける
「二元配置実験(繰り返し無し)の分散分析や期待値の導出が複雑でわからない、解けない」、「分散分析表から調べたい効果の区間推定の導出方法がわからない」など、二元配置実験(繰り返し無し)の分散分析の解法がわからず、期待値の式など暗記で片付けていませんか?
こういう疑問に答えます。
本記事のテーマ
二元配置実験(繰り返し無し)の分散分析や期待値の導出
- ①二元配置実験(繰り返し無し)のデータの構造式が書ける
- ②二元配置実験(繰り返し無し)の平方和の分解の式が書ける
- ③二元配置実験(繰り返し無し)の主効果・交互作用・誤差の期待値が導出できる
- ④二元配置実験(繰り返し無し)の分散分析ができる
- ⑤二元配置実験(繰り返し無し)の主効果・交互作用の区間推定が導出できる
記事の信頼性
記事を書いている私は、QC検定1級合格した後、さらに実験計画法に磨きをかけていますので、わかりやすく解説します。本サイトは、4因子繰返し無しの分散分析まで解説します。本サイトは必見です。
実験計画法の肝なので、必読です!
●You tube動画も確認ください。
①二元配置実験(繰り返し無し)のデータの構造式が書ける
データの構造式
2因子の完全配置実験のデータの構造式からスタートします。機械的に書けますね。
二元配置実験のデータの構造式
xij=μ+αi+βj+eij
各平均値をデータの構造式で作る
α、βは母数因子なので、1つの添え字についての合計がすべて0となります。
\(\sum_{i=1}^{a} α_i\)=0
\(\sum_{j=1}^{b} β_j\)=0
この関係が、平方和の分解にて
(x+y)2=x2+ y2, xy=0
を満たします。
平均値の式の代表例
データの構造式
xij=μ+αi+βj+eij
\(\bar{x_{i・}}\)=μ+\(α_i\)+\(\bar{e_{i・}}\)
\(\bar{x_{・j}}\)=μ+\(β_j\)+\(\bar{e_{・j}}\)
\(\bar{\bar{x}}\)=μ+\(\bar{\bar{e}}\)
②二元配置実験(繰り返し無し)の平方和の分解の式が書ける
データの構造式を変形
式を書くと見づらいので、表にまとめます。分散分析はデータの構造式が複雑になると表で整理するのがオススメです。
SA | SB | Se | |
\(x_{ij}\) | 1 | ||
\(\bar{x_{i・}}\) | 1 | -1 | |
\(\bar{x_{・j}}\) | 1 | -1 | |
\(\bar{\bar{x}}\) | -1 | -1 | 1 |
表から各平方和の導出式が簡単にでますね。SA SB,Seを挙げます。
\(S_A\)=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\( (\bar{x_{i・}}-\bar{\bar{x}})^2\)
\(S_B\)=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\( (\bar{x_{・j}}-\bar{\bar{x}})^2\)
\(S_e\)=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{x_{i・}}-\bar{x_{・j}}+\bar{\bar{x}})^2\)
と書けますね。
③二元配置実験(繰り返し無し)の主効果・交互作用・誤差の期待値が導出できる
期待値については、関連記事確率変数の期待値と分散が計算できる【初心者向け】をご覧下さい。
主効果の分散の期待値の導出
主効果Aの分散の期待値の導出
E[\(S_A\)]=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((\bar{x_{i・}}-\bar{\bar{x}})^2\)]
=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\( (α_i+\bar{e_{i・}}-\bar{\bar{e}})^2\)]
=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b} (α_i )^2\)]
+2E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}(α_i ) (\bar{e_{i・}}-\bar{\bar{e}}) \)]
+E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}(\bar{e_{i・}}-\bar{\bar{e}})^2\)]
ここで、第2項は、
\(\sum_{i=1}^{a}\bar{e_{i・}}\)=\(a\bar{\bar{e}}\)=\(\sum_{i=1}^{a}\bar{\bar{e}}\)
の関係より、和が0となります。
平方和の分解のポイント
平方和は簡単に分解できて、
\( (x_1+x_2+…+x_n)^2\)=\(x_1^2+x_2^2+…+x_n^2\)
が成り立ちます。
この関係が各効果の平方和として分解することができ、
ST= SA+ SB+ …+ Se
と分解できます。
まずは、暗記で構いませんが、慣れてきたら中間項が0になることを確認してください。高校数学レベルで解けます。
E[\(S_A\)]
=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}(α_i )^2\)]
+E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}(\bar{e_{i・}}-\bar{\bar{e}})^2\)]
=\(b(a-1)σ_A^2\) +\((a-1)(σ_e^2\))
主効果Aの自由度は(a-1)より、分散の期待値E[VA]が求まります。
E[\(V_A\)]=\(bσ_A^2\) +\(σ_e^2\)
なお、分散の期待値を以下とします。
\( σ_A^2\)=E[\(\frac{\sum_{i=1}^{a}α_i^2}{a-1}\)]
\(σ_e^2\)については以下のように解きます。式の意味を読んで見ましょう。慣れるまでは、添字の種類と分母の種類を揃える点に注目しましょう。
\(σ_e^2\)=E[\(\frac{\sum_{i=1}^{a}\sum_{j=1}^{b}(e_{ij}-\bar{\bar{e}})^2}{ab-1}\)]
\(\frac{σ_e^2}{b}\)=E[\(\frac{\sum_{i=1}^{a}(e_{i・}-\bar{\bar{e}})^2}{a-1}\)]
\(\frac{σ_e^2}{a}\)=E[\(\frac{\sum_{j=1}^{b}(e_{・j}-\bar{\bar{e}})^2}{b-1}\)]
主効果Bの分散の期待値の導出
E[\(S_B\)]=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((\bar{x_{・j}}-\bar{\bar{x}})^2\)]
=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\( (β_j+\bar{e_{・j}}-\bar{\bar{e}})^2\)]
=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}(β_j )^2\)]
+2E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}(β_j ) (\bar{e_{・j}}-\bar{\bar{e}}) \)]
+E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}(\bar{e_{・j}}-\bar{\bar{e}})^2\)]
ここで、第2項は、
\(\sum_{j=1}^{b}\bar{e_{・j}}\)=\(b\bar{\bar{e}}\)=\(\sum_{j=1}^{b}\bar{\bar{e}}\)
の関係より、和が0となります。
E[\(S_B\)]
=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b} (β_j )^2\)]
+E[\(\sum_{i=1}^{a}\sum_{j=1}^{b} (\bar{e_{・j}}-\bar{\bar{e}})^2\)]
=\(a(b-1)σ_B^2\) +\((b-1)(σ_e^2\))
主効果Bの自由度は(b-1)より、分散の期待値E[VB]が求まります。
E[\(V_B\)]=\(aσ_B^2\) +\(σ_e^2\)
なお、分散の期待値を以下とします。
\( σ_B^2\)=E[\(\frac{\sum_{j=1}^{b}β_j^2}{b-1}\)]
\(σ_e^2\)は、
\(\frac{σ_e^2}{a}\)=E[\(\frac{\sum_{i=1}^{a}(e_{・j}-\bar{\bar{e}})^2}{b-1}\)]
を適用します。
残差の分散の期待値の導出
E[\(S_e\)]=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((x_{ij}-\bar{x_{i・}}-\bar{x_{・j}}+\bar{\bar{x}})^2\)]
= E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)\((e_{ij}-\bar{e_{i・}}-\bar{e_{・j}}+\bar{\bar{e}})^2\)]
意図的に以下のように式変形します。
\((e_{ij}-\bar{\bar{e}})\)=\((e_{ij}-\bar{e_{i・}}-\bar{e_{・j}}+\bar{\bar{e}})\)+\((\bar{e_{i・}}-\bar{\bar{e}})\)+\((\bar{e_{・j}}-\bar{\bar{e}})\)
次に、両辺の2乗和の期待値を作ります。次の関係式が成り立ちます(確かめてみてください)。
E[\(\sum_{i=1}^{a}\sum_{j=1}^{b} (e_{ij}-\bar{\bar{e}})^2\)]
=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}(e_{ij}-\bar{e_{i・}}-\bar{e_{・j}}+\bar{\bar{e}})^2\)]
+E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}(\bar{e_{i・}}-\bar{\bar{e}})^2\)]
+E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}(\bar{e_{・j}}-\bar{\bar{e}})^2\)]
次に分散\(σ_e^2\)を作ります。次の4種類ができます。添字の種類とΣの数に注目してください。添字、Σが3つ以➃の➁➂➃の左辺は、\(σ_e^2\)に自由度a,b,cで割った値となっています。
➀\(σ_e^2\)=E[\(\frac{\sum_{i=1}^{a}\sum_{j=1}^{b}(e_{ij}-\bar{\bar{e}})^2}{ab-1}\)]
➁\(\frac{σ_e^2}{b}\)=E[\(\frac{\sum_{i=1}^{a} (\bar{e_{i・}}-\bar{\bar{e}})^2}{a-1}\)]
➂\(\frac{σ_e^2}{a}\)=E[\(\frac{\sum_{j=1}^{b} (\bar{e_{・j}}-\bar{\bar{e}})^2}{b-1}\)]
➀➁➂の違いを見比べて、慣れましょう。慣れてから式の意味を考えましょう。
次に➀➁➂を変形します。
➀\((ab-1)σ_e^2\)=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}(e_{ij}-\bar{\bar{e}})^2\)]
➁\((a-1)σ_e^2\)=E[\(\sum_{i=1}^{a} \sum_{j=1}^{b}(\bar{e_{i・}}-\bar{\bar{e}})^2\)]
➂\((b-1)σ_e^2\)=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}(\bar{e_{・j}}-\bar{\bar{e}})^2\)]
求めたい期待値
E[\(\sum_{i=1}^{a}\sum_{j=1}^{b} (e_{ij}-\bar{e_{i・}}-\bar{e_{・j}}+\bar{\bar{e}})^2\)]
は➀―➁―➂で算出できます。
E[\(\sum_{i=1}^{a}\sum_{j=1}^{b} (e_{ij}-\bar{e_{i・}}-\bar{e_{・j}}+\bar{\bar{e}})^2\)]
=\((ab-1)σ_e^2\)-\((a-1)σ_e^2\)-\((b-1)σ_e^2\)
=\((a-1)(b-1)σ_e^2\)
となります。
結果をまとめます。
E[\(S_e\)]
=\((a-1)(b-1)σ_e^2\)
残差eの自由度は(a-1)(b-1)より、分散の期待値E[Ve ]が求まります。
E[\(V_e\)]=\(σ_e^2\)
④二元配置実験(繰り返し無し)の分散分析ができる
自由度の計算
各主効果・交互作用の自由度の計算は簡単です。関連記事【簡単】データの構造式で実験計画法がわかる(必読)に解説しています。まとめると次の3つです。
- データの構造式を書く
- 主効果・交互作用の構造式にある添字から自由度を算出
- 自由度は表を活用すると簡単に求まる
SA | SB | Se | |
a | 1 | -1 | |
b | 1 | -1 | |
ab | 1 | ||
1 | -1 | -1 | 1 |
表から、
Aの列(縦)には、aに1,1に-1とありますから、自由度はa-1、
Bの列(縦)には、bに1,1に-1とありますから、自由度はb-1、
eの列(縦)には、abに1,aに-1,bに-1,1に-1とありますから、自由度はab-a-b+1、
となります。
データの構造式が複雑になるほど、上の表を活用すると自由度が求めやすくなります。
分散分析の結果
分散分析表を作ります。
φ | E[V] | |
A | a-1 | \(σ_e^2\)+b\(σ_A^2\) |
B | b-1 | \(σ_e^2\)+a\(σ_B^2\) |
e | (a-1)(b-1) | \(σ_e^2\) |
T | abc-1 | – |
⑤二元配置実験(繰り返し無し)の主効果・交互作用の区間推定が導出できる
母平均の点推定の導出方法
有効繰返し数と区間推定の導出方法
区間推定は、下の式で算出します。
$$ \bar{μ}±t(φ_e,α)\sqrt{\frac{V_e}{n_e}}$$
区間推定のポイント
- ルートの中は、誤差eの分散から個数を割ったものが入る
- 誤差eの自由度φeである。
- Veが複数項である場合、サタースウェイトの式から自由度を導出
サタースウェイトの式については、ここを見てください。
主効果の点推定と区間推定の導出
分散の期待値から分散の推定値を導出
分散分析から、eの分散の推定値E[V]を導出します。
Ve=\(σ_e^2\)
よって、
\(\widehat{σ_e^2}\)= Ve
主効果Aの点推定と区間推定
点推定: \(\widehat{μ}(A_i)=\bar{x_{i・}}\)=\(\widehat{μ+α_i}\)
=\(μ+\bar{x_{i・}}\)
分散:\(\widehat{Var}(\widehat{μ}( A_i))\)
=V[μ+\(\bar{x_{i・}}\)]
=V[\(\bar{x_{i・}}\)]
=\(\frac{\widehat{σ_e^2}}{b}\)
Veが求まったので、自由度φと、点推定μを代入すれば推定区間が求まります。
主効果Bの点推定と区間推定
点推定: \(\widehat{μ}(B_j)=\bar{x_{・j}}\)=\(\widehat{μ+β_j}\)
=\(μ+\bar{x_{・j}}\)
分散:\(\widehat{Var}(\widehat{μ}( B_j))\)
=V[μ+\(\bar{x_{・j}}\)]
=V[\(\bar{x_{・j}}\)]
=\(\frac{\widehat{σ_e^2}}{a}\)
Veが求まったので、自由度φと、点推定μを代入すれば推定区間が求まります。
一連の導出過程を解説しました。
まとめ
二元配置実験(繰り返し無し)の分散分析の導出過程を詳細に解説しました。
- ①二元配置実験(繰り返し無し)のデータの構造式が書ける
- ②二元配置実験(繰り返し無し)の平方和の分解の式が書ける
- ③二元配置実験(繰り返し無し)の主効果・交互作用・誤差の期待値が導出できる
- ④二元配置実験(繰り返し無し)の分散分析ができる
- ⑤二元配置実験(繰り返し無し)の主効果・交互作用の区間推定が導出できる
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119