2021/08/19 (更新日: 2024/12/19)

二元配置実験(繰り返し無し)の分散分析・区間推定が解ける

「二元配置実験(繰り返し無し)の分散分析や期待値の導出が複雑でわからない、解けない」、「分散分析表から調べたい効果の区間推定の導出方法がわからない」など、二元配置実験(繰り返し無し)の分散分析の解法がわからず、期待値の式など暗記で片付けていませんか？

こういう疑問に答えます。

本記事のテーマ

二元配置実験(繰り返し無し)の分散分析や期待値の導出ができる

二元配置実験(繰り返し無し)の分散分析や期待値の導出

①二元配置実験(繰り返し無し)のデータの構造式が書ける
②二元配置実験(繰り返し無し)の平方和の分解の式が書ける
③二元配置実験(繰り返し無し)の主効果・交互作用・誤差の期待値が導出できる
④二元配置実験(繰り返し無し)の分散分析ができる
⑤二元配置実験(繰り返し無し)の主効果・交互作用の区間推定が導出できる

記事の信頼性

記事を書いている私は、QC検定１級合格した後、さらに実験計画法に磨きをかけていますので、わかりやすく解説します。本サイトは、4因子繰返し無しの分散分析まで解説します。本サイトは必見です。実験計画法の肝なので、必読です！

●You tube動画も確認ください。

【QC検定®１級合格】実験計画法問題集を販売します！

QC検定®1級合格したい方におススメです。

QC検定®１級、過去全回分の問題と実験計画法参考書を研究して、作り上げたオリジナル良問30題を1500円で提供します。ぜひご購入、学習して合格しましょう。

究める！実験計画法　演習問題を販売します！

実験計画法を究めた方におススメです。

実験計画法をマスターしたい方に、必須な演習問題集(2500円)を作成しました。しっかり勉強して究めましょう。

①二元配置実験(繰り返し無し)のデータの構造式が書ける

データの構造式

2因子の完全配置実験のデータの構造式からスタートします。機械的に書けますね。

二元配置実験のデータの構造式

x_ij=μ+α_i+β_j+e_ij

各平均値をデータの構造式で作る

α、βは母数因子なので、１つの添え字についての合計がすべて0となります。

$\sum_{i=1}^{a} α_i$=0
$\sum_{j=1}^{b} β_j$=0

この関係が、平方和の分解にて
(x+y)²=x²+ y², xy=0
を満たします。

平均値の式の代表例

データの構造式

x_ij=μ+α_i+β_j+e_ij

$\bar{x_{i･}}$=μ+$α_i$+$\bar{e_{i･}}$
$\bar{x_{･j}}$=μ+$β_j$+$\bar{e_{･j}}$
$\bar{\bar{x}}$=μ+$\bar{\bar{e}}$

②二元配置実験(繰り返し無し)の平方和の分解の式が書ける

データの構造式を変形

式を書くと見づらいので、表にまとめます。分散分析はデータの構造式が複雑になると表で整理するのがオススメです。

	S_A	S_B	S_e
$x_{ij}$			1
$\bar{x_{i･}}$	1		-1
$\bar{x_{･j}}$		1	-1
$\bar{\bar{x}}$	-1	-1	1

表から各平方和の導出式が簡単にでますね。S_A S_B,S_eを挙げます。

$S_A$=$\sum_{i=1}^{a}\sum_{j=1}^{b}$$ (\bar{x_{i･}}-\bar{\bar{x}})^2$

$S_B$=$\sum_{i=1}^{a}\sum_{j=1}^{b}$$ (\bar{x_{･j}}-\bar{\bar{x}})^2$

$S_e$=$\sum_{i=1}^{a}\sum_{j=1}^{b}$$(x_{ij}-\bar{x_{i･}}-\bar{x_{･j}}+\bar{\bar{x}})^2$
と書けますね。

③二元配置実験(繰り返し無し)の主効果・交互作用・誤差の期待値が導出できる

期待値については、関連記事確率変数の期待値と分散が計算できる【初心者向け】をご覧下さい。

主効果の分散の期待値の導出

主効果Aの分散の期待値の導出

E[$S_A$]=E[$\sum_{i=1}^{a}\sum_{j=1}^{b}$$(\bar{x_{i･}}-\bar{\bar{x}})^2$]
=E[$\sum_{i=1}^{a}\sum_{j=1}^{b}$$ (α_i+\bar{e_{i･}}-\bar{\bar{e}})^2$]

=E[$\sum_{i=1}^{a}\sum_{j=1}^{b} (α_i )^2$]
+2E[$\sum_{i=1}^{a}\sum_{j=1}^{b}(α_i ) (\bar{e_{i･}}-\bar{\bar{e}}) $]
+E[$\sum_{i=1}^{a}\sum_{j=1}^{b}(\bar{e_{i･}}-\bar{\bar{e}})^2$]

ここで、第2項は、
$\sum_{i=1}^{a}\bar{e_{i･}}$=$a\bar{\bar{e}}$=$\sum_{i=1}^{a}\bar{\bar{e}}$
の関係より、和が0となります。

平方和の分解のポイント

中間項が常に0になる。

平方和は簡単に分解できて、
$ (x_1+x_2+…+x_n)^2$=$x_1^2+x_2^2+…+x_n^2$
が成り立ちます。

この関係が各効果の平方和として分解することができ、
S_T= S_A+ S_B+ …+ S_e
と分解できます。

まずは、暗記で構いませんが、慣れてきたら中間項が0になることを確認してください。高校数学レベルで解けます。

E[$S_A$]
=E[$\sum_{i=1}^{a}\sum_{j=1}^{b}(α_i )^2$]
+E[$\sum_{i=1}^{a}\sum_{j=1}^{b}(\bar{e_{i･}}-\bar{\bar{e}})^2$]
=$b(a-1)σ_A^2$ +$(a-1)(σ_e^2$)

主効果Aの自由度は(a-1)より、分散の期待値E[V_A]が求まります。

E[$V_A$]=$bσ_A^2$ +$σ_e^2$

なお、分散の期待値を以下とします。

$ σ_A^2$=E[$\frac{\sum_{i=1}^{a}α_i^2}{a-1}$]

$σ_e^2$については以下のように解きます。式の意味を読んで見ましょう。慣れるまでは、添字の種類と分母の種類を揃える点に注目しましょう。

$σ_e^2$=E[$\frac{\sum_{i=1}^{a}\sum_{j=1}^{b}(e_{ij}-\bar{\bar{e}})^2}{ab-1}$]
$\frac{σ_e^2}{b}$=E[$\frac{\sum_{i=1}^{a}(e_{i･}-\bar{\bar{e}})^2}{a-1}$]
$\frac{σ_e^2}{a}$=E[$\frac{\sum_{j=1}^{b}(e_{･j}-\bar{\bar{e}})^2}{b-1}$]

主効果Bの分散の期待値の導出

E[$S_B$]=E[$\sum_{i=1}^{a}\sum_{j=1}^{b}$$(\bar{x_{･j}}-\bar{\bar{x}})^2$]
=E[$\sum_{i=1}^{a}\sum_{j=1}^{b}$$ (β_j+\bar{e_{･j}}-\bar{\bar{e}})^2$]

=E[$\sum_{i=1}^{a}\sum_{j=1}^{b}(β_j )^2$]
+2E[$\sum_{i=1}^{a}\sum_{j=1}^{b}(β_j ) (\bar{e_{･j}}-\bar{\bar{e}}) $]
+E[$\sum_{i=1}^{a}\sum_{j=1}^{b}(\bar{e_{･j}}-\bar{\bar{e}})^2$]

ここで、第2項は、
$\sum_{j=1}^{b}\bar{e_{･j}}$=$b\bar{\bar{e}}$=$\sum_{j=1}^{b}\bar{\bar{e}}$
の関係より、和が0となります。

E[$S_B$]
=E[$\sum_{i=1}^{a}\sum_{j=1}^{b} (β_j )^2$]
+E[$\sum_{i=1}^{a}\sum_{j=1}^{b} (\bar{e_{･j}}-\bar{\bar{e}})^2$]
=$a(b-1)σ_B^2$ +$(b-1)(σ_e^2$)

主効果Bの自由度は(b-1)より、分散の期待値E[V_B]が求まります。

E[$V_B$]=$aσ_B^2$ +$σ_e^2$

なお、分散の期待値を以下とします。

$ σ_B^2$=E[$\frac{\sum_{j=1}^{b}β_j^2}{b-1}$]

$σ_e^2$は、
$\frac{σ_e^2}{a}$=E[$\frac{\sum_{i=1}^{a}(e_{･j}-\bar{\bar{e}})^2}{b-1}$]
を適用します。

残差の分散の期待値の導出

E[$S_e$]=E[$\sum_{i=1}^{a}\sum_{j=1}^{b}$$(x_{ij}-\bar{x_{i･}}-\bar{x_{･j}}+\bar{\bar{x}})^2$]
= E[$\sum_{i=1}^{a}\sum_{j=1}^{b}$$(e_{ij}-\bar{e_{i･}}-\bar{e_{･j}}+\bar{\bar{e}})^2$]

意図的に以下のように式変形します。
$(e_{ij}-\bar{\bar{e}})$=$(e_{ij}-\bar{e_{i･}}-\bar{e_{･j}}+\bar{\bar{e}})$+$(\bar{e_{i･}}-\bar{\bar{e}})$+$(\bar{e_{･j}}-\bar{\bar{e}})$

次に、両辺の2乗和の期待値を作ります。次の関係式が成り立ちます(確かめてみてください)。

E[$\sum_{i=1}^{a}\sum_{j=1}^{b} (e_{ij}-\bar{\bar{e}})^2$]
=E[$\sum_{i=1}^{a}\sum_{j=1}^{b}(e_{ij}-\bar{e_{i･}}-\bar{e_{･j}}+\bar{\bar{e}})^2$]
+E[$\sum_{i=1}^{a}\sum_{j=1}^{b}(\bar{e_{i･}}-\bar{\bar{e}})^2$]
+E[$\sum_{i=1}^{a}\sum_{j=1}^{b}(\bar{e_{･j}}-\bar{\bar{e}})^2$]

次に分散$σ_e^2$を作ります。次の4種類ができます。添字の種類とΣの数に注目してください。添字、Σが3つ以➃の➁➂➃の左辺は、$σ_e^2$に自由度a,b,cで割った値となっています。

➀$σ_e^2$=E[$\frac{\sum_{i=1}^{a}\sum_{j=1}^{b}(e_{ij}-\bar{\bar{e}})^2}{ab-1}$]
➁$\frac{σ_e^2}{b}$=E[$\frac{\sum_{i=1}^{a} (\bar{e_{i･}}-\bar{\bar{e}})^2}{a-1}$]
➂$\frac{σ_e^2}{a}$=E[$\frac{\sum_{j=1}^{b} (\bar{e_{･j}}-\bar{\bar{e}})^2}{b-1}$]

➀➁➂の違いを見比べて、慣れましょう。慣れてから式の意味を考えましょう。

次に➀➁➂を変形します。

➀$(ab-1)σ_e^2$=E[$\sum_{i=1}^{a}\sum_{j=1}^{b}(e_{ij}-\bar{\bar{e}})^2$]
➁$(a-1)σ_e^2$=E[$\sum_{i=1}^{a} \sum_{j=1}^{b}(\bar{e_{i･}}-\bar{\bar{e}})^2$]
➂$(b-1)σ_e^2$=E[$\sum_{i=1}^{a}\sum_{j=1}^{b}(\bar{e_{･j}}-\bar{\bar{e}})^2$]

求めたい期待値
E[$\sum_{i=1}^{a}\sum_{j=1}^{b} (e_{ij}-\bar{e_{i･}}-\bar{e_{･j}}+\bar{\bar{e}})^2$]
は➀―➁―➂で算出できます。
E[$\sum_{i=1}^{a}\sum_{j=1}^{b} (e_{ij}-\bar{e_{i･}}-\bar{e_{･j}}+\bar{\bar{e}})^2$]
=$(ab-1)σ_e^2$-$(a-1)σ_e^2$-$(b-1)σ_e^2$
=$(a-1)(b-1)σ_e^2$
となります。

結果をまとめます。

E[$S_e$]
=$(a-1)(b-1)σ_e^2$

残差eの自由度は(a-1)(b-1)より、分散の期待値E[V_e]が求まります。

E[$V_e$]=$σ_e^2$

④二元配置実験(繰り返し無し)の分散分析ができる

自由度の計算

各主効果・交互作用の自由度の計算は簡単です。関連記事【簡単】データの構造式で実験計画法がわかる(必読)に解説しています。まとめると次の3つです。

データの構造式を書く
主効果・交互作用の構造式にある添字から自由度を算出
自由度は表を活用すると簡単に求まる

	S_A	S_B	S_e
a	1		-1
b		1	-1
ab			1
1	-1	-1	1

表から、
Aの列(縦)には、aに1,1に-1とありますから、自由度はa-1、
Bの列(縦)には、bに1,1に-1とありますから、自由度はb-1、
eの列(縦)には、abに1,aに-1,bに-1,1に-1とありますから、自由度はab-a-b+1、
となります。

データの構造式が複雑になるほど、上の表を活用すると自由度が求めやすくなります。

分散分析の結果

分散分析表を作ります。

	φ	E[V]
A	a-1	$σ_e^2$+b$σ_A^2$
B	b-1	$σ_e^2$+a$σ_B^2$
e	(a-1)(b-1)	$σ_e^2$
T	abc-1	–

⑤二元配置実験(繰り返し無し)の主効果・交互作用の区間推定が導出できる

母平均の点推定の導出方法

【簡単】データの構造式から母平均の点推定が導出できる

有効繰返し数と区間推定の導出方法

区間推定は、下の式で算出します。

$$ \bar{μ}±t(φ_e,α)\sqrt{\frac{V_e}{n_e}}$$

区間推定のポイント

ルートの中は、誤差eの分散から個数を割ったものが入る
誤差eの自由度φ_eである。
Veが複数項である場合、サタースウェイトの式から自由度を導出

サタースウェイトの式については、ここを見てください。

主効果の点推定と区間推定の導出

分散の期待値から分散の推定値を導出

分散分析から、eの分散の推定値E[V]を導出します。
V_e=$σ_e^2$
よって、
$\widehat{σ_e^2}$= V_e

主効果Aの点推定と区間推定

点推定：　$\widehat{μ}(A_i)=\bar{x_{i･}}$=$\widehat{μ+α_i}$
=$μ+\bar{x_{i･}}$

分散：$\widehat{Var}(\widehat{μ}( A_i))$
=V[μ+$\bar{x_{i･}}$]
=V[$\bar{x_{i･}}$]
=$\frac{\widehat{σ_e^2}}{b}$

Veが求まったので、自由度φと、点推定μを代入すれば推定区間が求まります。

主効果Bの点推定と区間推定

点推定：　$\widehat{μ}(B_j)=\bar{x_{･j}}$=$\widehat{μ+β_j}$
=$μ+\bar{x_{･j}}$

分散：$\widehat{Var}(\widehat{μ}( B_j))$
=V[μ+$\bar{x_{･j}}$]
=V[$\bar{x_{･j}}$]
=$\frac{\widehat{σ_e^2}}{a}$

Veが求まったので、自由度φと、点推定μを代入すれば推定区間が求まります。

一連の導出過程を解説しました。

まとめ

二元配置実験(繰り返し無し)の分散分析の導出過程を詳細に解説しました。

①二元配置実験(繰り返し無し)のデータの構造式が書ける
②二元配置実験(繰り返し無し)の平方和の分解の式が書ける
③二元配置実験(繰り返し無し)の主効果・交互作用・誤差の期待値が導出できる
④二元配置実験(繰り返し無し)の分散分析ができる
⑤二元配置実験(繰り返し無し)の主効果・交互作用の区間推定が導出できる

実験計画法

	S_A	S_B	S_e
\(x_{ij}\)			1
\(\bar{x_{i･}}\)	1		-1
\(\bar{x_{･j}}\)		1	-1
\(\bar{\bar{x}}\)	-1	-1	1

	φ	E[V]
A	a-1	\(σ_e^2\)+b\(σ_A^2\)
B	b-1	\(σ_e^2\)+a\(σ_B^2\)
e	(a-1)(b-1)	\(σ_e^2\)
T	abc-1	–