乱塊法(4因子)の分散分析・区間推定が解ける【必見】
「乱塊法って何なの?」、「乱塊法の分散分析や期待値の導出がわからない、解けない」、「分散分析表から調べたい効果の区間推定の導出方法がわからない」など、乱塊法の分散分析の解法がわからず、期待値の式など暗記で片付けていませんか?
こういう疑問に答えます。
本記事のテーマ
乱塊法(4因子)の分散分析や期待値の導出
- ➀乱塊法とは何かがわかる
- ②乱塊法(4因子)のデータの構造式が書ける
- ③乱塊法(4因子)の平方和の分解の式が書ける
- ④乱塊法の主効果・交互作用・誤差の期待値が導出できる
- ⑤乱塊法の分散分析ができる
- ⑥乱塊法の主効果・交互作用の区間推定が導出できる
- ⑦乱塊法(4因子)の分散分析を導出できる演習問題
記事の信頼性
記事を書いている私は、実験計画法に磨きをかけていますので、わかりやすく解説します。本記事は、どこに書いていない、私が研究して見つけた本記事限定の内容です。
実験計画法の肝なので、必読です!
➀乱塊法とは何かがわかる
乱塊法と聞いて、「難しそう」と思いますよね。次の2つの理由が難しい印象を与えるからだと思います。
- 英語をそのまま日本語にするから変な言葉(乱塊法)になる
- 農場の歴史や局所管理は乱塊法の原則であるという導入が理解しにくい
乱塊法よりRandomized block designの方がかっこいい
英語をそのまま訳すから変な名前になる
日本語:乱(Randomized)塊(block)法(design)
英語の方がわかりやすいですね。
Randomと「乱れ」は一致しませんし、blockは確かに「塊」ですけど、塊という単語はあまり使いませんよね。
農場の歴史や局所管理は乱塊法の原理であることが理解できない
理解しなくても大丈夫
実験計画法の教科書は、乱塊法は局所管理につながり、フィッシャーの農業実験から始まったとよく書いています。でも、それを理解するのが難しいです。
局所管理そのものも理解しにくいので、乱塊法は難解だと遠ざけてしまいます。
フィッシャーの農業実験の歴史の内容もよくわからないです。
でも、理解しなくても大丈夫です。次の定義が理解できれば十分使いこなせます。
乱塊法の定義【これだけ理解しましょう】
- 特別な手法ではなく、完全配置実験と同じ
- 反復などの特殊な因子を含むだけ
この2つだけです。
例えば3因子の完全配置実験なら、主効果α、β、γ、交互作用はα、β、γの組み合わせと残差がありますね。このうち、γがα、βと扱いがちょっと異なる因子であるとするのが乱塊法です。この程度の解釈で十分です。
私の提案する解釈の方が、乱塊法の応用や分割法との併用、分散分析の解析がスムーズに行きます。
局所管理やフィッシャーの農業実験の歴史の知識は、乱塊法を活用する上でそれほど重要ではありません。
乱塊法の入口でつまずくより、さっと概要を理解して、分散分析や区間推定の解析に重点をおいてください。手法にそれほどの意味を理解しようとしなくてもOKです。
関連記事【簡単】実験計画法のフィッシャー3原則がすぐわかる方法に局所管理がすぐ理解できる解説を、関連記事【簡単】母数因子と変量因子の違いがすぐわかるに、特殊な因子は母数因子ではなく、変量因子として扱う内容を詳しく解説しています。
データの構造式から乱塊法を理解する
- 完全配置実験のデータの構造式を作る
- 一部の項を変形すれば乱塊法になる
完全配置実験のデータの構造式を乱塊法へ変形するプロセスが理解できれば十分です。
●You tube動画もご覧ください。
②乱塊法(4因子)のデータの構造式が書ける
●基本的な導出方法は、乱塊法(3因子)と同じです。
乱塊法(3因子)の分散分析・区間推定が解ける【必見】 実験計画法の、乱塊法(3因子)の分散分析、分散の期待値の導出、主効果・交互作用の区間推定の導出ができますか?公式暗記で済ませていませんか?本記事は、乱塊法(3因子)の分散分析、分散の期待値の導出、区間推定の導出を解説します。分散分析、期待値の導出、区間推定をマスターしたい方は必見です。 |
データの構造式
4因子の完全配置実験のデータの構造式からスタートします。機械的に書けますね。
四元配置実験のデータの構造式
xijkl=μ+αi+βj+γk+δl
+ (αβ) ij+(αγ) ik+(αδ)il
+(βγ) jk+(βδ) jl+(γδ)kl
+(αβγ) ijk+ (αβδ) ijl+(αγδ)ikl+(βγδ)jkl
+ eijkl
次に、乱塊法に変形します。ここで、γkを反復因子としてブロック因子に定義します。因子A,B,Dは調べたい因子、Cは反復因子として区別します。
- 調べたい因子A,B,D:主効果と互いの交互作用を対象
- 反復因子C:主効果のみ
反復因子Cと因子A,B,Dとの交互作用に意味を持たないため、残差にプーリング
します。
まとめると、次の式変形を行います。
- γkをαiの前に持っていく
- (αγ) ik、(βγ) jk、(γδ)kl、
(αβγ) ijk、 (αγδ)iklを
eijklへプーリングする。
乱塊法(4因子)のデータの構造式
xijkl=μ+γk+αi+βj+δl
+ (αβ) ij+ (αδ)il+(βδ) jl
+ (αβδ) ijl+ eijkl
とすれば、乱塊法に変えることができます。
各平均値をデータの構造式で作る
母数因子と変量因子の違い
関連記事【簡単】母数因子と変量因子の違いがすぐわかるにて、母数因子と変量因子を解説しました。
母数因子と変量因子
母数因数:α、β、δ、αβ、αδ、βδ、αβδ
変量因子:γ、e
平均値
母数因数の平均は0。
変量因子の平均は0ではない。
平均値を式にする場合、添字のない文字項はすべて0にしますが、変量因子の場合は平均値をいれます。
平均値の式の代表例
データの構造式
xijkl=μ+γk+αi+βj+δl
+ (αβ) ij+ (αδ)il+(βδ) jl
+ (αβδ) ijl+ eijkl
\(\bar{x_{i・・・}}\)”=μ+\(\bar{r}\)+\(α_i\)+\(\bar{e_{i・・・}}\)
\(\bar{x_{・j・・}}\)”=μ+\(\bar{r}\)+\(β_j\)+\(\bar{e_{・j・・}}\)
\(\bar{x_{・・k・}}\)”=μ+\(γ_k\)+\(\bar{e_{・・k・}}\)
\(\bar{x_{・・・l}}\)”=μ+\(\bar{r}\)+\(δ_l\)+\(\bar{e_{・・・l}}\)
\(\bar{x_{ij・・}}\)”=μ+\(\bar{r}\)+\(α_i\)+\(β_j\)+\((αβ)_{ij}\)+\(\bar{e_{ij・・}}\)
\(\bar{x_{i・k・}}\)”=μ+\(γ_k\)+\(α_i\)+\(\bar{e_{i・k・}}\)
\(\bar{x_{i・・l}}\)”=μ+\(\bar{r}\)+\(α_i\)+\(δ_l\)+\((αδ)_{il}\)+\(\bar{e_{i・・l}}\)
\(\bar{x_{・jk・}}\)”=μ+\(γ_k\)+\(β_j\)+\(\bar{e_{・jk・}}\)
\(\bar{x_{・j・l}}\)”=μ+\(\bar{r}\)+\(β_j\)+\(δ_l\)+\((βδ)_{jl}\)+\(\bar{e_{・j・l}}\)
\(\bar{x_{・・kl}}\)”=μ+\(γ_k\)+\(δ_l\)+\(\bar{e_{・・kl}}\)
\(\bar{x_{ijk・}}\)”=μ+\(γ_k\)+\(α_i\)+\(β_j\)+\((αβ)_{ij}\)+\(\bar{e_{ijk・}}\)
\(\bar{x_{ij・l}}\)”=μ+\(\bar{r}\)+\(α_i\)+\(β_j\)+\(δ_l\)+\((αβ)_{ij}\)+\((αδ)_{il}\)+\((βδ)_{jl}\)+\((αβδ)_{ijl}\)+\(\bar{e_{ij・l}}\)
\(\bar{x_{i・kl}}\)”=μ+\(γ_k\)+\(α_i\)+\(δ_l\)+\((αδ)_{il}\)+\(\bar{e_{i・kl}}\)
\(\bar{x_{・jkl}}\)”=μ+\(γ_k\)+\(β_j\)+\(δ_l\)+\((βδ)_{jl}\)+\(\bar{e_{・jkl}}\)
\(\bar{\bar{x}}\)”=μ+\(\bar{r}\)+\(\bar{\bar{e}}\)
③乱塊法(4因子)の平方和の分解の式が書ける
データの構造式を変形
式を書くと見づらいので、表にまとめます。分散分析はデータの構造式が複雑になると表で整理するのがオススメです。
SA | SB | SC | SD | SA×B | |
\(x_{ijkl}\) | |||||
\(\bar{x_{i・・・}}\) | 1 | -1 | |||
\(\bar{x_{・j・・}}\) | 1 | -1 | |||
\(\bar{x_{・・k・}}\) | 1 | ||||
\(\bar{x_{・・・l}}\) | 1 | ||||
\(\bar{x_{ij・・}}\) | 1 | ||||
\(\bar{x_{i・k・}}\) | |||||
\(\bar{x_{i・・l}}\) | |||||
\(\bar{x_{・jk・}}\) | |||||
\(\bar{x_{・j・l}}\) | |||||
\(\bar{x_{・・kl}}\) | |||||
\(\bar{x_{ijk・}}\) | |||||
\(\bar{x_{ij・l}}\) | |||||
\(\bar{x_{i・kl}}\) | |||||
\(\bar{x_{・jkl}}\) | |||||
\(\bar{\bar{x}}\) | -1 | -1 | -1 | -1 | 1 |
SA×D | SB×D | SA×B×D | Se | |
\(x_{ijkl}\) | 1 | |||
\(\bar{x_{i・・・}}\) | -1 | 1 | ||
\(\bar{x_{・j・・}}\) | -1 | 1 | ||
\(\bar{x_{・・k・}}\) | -1 | |||
\(\bar{x_{・・・l}}\) | -1 | -1 | 1 | |
\(\bar{x_{ij・・}}\) | -1 | |||
\(\bar{x_{i・k・}}\) | ||||
\(\bar{x_{i・・l}}\) | 1 | -1 | ||
\(\bar{x_{・jk・}}\) | ||||
\(\bar{x_{・j・l}}\) | 1 | -1 | ||
\(\bar{x_{・・kl}}\) | ||||
\(\bar{x_{ijk・}}\) | ||||
\(\bar{x_{ij・l}}\) | 1 | -1 | ||
\(\bar{x_{i・kl}}\) | ||||
\(\bar{x_{・jkl}}\) | ||||
\(\bar{\bar{x}}\) | 1 | 1 | -1 | 1 |
表から各平方和の導出式が簡単にでますね。SC、SA×B×D,Seを例に挙げます。
\(S_C\)=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\)\( (\bar{x_{‥k・}}-\bar{\bar{x}})^2\)
\(S_{ A×B×D }\)=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\)
\((\bar{x_{ij・l}}-\bar{x_{ij‥}}-\bar{x_{i・・l}}-\bar{x_{・j・l}}\)
\(\bar{x_{i・・・}}+\bar{x_{・j・・}}+\bar{x_{・・・l}}-\bar{\bar{x}})^2\)
\( S_e\)= \(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\)\((x_{ijkl}-\bar{x_{ij・l}}-\bar{x_{‥k・}}+\bar{\bar{x}})^2\)
と書けますね。他の平方和も同様にΣΣΣ( )^2で計算できます。
④乱塊法の主効果・交互作用・誤差の期待値が導出できる
期待値については、関連記事確率変数の期待値と分散が計算できる【初心者向け】をご覧下さい。
主効果の分散の期待値の導出
E[\(S_C\)]=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\)\((\bar{x_{・・k・}}-\bar{\bar{x}})^2\)]
=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\)
\( (γ_k+\bar{e_{・・k・}}-\bar{\bar{e}})^2\)]
=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\)\((γ_k )^2\)]
+E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\)\((\bar{e_{・・k・}}-\bar{\bar{e}})^2\)]
=\(abd(c-1)σ_C^2\) +\((c-1)(σ_e^2\))
主効果Cの自由度は(c-1)より、分散の期待値E[VC]が求まります。
E[\(V_C\)]=\(abdσ_C^2\) +\(σ_e^2\)
なお、分散の期待値を以下とします。
\( σ_C^2\)=E[\(\frac{\sum_{k=1}^{a}γ_k^2}{c-1}\)]
\(σ_e^2\)については解説集にあります。
交互作用の分散の期待値の導出
E[\(S_{ A×B×D }\)]=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d} \)
\((\bar{x_{ij・l}}-\bar{x_{ij‥}}-\bar{x_{i・・l}}-\bar{x_{・j・l}}\)
\(\bar{x_{i・・・}}+\bar{x_{・j・・}}+\bar{x_{・・・l}}-\bar{\bar{x}})^2\)]
= E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d} \)
\(((αβδ)_{ijl}+(\bar{e_{ij・l}}-\bar{e_{ij‥}}-\bar{e_{i・・l}}-\bar{e_{・j・l}}\)
\(\bar{e_{i‥・}}-\bar{e_{・j‥}}-\bar{e_{・・・l}}+\bar{\bar{e}}))^2\)]
= E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\)\((αβδ)_{ijl}^2\)]
+ E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\)
\((\bar{e_{ij・l}}-\bar{e_{ij‥}}-\bar{e_{i・・l}}-\bar{e_{・j・l}}\)
\(\bar{e_{i‥・}}-\bar{e_{・j‥}}-\bar{e_{・・・l}}+\bar{\bar{e}})^2\)]
第1項:
=c E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{l=1}^{d} \)\(((αβδ)_{ijl}^2)\)]
=\(c(a-1)(b-1)(d-1)σ_{A×B×D}^2\)
第2項:
=\((abd-ab-ad-bd+a+b+d-1)σ_e^2\)
=\((a-1)(b-1)(d-1) σ_e^2\)
E[\(S_{A×B×D}\)]
=\(c(a-1)(b-1)(d-1)σ_{A×B×D}^2\)+\((a-1)(b-1)(d-1)σ_e^2\)
交互作用A×B×Dの自由度は(a-1)(b-1)(d-1)より、分散の期待値E[VA×B×D]が求まります。
E[\(V_{A×B×D}\)]=\(cσ_{A×B×D}^2\)+\(σ_e^2\)
なお、分散の期待値を以下とします。
\( σ_{ A×B×D }^2\)=E[\(\frac{\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{l=1}^{d}(αβδ)_{ijl}^2}{(a-1)(b-1)(d-1)}\)]
\(σ_{e}^2\)については解説集にあります。
残差の分散の期待値の導出
E[\(S_e\)]= E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\)
\((x_{ijkl}-\bar{x_{ij・l}}-\bar{x_{‥k・}}+\bar{\bar{x}})^2\)]
= E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\)
\((e_{ijkl}-\bar{e_{ij・l}}-\bar{e_{‥k・}}+\bar{\bar{e}})^2\)]
=(abcd-abd-c+1)\(σ_e^2\)
=(abd-1)(c-1) \(σ_e^2\)
E[\(S_e\)]=(abd-1)(c-1) \(σ_e^2\)
残差eの自由度は(abd-1)(c-1)より、分散の期待値E[Ve]が求まります。自由度の計算結果は次の節で紹介します。計算は複雑ですが、自由度で割ると\(σ_e^2\)になることがわかります。
E[e]=\(σ_e^2\)
⑤乱塊法の分散分析ができる
自由度の計算
各主効果・交互作用の自由度の計算は簡単です。関連記事【簡単】データの構造式で実験計画法がわかる(必読)に解説しています。まとめると次の3つです。
- データの構造式を書く
- 主効果・交互作用の構造式にある添字から自由度を算出
- 自由度は表を活用すると簡単に求まる
自由度をまとめます。
SA | SB | SC | SD | SA×B | |
a | 1 | -1 | |||
b | 1 | -1 | |||
c | 1 | ||||
d | 1 | ||||
ab | 1 | ||||
ac | |||||
ad | |||||
bc | |||||
bd | |||||
cd | |||||
abc | |||||
abd | |||||
acd | |||||
bcd | |||||
abcd | |||||
1 | -1 | -1 | -1 | -1 | 1 |
SA×D | SB×D | SA×B×D | Se | |
a | -1 | 1 | ||
b | -1 | 1 | ||
c | -1 | |||
d | -1 | -1 | 1 | |
ab | -1 | |||
ac | ||||
ad | 1 | -1 | ||
bc | ||||
bd | 1 | -1 | ||
cd | ||||
abc | ||||
abd | 1 | -1 | ||
acd | ||||
bcd | ||||
abcd | 1 | |||
1 | 1 | 1 | -1 | 1 |
分散分析の結果
分散分析表を作ります。
φ | E[V] | |
A | a-1 | \(σe^2\)+bcd\(σ_A^2\) |
B | b-1 | \(σe^2\)+acd\(σ_B^2\) |
C | c-1 | \(σe^2\)+abd\(σ_C^2\) |
D | d-1 | \(σe^2\)+abc\(σ_D^2\) |
A×B | (a-1)(b-1) | \(σe^2\)+cd\(σ_{A×B}^2\) |
A×D | (a-1)(d-1) | \(σe^2\)+bc\(σ_{A×D}^2\) |
B×D | (b-1)(d-1) | \(σe^2\)+ac\(σ_{B×D}^2\) |
A×B×D | (a-1)(b-1)(d-1) | \(σe^2\)+c\(σ_{A×B×D}^2\) |
e | (abd-1)(c-1) | \(σe^2\) |
T | abcd-1 | – |
⑥乱塊法の主効果・交互作用の区間推定が導出できる
母平均の点推定の導出方法
有効繰返し数と区間推定の導出方法
区間推定は、下の式で算出します。
$$ \bar{μ}±t(φ_e,α)\sqrt{\frac{V_e}{n_e}}$$
区間推定のポイント
- ルートの中は、誤差eの分散から個数を割ったものが入る
- 誤差eの自由度φeである。
- Veが複数項である場合、サタースウェイトの式から自由度を導出
サタースウェイトの式については、ここを見てください。
主効果の点推定と区間推定の導出
分散の期待値から分散の推定値を導出
分散分析から、eの分散の推定値E[V]を導出します。
VC=\(σe^2\)+abd\(σ_C^2\)
Ve=\(σe^2\)
よって、
\(\widehat{σ_C^2}\)= \(\frac{1}{abd}\)( VC-Ve)
\(\widehat{σ_e^2}\)= Ve
主効果の点推定と区間推定
点推定: \(\widehat{μ}(C_k)=\bar{x_{‥k・}}\)=\(\widehat{μ+γ_k}\)
=\(μ+γ_k +\bar{e_{‥k・}}\)
分散:\(\widehat{Var}(\widehat{μ}(C_k))\)
=V[μ+\(γ_k +\bar{e_{‥k・}}\)]
=V[\(γ_k\)]+V[\(\bar{e_{‥k・}}\)]
=\(\widehat{σ_C^2}\)+\(\frac{\widehat{σ_e^2}}{abd}\)
Veが求まったので、自由度φと、点推定μを代入すれば推定区間が求まります。
交互作用の点推定と区間推定
点推定: \(\widehat{μ}(A_i B_j D_l)\)=\(\bar{x_{ij・l}}\)
=\(μ+\bar{γ}+α_i+β_j+δ_l+(αβδ)_{ijl}+\bar{e_{ij・l}}\)
分散:\(\widehat{Var}(\widehat{μ}(A_i B_j D_l))\)
=V[μ+\(\bar{γ}+α_i+β_j+δ_l+(αβδ)_{ijl}+\bar{e_{ij・l}}\)]
=V[\(bar{r}\)]+V[\(\bar{e_{ij・l}}\)]
=\(\frac{\widehat{σ_C^2}}{C}\)+\(\frac{\widehat{σ_e^2}}{c}\)
Veが求まったので、自由度φと、点推定μを代入すれば推定区間が求まります。
一連の導出過程を解説しました。
⑦乱塊法(4因子)の分散分析を導出できる演習問題
本記事で扱ったデータの構造式において、以下の演習問題を解いてみましょう。詳細は解説集にあります。
xijkl=μ+γk+αi+βj+δl
+ (αβ) ij+ (αδ)il+(βδ) jl
+ (αβδ) ijl+ eijkl
因子A,B,C,Dの自由度はそれぞれa,b,c,dとする。
また因子Cは反復として変量因子として扱う。
(1)主効果、交互作用,残差eの自由度と分散の期待値を導出せよ。
(2)主効果,交互作用の点推定と区間推定を計算せよ。
(詳細は解説集にあります。)
まとめ
乱塊法(4因子)の分散分析の導出過程を詳細に解説しました。
- ➀乱塊法とは何かがわかる
- ②乱塊法(4因子)のデータの構造式が書ける
- ③乱塊法(4因子)の平方和の分解の式が書ける
- ④乱塊法の主効果・交互作用・誤差の期待値が導出できる
- ⑤乱塊法の分散分析ができる
- ⑥乱塊法の主効果・交互作用の区間推定が導出できる
- ⑦乱塊法(4因子)の分散分析を導出できる演習問題
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119