【本記事限定】枝分かれ実験(並列型)の分散分析・区間推定が解ける
「枝分かれ実験って何なの?」、「枝分かれ実験の分散分析や期待値の導出がわからない、解けない」、「分散分析表から調べたい効果の区間推定の導出方法がわからない」など、枝分かれ実験の分散分析の解法がわからず、期待値の式など暗記で片付けていませんか?
こういう疑問に答えます。
本記事のテーマ
枝分かれ実験の分散分析や期待値の導出
- ➀枝分かれ実験(並列型)とは何かがわかる
- ②枝分かれ実験(並列型)のデータの構造式が書ける
- ③枝分かれ実験(並列型)の平方和の分解の式が書ける
- ④枝分かれ実験(並列型)の主効果・交互作用・誤差の期待値が導出できる
- ⑤枝分かれ実験(並列型)の分散分析ができる
- ⑥枝分かれ実験(並列型)の主効果・交互作用の区間推定が導出できる
- ⑦枝分かれ実験(並列型)の分散分析が導出できる演習問題
記事の信頼性
記事を書いている私は、実験計画法に磨きをかけていますので、わかりやすく解説します。本記事は、どこに書いていない、私が研究して見つけた本記事限定の内容です。
実験計画法の肝なので、必読です!
●You tube動画もごらんください。
➀枝分かれ実験(並列型)とは何かがわかる
枝分かれ図で理解する
枝分かれ方法は、直列と並列が考えつきますね。教科書ではよく直列型が紹介されます。
本記事は、並列型について解説します。本記事しか書いていない限定モノです。
また、直列型は本サイト限定で関連記事枝分かれ実験(直列型)の分散分析・区間推定が解ける【必見】にて、解説します。
データの構造式から枝分かれ実験を理解する
完全配置実験のデータの構造式を作る一部の項を変形すれば枝分かれ実験になる- 枝分かれ図をそのままデータの構造式に書く
本サイトでは、すべての実験計画法の手法は、完全配置実験のデータの構造式を一部書き換えてできることを解説しています。枝分かれ実験も同様にできるのですが、枝分かれ図を見て、そのまま式にした方が楽です。
②枝分かれ実験(並列型)のデータの構造式が書ける
データの構造式
枝分かれ図をそのままデータの構造式に書きます。
- 因子Bは因子Aから枝分かれ→βijとする。
- 因子Cは因子Bから枝分かれ→γijkとする。
- 因子Dは因子Aから枝分かれ→δilとする。
まとめると、データの構造式ができます。
枝分かれ実験(並列型)のデータの構造式
xijklm=μ+αi+βij+γijk+δil+eijklm
直列型の場合と比較すると、
δijkl(直列型)
δil(並列型)
に違いがあります。
各平均値をデータの構造式で作る
母数因子と変量因子の違い
関連記事【簡単】母数因子と変量因子の違いがすぐわかるにて、母数因子と変量因子を解説しました。
母数因子と変量因子
母数因数:取らない場合が多い
変量因子:α、β、γ、δ、e
枝分かれ実験では、ロット間の誤差、サンプル間の誤差、測定誤差を因子として割当てることがあり、誤差は変量因子なため、母数因数を取らないことがあります。主効果の分散の期待値は母数因数でも変量因子でも関係なく、同じ値になります。
変数に意味を持たせるなら母数因子と変量因子をはっきり分けるとよいですが、
分散の期待値はどちらも同じになるようにしているので、母数因子も変量因子もどちらでもよいと思います。
本記事では、教科書的に変量因子として分散の期待値を導出します。
平均値
母数因数の平均は0。
変量因子の平均は0ではない。
平均値を式にする場合、添字のない文字項はすべて0にしますが、変量因子の場合は平均値をいれます。
枝分かれ実験のデータの構造式
\(x_{ijklm}\)=μ+\(α_i\)+\(β_{ij}\)+\(γ_{ijk}\)+\(δ_{il}\)+\(e_{ijklm}\)
\(\bar{x_{i・・・・}}\)=μ+\(α_i\)+\(\bar{β_{i・}}\)+\(\bar{γ_{i・・}}\)+\(\bar{δ_{i・}}\)+\(\bar{e_{i・・・・}}\)
\(\bar{x_{ij・・・}}\)=μ+\(α_i\)+\(β_{ij}\)+\(\bar{γ_{ij・}}\)+\(\bar{δ_{i・}}\)+\(\bar{e_{ij・・・}}\)
\(\bar{x_{ijk・・}}\)=μ+\(α_i\)+\(β_{ij}\)+\(γ_{ijk}\)+\(\bar{δ_{i・}}\)+\(\bar{e_{ijk・・}}\)
\(\bar{x_{ijkl・}}\)=μ+\(α_i\)+\(β_{ij}\)+\(γ_{ijk}\)+\(δ_{il}\)+\(\bar{e_{ijkl・}}\)
\(\bar{\bar{x}}\)=μ+\(\bar{\bar{α}}\)+\(\bar{\bar{β}}\)+\(\bar{\bar{γ}}\)+\(\bar{\bar{δ}}\)+\(\bar{\bar{e}}\)
③枝分かれ実験(並列型)の平方和の分解の式が書ける
データの構造式を変形
式を書くと見づらいので、表にまとめます。分散分析はデータの構造式が複雑になると表で整理するのがオススメです。
SA | SB | SC | SD | Se | |
\(x_{ijklm}\) | 1 | ||||
\(\bar{x_{i・・・・}}\) | 1 | -1 | -1 | 1 | |
\(\bar{x_{ij・・・}}\) | 1 | -1 | |||
\(\bar{x_{ijk・・}}\) | 1 | -1 | |||
\(\bar{x_{i・・l・}}\) | 1 | -1 | |||
\(\bar{\bar{x}}\) | -1 |
直列型との違いをオレンジ色で明記しました。
表から各平方和の導出式が簡単にでますね。SA、SC、Seを例に挙げます。
\(S_B\)=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\sum_{m=1}^{e}\)
\( (\bar{x_{ij‥・}}-\bar{x_{i‥‥}})^2\)
\(S_D\)=\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\sum_{m=1}^{e}\)
\( (\bar{x_{i・・l・}}-\bar{x_{i・・・・}})^2\)
\( S_e\)= \(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\sum_{m=1}^{e}\)
\( (\bar{x_{ijklm}}-\bar{x_{ijk・・}}-\bar{x_{i・・l・}}+\bar{x_{i‥・・}})^2\)
と書けますね。他の平方和も同様にΣΣΣ( )^2で計算できます。
④枝分かれ実験(並列型)の主効果・交互作用・誤差の期待値が導出できる
期待値については、関連記事確率変数の期待値と分散が計算できる【初心者向け】をご覧下さい。
主効果SBの分散の期待値の導出
E[\(S_B\)]=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\sum_{m=1}^{e}\)
\((\bar{x_{ij‥・}}-\bar{x_{i‥‥}})^2\)]
=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\sum_{m=1}^{e}\)
\(((β_{ij}-\bar{β_{i・}})+(\bar{γ_{ij・}}-\bar{γ_{i・・}})\)
+ \((\bar{e_{ij・・・}}-\bar{e_{i‥‥}}))^2\)]
=cdeE[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)
\((β_{ij}-\bar{β_{i・}})^2\)]
+deE[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\)
\((\bar{γ_{ij・}}-\bar{γ_{i・・}})^2\)]
+cdeE[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)
\((\bar{e_{ij・・・}}-\bar{e_{i‥‥}})^2\)
=\(a(b-1)cdeσ_B^2\)+\(a(b-1)deσ_C^2\)+\(a(b-1)σ_e^2\)
主効果Bの自由度はa(b-1)より、分散の期待値E[VB]が求まります。
E[\(V_B\)]=\(cdeσ_B^2\) +\(deσ_C^2\)+\(σ_e^2\)
なお、分散の期待値を以下とします。
\( σ_B^2\)=E[\(\frac{\sum_{i=1}^{a}\sum_{j=1}^{b} (β_{ij}-\bar{β_{i・}})^2}{a(b-1)}\)]
\(σ_e^2\)については解説集にあります。
主効果SDの分散の期待値の導出
E[\(S_D\)]=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\sum_{m=1}^{e}\)
\((\bar{x_{i・・l・}}-\bar{x_{i・・・・}})^2\)]
=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\sum_{m=1}^{e}\)
\(((δ_{il}-\bar{δ_{i・}})\)+\((\bar{e_{i・・l・}}-\bar{e_{i・…}}))^2\)]
=\(abc(d-1)eσ_D^2\)+\(a(d-1)σ_e^2\)
主効果Dの自由度はa(d-1)より、分散の期待値E[VD]が求まります。
E[\(V_D\)]=\(bceσ_D^2\) +\(σ_e^2\)
なお、分散の期待値を以下とします。
\( σ_D^2\)=E[\(\frac{\sum_{i=1}^{a}\sum_{l=1}^{d} (δ_{il}-\bar{δ_{i・}})^2}{a(d-1)}\)]
\(σ_e^2\)については解説集にあります。
残差の分散の期待値の導出
E[\( S_e\)]= E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\sum_{m=1}^{e}\)
\( (\bar{x_{ijklm}}-\bar{x_{ijk・・}}-\bar{x_{i‥l・}}+\bar{x_{i‥‥}})^2\)]
=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\sum_{m=1}^{e}\)
\((\bar{e_{ijklm}}-\bar{e_{ijk・・}}-\bar{e_{i‥l・}}+\bar{e_{i‥‥}})^2\)]
= \(a(bcde-bc-d+1)σ_e^2\)
E[\( S_e\)]= a(bcde-bc-d+1)\(σ_e^2\)
残差eの自由度はa(bcde-bc-d+1)より、分散の期待値E[V e]が求まります。自由度の計算結果は次の節で紹介します。
E[\(S_e\)]= \(σ_e^2\)
⑤枝分かれ実験(並列型)の分散分析ができる
自由度の計算
各主効果・交互作用の自由度の計算は簡単です。関連記事【簡単】データの構造式で実験計画法がわかる(必読)に解説しています。まとめると次の3つです。
- データの構造式を書く
- 主効果・交互作用の構造式にある添字から自由度を算出
- 自由度は表を活用すると簡単に求まる
自由度をまとめます。
A | B | C | D | e | |
a | 1 | -1 | -1 | 1 | |
ab | 1 | -1 | |||
abc | 1 | -1 | |||
ad | 1 | -1 | |||
abcde | 1 | ||||
1 | -1 |
直列型との違いをオレンジ色で明記しました。
分散分析の結果
分散分析表を作ります。
φ | E[V] | |
A | a-1 | \(σ_e^2\)+\(bceσ_D^2\)+\(deσ_C^2\)+\(cdeσ_B^2\)+\(bcdeσ_A^2\) |
B | a(b-1) | \(σ_e^2\)+\(deσ_C^2\)+\(cdeσ_B^2\) |
C | ab(c-1) | \(σ_e^2\)+\(deσ_C^2\) |
D | a(d-1) | \(σ_e^2\)+\(bceσ_D^2\) |
e | a(bcde-bc-d+1) | \(σ_e^2\) |
T | abcde-1 | – |
⑥枝分かれ実験(並列型)の主効果・交互作用の区間推定が導出できる
母平均の点推定の導出方法
有効繰返し数と区間推定の導出方法
区間推定は、下の式で算出します。
$$ \bar{μ}±t(φ_e,α)\sqrt{\frac{V_e}{n_e}}$$
区間推定のポイント
- ルートの中は、誤差eの分散から個数を割ったものが入る
- 誤差eの自由度φeである。
- Veが複数項である場合、サタースウェイトの式から自由度を導出
サタースウェイトの式については、ここを見てください。
主効果の点推定と区間推定の導出
分散の期待値から分散の推定値を導出
分散分析から、a,b,c,d,eの分散の推定値E[V]を導出します。すべて変量因子なのでE[V]を求めます。
V | |
A | VA=\(\widehat{σ_e^2}\)+\(\widehat{bceσ_D^2}\)+\(\widehat{deσ_C^2}\)+\(\widehat{cdeσ_B^2}\)+\(\widehat{bcdeσ_A^2}\) |
B | VB=\(\widehat{σ_e^2}\)+\(\widehat{deσ_C^2}\)+\(\widehat{cdeσ_B^2}\) |
C | VC=\(\widehat{σ_e^2}\)+\(\widehat{deσ_C^2}\) |
D | VD=\(\widehat{σ_e^2}\)+\(\widehat{bceσ_D^2}\) |
e | Ve=\(\widehat{σ_e^2}\) |
上の表から、分散の推定値を求めます。
\(\widehat{σ_A}^2=\frac{1}{bcde}(V_A-V_B)\)
\(\widehat{σ_B}^2=\frac{1}{cde}(V_B-V_C)\)
\(\widehat{σ_C}^2=\frac{1}{de}(V_C-V_e)\)
\(\widehat{σ_D}^2=\frac{1}{bce}(V_D-V_e\)
\(\widehat{σ_e^2}\)=Ve
データの構造式
xijklm=μ+αi+βij+γijk+δil+eijklm
主効果Bの点推定と区間推定
点推定: \(\widehat{μ}(B_{ij})=\bar{x_{ij・‥}}\)=\(\widehat{μ+β_{ij}}\)
=\(μ+β_{ij}+\bar{γ_{ij・}}+\bar{e_{ij…}}\)
分散:\(\widehat{Var}(\widehat{μ}(β_{ij}))\)
=V[\(μ+β_{ij}+\bar{γ_{ij・}}+\bar{e_{ij…}}\)]
=V[\(\bar{γ_{ij・}}+\bar{e_{ij…}}\)]
=\(\frac{1}{c}V_C\)+ \(\frac{1}{cde}V_e\)
Vが求まったので、自由度φと、点推定μを代入すれば推定区間が求まります。
主効果Dの点推定と区間推定
点推定: \(\widehat{μ}(D_l)=\bar{x_{i‥l・}}\)
=\(\widehat{μ+δ_{il}}\)
=\(μ+δ_{il}+\bar{e_{i‥l・}}\)
分散:\(\widehat{Var}(\widehat{μ}(δ_{il})\)
=V[\(μ+δ_{il}+\bar{e_{i‥l・}}\)]
=V[\(\bar{e_{i‥l・}}\)]
=\(\frac{1}{bce}V_e\)
Vが求まったので、自由度φと、点推定μを代入すれば推定区間が求まります。
一連の導出過程を解説しました。
⑦枝分かれ実験(並列型)の分散分析が導出できる演習問題
本記事で扱ったデータの構造式において、以下の演習問題を解いてみましょう。詳細は解説集にあります。
xijklm=μ+αi+βij+γijk+δil+eijklm
因子A,B,C,D,eの自由度はそれぞれa,b,c,d,eとする。
(1)主効果および残差の自由度と分散の期待値を導出せよ。
(2) 主効果の点推定と区間推定を計算せよ。
(詳細は解説集にあります。)
まとめ
枝分かれ実験の分散分析の導出過程を詳細に解説しました。
- ➀枝分かれ実験(並列型)とは何かがわかる
- ②枝分かれ実験(並列型)のデータの構造式が書ける
- ③枝分かれ実験(並列型)の平方和の分解の式が書ける
- ④枝分かれ実験(並列型)の主効果・交互作用・誤差の期待値が導出できる
- ⑤枝分かれ実験(並列型)の分散分析ができる
- ⑥枝分かれ実験(並列型)の主効果・交互作用の区間推定が導出できる
- ⑦枝分かれ実験(並列型)の分散分析が導出できる演習問題
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119