多水準法の分散分析・区間推定が解ける【必見】
「多水準法って何なの?」、「多水準法の分散分析や期待値の導出がわからない、解けない」、「分散分析表から調べたい効果の区間推定の導出方法がわからない」など、多水準法の分散分析の解法がわからず、期待値の式など暗記で片付けていませんか?
こういう疑問に答えます。
本記事のテーマ
多水準法の分散分析や期待値の導出
- ➀多水準法とは何かがわかる
- ②多水準法のデータの構造式が書ける
- ③平方和の分解の式が書ける
- ④多水準法の主効果・交互作用・誤差の分散の期待値が導出できる
- ⑤分散分析ができる
- ⑥主効果・交互作用の区間推定が導出できる
- ⑦期待値、分散分析や区間推定の演習問題
記事の信頼性
記事を書いている私は、実験計画法に磨きをかけていますので、わかりやすく解説します。本記事は、どこに書いていない、私が研究して見つけた本記事限定の内容です。
実験計画法の肝なので、必読です!
●You tubeでも解説しています。ご覧ください。
➀多水準法とは何かがわかる
教科書の定義
m=2なら2水準系の実験で因子Aだけが4水準に割り付け、
m=3なら3水準系の実験で因子Aだけが9水準に割り付ける方法です。
データの構造式から多水準法を理解する
- 完全配置実験のデータの構造式を作る
- 一部の項を変形すれば多水準法になる
QCプラネッツでは、完全配置実験のデータの構造式からスタートして、変形すればどんな手法のデータの構造式が得られる点を重視します。
②分割法のデータの構造式が書ける
データの構造式
4因子の完全配置実験のデータの構造式からスタートします。
四元配置実験のデータの構造式
xijkl=μ+αi+βj+γk+δl
+(αβ)ij+(αγ)ik+(αδ)il
+(βγ)jk+(βδ)jl+(γδ)kl
+(αβγ)ijk+ (αβδ)ijl+(αγδ)ikl+(βγδ)jkl
+ eijkl
(i=j=k=l=m)
次に、因子Aの水準をm2とします。A,BをAに合併させます。
完全配置 | → | 多水準 | |
1 | α | → | α |
2 | β | → | α |
3 | γ | → | γ |
4 | δ | → | δ |
5 | αβ | → | α |
6 | αγ | → | αγ |
7 | αδ | → | αδ |
8 | βγ | → | αγ |
9 | βδ | → | αδ |
10 | γδ | → | γδ |
11 | αβγ | → | αγ |
12 | αβδ | → | αδ |
13 | αγδ | → | αγδ |
14 | βγδ | → | αγδ |
15 | αβγδ | → | αγδ |
データの構造式を多水準法に変形します。
xikl=μ+αi+γk+δl
+(αγ)ik+(αδ)il+(γδ)kl
+eikl
(i=m2,k=l=m)
四元配置実験が三元配置実験に代わり、添字iの水準数がmからm2に増加しました。
因子BをAに合成しましたので、
αβij→αi
βγjk→αγik
αβδijl→αδil
に変化します。機械的に変更するだけで簡単ですね。
各平均値をデータの構造式で作る
母数因子と変量因子の違い
関連記事【簡単】母数因子と変量因子の違いがすぐわかるにて、母数因子と変量因子を解説しました。
母数因子と変量因子
母数因数:α、γ、δ、αγ、αδ、γδ
変量因子:e
平均値
母数因数の平均は0。
変量因子の平均は0ではない。
平均値を式にする場合、添字のない文字項はすべて0にしますが、変量因子の場合は平均値をいれます。分割法や乱塊法では変量因子が増えるので要注意ですが、多水準法ではあまり変量因子は使いません。
平均値の式の代表例
データの構造式
xikl=μ+αi+γk+δl
+(αγ)ik+(αδ)il+(γδ)kl
+eikl
(i=m2,k=l=m)
\(\bar{x_{i・・}}\)=μ+\(α_i\)+\(\bar{e_{i・・}}\)
\(\bar{x_{・k・}}\)=μ+\(γ_k\)+\(\bar{e_{・k・}}\)
\(\bar{x_{・・l}}\)=μ+\(δ_l\)+\(\bar{e_{・・l}}\)
\(\bar{x_{ik・}}\)=μ+\(α_i\)+\(γ_k\)+\((αγ)_{ik}\)+\(\bar{e_{ik・}}\)
\(\bar{x_{i・l}}\)=μ+\(α_i\)+\(δ_l\)+\((αδ)_{il}\)+\(\bar{e_{i・l}}\)
\(\bar{x_{・jl}}\)=μ+\(γ_k\)+\(δ_l\)+\((γδ)_{kl}\)+\(\bar{e_{・kl}}\)
\(\bar{\bar{x}}\)=μ+\(\bar{\bar{e}}\)
③多水準法の平方和の分解の式が書ける
データの構造式を変形
式を書くと見づらいので、表にまとめます。分散分析はデータの構造式が複雑になると表で整理するのがオススメです。
SA | SC | SD | SA×C | SA×D | SC×D | SA×C×D | |
\(x_{ikl}\) | 1 | ||||||
\(\bar{x_{i・・}}\) | 1 | -1 | -1 | 1 | |||
\(\bar{x_{・k・}}\) | 1 | -1 | -1 | 1 | |||
\(\bar{x_{・・l}}\) | 1 | -1 | -1 | 1 | |||
\(\bar{x_{ik・}}\) | 1 | -1 | |||||
\(\bar{x_{i・l}}\) | 1 | -1 | |||||
\(\bar{x_{・jl}}\) | 1 | -1 | |||||
\(\bar{\bar{x}}\) | -1 | -1 | -1 | 1 | 1 | 1 | -1 |
表から各平方和の導出式が簡単にでますね。SD、SA×D、Seを例に挙げます。
\(S_D\)=\(\sum_{i=1}^{a}\sum_{k=1}^{c}\sum_{l=1}^{d}\)\((\bar{x_{‥l}}-\bar{\bar{x}})^2\)
\(S_{A×D}\)=\(\sum_{i=1}^{a}\sum_{k=1}^{c}\sum_{l=1}^{d}\)
\((\bar{x_{i・l}}-\bar{x_{i‥}}-\bar{x_{・・l}}+\bar{\bar{x}})^2\)
\( S_e\)= \(\sum_{i=1}^{a}\sum_{k=1}^{c}\sum_{l=1}^{d}\)
\((x_{ikl}-\bar{x_{ik・}}-\bar{x_{i・l}}-\bar{x_{・kl}}\)
\(+\bar{x_{i・・}}+\bar{x_{・k・}}+\bar{x_{‥l}}-\bar{\bar{x}})^2\)
と書けますね。他の平方和も同様にΣΣΣ( )^2で計算できます。
④多水準法の主効果・交互作用・誤差の期待値が導出できる
期待値については、関連記事確率変数の期待値と分散が計算できる【初心者向け】をご覧下さい。
主効果の分散の期待値の導出
E[\(S_D\)]=E[\(\sum_{i=1}^{a}\sum_{k=1}^{c}\sum_{l=1}^{d}\)\((\bar{x_{‥l}}-\bar{\bar{x}})^2\)]
=E[\(\sum_{i=1}^{a}\sum_{k=1}^{c}\sum_{l=1}^{d}\)\((δ_l+\bar{e_{・・l}}-\bar{\bar{e}})^2\)]
=E[\(\sum_{i=1}^{a}\sum_{k=1}^{c}\sum_{l=1}^{d}\)\((δ_l )^2\)]
+E[\(\sum_{i=1}^{a}\sum_{k=1}^{c}\sum_{l=1}^{d}\)\((\bar{e_{‥l}}-\bar{\bar{e}})^2\)]
=\(ac(d-1)σ_D^2\) +\((d-1)σ_e^2\)
主効果Dの自由度は(d-1)より、分散の期待値E[VD]が求まります。
E[\(V_D\)]=\(acσ_D^2\) +\(σ_e^2\)
なお、分散の期待値を以下とします。
\( σ_D^2\)=E[\(\frac{\sum_{l=1}^{d}δ_l^2}{d-1}\)]
\(σ_e^2\)については解説集にあります。
交互作用の分散の期待値の導出
E[\(S_{A×D}\)]=E[\(\sum_{i=1}^{a}\sum_{k=1}^{c}\sum_{l=1}^{d}\)
\((\bar{x_{i・l}}-\bar{x_{i‥}}-\bar{x_{・・l}}+\bar{\bar{x}})^2\)]
= E[\(\sum_{i=1}^{a}\sum_{k=1}^{c}\sum_{l=1}^{d}\)
\(((αδ)_{il}+(\bar{e_{i・l}}-\bar{e_{i‥}}-\bar{e_{‥l}}+\bar{\bar{e}}))^2\)]
= E[\(\sum_{i=1}^{a}\sum_{k=1}^{c}\sum_{l=1}^{d}\)
\(((αδ)_{il}^2)\)
+ E[\(\sum_{i=1}^{a}\sum_{k=1}^{c}\sum_{l=1}^{d}\)
\((\bar{e_{i・l}}-\bar{e_{i‥}}-\bar{e_{‥l}}+\bar{\bar{e}}))^2\)]
第1項:
cE[\(\sum_{i=1}^{a}\sum_{k=1}^{d}\)
\(((αδ)_{il})^2]\)
=\(c(a-1)(d-1)σ_{A×D}^2\)
第2項:
=\((a-1)(d-1)σ_e^2\)
E[\(S_{A×D}\)]
=\(c(a-1)(d-1)σ_{A×D}^2\)+\((a-1)(d-1)σ_e^2\)
交互作用A×Dの自由度は(a-1)(d-1)より、分散の期待値E[VA×D]が求まります。
E[\(V_{A×D}\)]=\(cσ_{A×D}^2\)+\(σ_e^2\)
なお、分散の期待値を以下とします。
\( σ_{A×D}^2\)=E[\(\frac{\sum_{i=1}^{a}\sum_{l=1}^{d}(αδ)_{il}^2}{(a-1)(d-1)}\)]
\(σ_e^2\)については解説集にあります。
残差の分散の期待値の導出
\( S_e\)=E[\(\sum_{i=1}^{a}\sum_{k=1}^{c}\sum_{l=1}^{d}\)
\((x_{ikl}-\bar{x_{ik・}}-\bar{x_{i・l}}-\bar{x_{・kl}}\)
\(+\bar{x_{i‥}}+\bar{x_{・k・}}+\bar{x_{‥l}}-\bar{\bar{x}})^2\)]
= E[\(\sum_{i=1}^{a}\sum_{k=1}^{c}\sum_{l=1}^{d}\)
\((e_{ikl}-\bar{e_{ik・}}-\bar{e_{i・l}}-\bar{e_{・kl}}\)
\(+\bar{e_{i‥}}+\bar{e_{・k・}}+\bar{e_{‥l}}-\bar{\bar{e}})^2\)]
E[\(S_e\)]=\((a-1)(c-1)(d-1)σ_e^2\)
(全計算過程は解説集にあります)
残差eの自由度は(a-1)(c-1)(d-1)より、分散の期待値E[V e]が求まります。自由度の計算結果は次の節で紹介します。
E[\(V_e\)]=\(σ_e^2\)
⑤分割法の分散分析ができる
自由度の計算
各主効果・交互作用の自由度の計算は簡単です。関連記事【簡単】データの構造式で実験計画法がわかる(必読)に解説しています。まとめると次の3つです。
- データの構造式を書く
- 主効果・交互作用の構造式にある添字から自由度を算出
- 自由度は表を活用すると簡単に求まる
自由度をまとめます。
A | C | D | A×C | A×D | C×D | A×C×D | |
a | 1 | -1 | -1 | 1 | |||
c | 1 | -1 | -1 | 1 | |||
d | 1 | -1 | -1 | 1 | |||
ac | 1 | -1 | |||||
ad | 1 | -1 | |||||
cd | 1 | -1 | |||||
acd | 1 | ||||||
1 | -1 | -1 | -1 | 1 | 1 | 1 | -1 |
分散分析の結果
分散分析表を作ります。
φ | E[V] | |
A | a-1 | \(σ_e^2+cdσ_A^2\) |
C | c-1 | \(σ_e^2+adσ_C^2\) |
D | d-1 | \(σ_e^2+acσ_D^2\) |
A×C | (a-1)(c-1) | \(σ_e^2+dσ_{A×C}^2\) |
A×D | (a-1)(d-1) | \(σ_e^2+cσ_{A×D}^2\) |
C×D | (c-1)(d-1) | \(σ_e^2+aσ_{A×D}^2\) |
e | (a-1)(c-1)(d-1) | \(σ_e^2\) |
T | acd-1 | – |
文字だけ見ると、三元配置実験と全く同じ分散分析の結果になります。
しかし、a≡a×bです。
a=4,c=2,d=2と、値が異なる点に注意しましょう。
⑥多水準法の主効果・交互作用の区間推定が導出できる
母平均の点推定の導出方法
有効繰返し数と区間推定の導出方法
区間推定は、下の式で算出します。
$$ \bar{μ}±t(φ_e,α)\sqrt{\frac{V_e}{n_e}}$$
区間推定のポイント
- ルートの中は、誤差eの分散から個数を割ったものが入る
- 誤差eの自由度φeである。
- Veが複数項である場合、サタースウェイトの式から自由度を導出
サタースウェイトの式については、ここを見てください。
主効果の点推定と区間推定の導出
分散の期待値から分散の推定値を導出
分散分析から、eの分散の推定値E[Ve]を導出します。
E[Ve]=\(σ_e^2\)
主効果の点推定と区間推定
点推定: \(\widehat{μ}(D_l)=\bar{x_{‥l}}\)=\(\widehat{μ+δ_l}\)
=\(μ+δ_l +\bar{e_{‥l}}\)
分散:\(\widehat{Var}(\widehat{μ}(D_l))\)
=V[μ+\(δ_l +\bar{e_{‥l}}\)]
=V[\(\bar{e_{‥l}}\)]
=\(\frac{\widehat{σ_e^2}}{d}\)
Veが求まったので、自由度φと、点推定μを代入すれば推定区間が求まります。
交互作用の区間推定
点推定: \(\widehat{μ}(A_i D_l )\)=\(\bar{x_{i・l}}\)
=\(μ+α_i+δ_l+(αδ)_{il}\)+\(\bar{e_{i・l}}\)
分散:\(\widehat{Var}(\widehat{μ}( A_i D_l))\)
=V[μ+\(α_i+δ_l+(αδ)_{il}\)+\(\bar{e_{i・l}}\)]
=V[\(\bar{e_{i・l}}\)]
=\(\frac{\widehat{σ_e^2}}{ad}\)
Veが求まったので、自由度φと、点推定μを代入すれば推定区間が求まります。
一連の導出過程を解説しました。
⑦多水準法の分散分析を導出できる演習問題
本記事で扱ったデータの構造式において、以下の演習問題を解いてみましょう。詳細は解説集にあります。
xikl=μ+αi+γk+δl
+(αγ)ik+(αδ)il+(γδ)kl
+eikl
(i=m2,k=l=m)
(1)主効果A,C,D、交互作用A×C,A×D,C×D,残差eの自由度と分散の期待値を導出せよ。
(2)主効果A,C,D、交互作用A×C,A×D,C×Dの点推定と区間推定を計算せよ。
(詳細は解説集にあります。)
まとめ
多水準法の分散分析の導出過程を詳細に解説しました。
- ➀多水準法とは何かがわかる
- ②多水準法のデータの構造式が書ける
- ③平方和の分解の式が書ける
- ④多水準法の主効果・交互作用・誤差の分散の期待値が導出できる
- ⑤分散分析ができる
- ⑥主効果・交互作用の区間推定が導出できる
- ⑦期待値、分散分析や区間推定の演習問題
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119