【重要】直交表を繰返し使う場合の分散分析がわかる
「直交表実験を繰り返して使う場合、分散分析はどうやればいいの?」、「直交表を繰り返して使う場合の注意点は何?」など、疑問に思いませんか?
こういう疑問に答えます。
本記事のテーマ
直交表を繰返し使う場合の分散分析がわかる
- ➀データの構造式から分散分析を理解する
- ②直交表を繰返し使う場合の注意点がわかる
- ③直交表L27の事例
記事の信頼性
記事を書いている私は、実験計画法に磨きをかけていますので、わかりやすく解説します。
➀データの構造式から分散分析を理解する
直交表を繰返し使う場合のデータの構造式
あとで、3因子の直交表L27を使った事例を解説します。3因子のデータの構造式を考えます。直交表を1回だけ使う場合と、繰返し使う場合でデータの構造式が少し変わります。
直交表を1回だけ使う場合
xijk=μ+αi+ βj+ γk
+(αβ)ij+ (αγ)ik+ (βγ)jk+ εijk
機械的に書き出せますね。
直交表を繰返し使う場合
xijkl=μ+αi+ βj+ γk
+(αβ)ij+ (αγ)ik+ (βγ)jk+ ε(1)ijk
+ ε(2)ijkl
と繰返しの分の残差ε(2)ijklが追加され、添字がijkからijklに増えます。
残差の分散の期待値を計算
各平均の式をまとめます。残差が2種類あるので分割法に似た式になります。
関連記事分割法(2因子1段分割)の分散分析・区間推定が解ける【必見】に書いていますので、参考ください。
\(\bar{x_{i・‥}}=μ+α_i+\bar{ε_{(1)i・・}}+\bar{ε_{(2)i・・・}}\)
\(\bar{x_{・j・・}}=μ+β_j+\bar{ε_{(1)・j・}}+\bar{ε_{(2)・j・・ }}\)
\(\bar{x_{‥k・}}=μ+γ_k+\bar{ε_{(1)・・k}}+\bar{ε_{(2)・・k・}}\)
\(\bar{x_{ij・・}}\)=μ+\(α_i\)+\(β_j\)+\((αβ)_{ij}\)+\bar{ε_{(1)ij・}}+\(\bar{ε_{(2)ij・・}}\)
\(\bar{x_{i・k・}}\)=μ+\(α_i\)+\(γ_k\)+\((αγ)_{ik}\)+\bar{ε_{(1)i・k}}+\(\bar{ε_{(2)i・k・}}\)
\(\bar{x_{・jk・}}\)=μ+\(β_j\)+\(γ_k\)+\((βγ)_{jk}\)+\bar{ε_{(1)・jk}}+\(\bar{ε_{(2)・jk・}}\)
\(\bar{x_{ijk・}}\)=μ+\(α_i\)+\(β_j\)+\(γ_k\)
+\((αβ)_{ij}\)+\((βγ)_{jk}\)+\((αγ)_{ik}\)
+\(ε_{(1)ijk}\)+\(\bar{ε_{(2)ijk・}}\)
\(\bar{\bar{x}}\)=μ+\(\bar{ε(1)}\)+\(\bar{\bar{ε(2)}}\)
\(\bar{x_{i・・・}}\) | \(\bar{x_{・j・・}}\) | \(\bar{x_{・・k・}}\) | \(\bar{x_{ij・・}}\) | \(\bar{x_{i・k・}}\) | \(\bar{x_{・jk・}}\) | \(\bar{x_{ijk・}}\) | \(x_{ijkl}\) | \(\bar{\bar{x}}\) | |
SA | 1 | -1 | |||||||
SB | 1 | -1 | |||||||
SC | 1 | -1 | |||||||
SA×B | -1 | -1 | 1 | 1 | |||||
SA×C | -1 | -1 | 1 | 1 | |||||
SB×C | -1 | -1 | 1 | 1 | |||||
Se(1) | 1 | 1 | 1 | -1 | -1 | -1 | 1 | -1 | |
Se(2) | -1 | 1 | |||||||
ST(計) | 1 | -1 |
残差ε(1)、ε(2)の平方和の期待値
残差ε(1)
E[\(S_{ε(1)}\)=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\)
\((\bar{x_{ijk・}}-\bar{x_{ij・・}}-\bar{x_{i・k・}}-\bar{x_{・jk・}}\)
\(\bar{x_{i・・・}}+\bar{x_{・j・・}}+\bar{x_{・・k・}}-\bar{\bar{x}})^2\)]
= E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\)
\(((\bar{ε_{(1)ijk・}}-\bar{ε_{(1)ij・・}}-\bar{ε_{(1)i・k・}}-\bar{ε_{(1)・jk・}}\)
+\(\bar{ε_{(1)i・・・}}+\bar{ε_{(1)・j・・}}+\bar{ε_{(1)・・k・}}-\bar{\bar{ε_{(1)}}})\)
+\((\bar{ε_{(2)ijk・}}-\bar{ε_{(2)ij・・}}-\bar{ε_{(2)i・k・}}-\bar{ε_{(2)・jk・}}\)
+\(\bar{ε_{(2)i・・・}}+\bar{ε_{(2)・j・・}}+\bar{ε_{(2)・・k・}}-\bar{\bar{ε_{(2)}}}))^2\)]
残差ε(2)
E[\(S_{ε(2)}\)=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\)
\((x_{ijkl}-\bar{x_{ijk・}})^2\)]
=E[\(\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}\)
\((ε_{(2)ijkl}-\bar{ε_{(2)ijk・}})^2\)]
E[\(S_{ε(1)}]\)の導出は、関連記事【本記事限定】残差eの分散の期待値の導出がわかるに書いていますので、参考ください。
結果は、
E[\(S_{ε(1)}\)]=d(a-1)(b-1)(c-1)\(σ_{e(1)}^2\)+(a-1)(b-1)(c-1)\(σ_{e(2)}^2\)
関連記事に無いものは、\(\sum_{l=1}^{d}\)をd倍とした点です。
E[\(S_{ε(2)}\)]の導出は、次のように変形して求めます。
\((ε_{(2)ijkl}-\bar{\bar{ε_{(2)}}})\)=\((ε_{(2)ijkl}-\bar{\bar{ε_{(2) ijk・}}})\)+\((\bar{ε_{(2)ijk・}}-\bar{ε_{(2)}})\)
\(ε_{(2)ijkl}-\bar{\bar{ε_{(2)}}}\)と\(\bar{ε_{(2) ijk・}}-\bar{\bar{ε_{(2)}}}\)は次のように分散を定義します。
\(σ_{e(2)}^2\)=E[\(\frac{\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}\sum_{l=1}^{d}(ε_{(2)ijkl}-\bar{\bar{ε_{(2)}}})^2}{abcd-1}\)]
\(\frac{σ_{e(2)}^2}{d}\)=E[\(\frac{\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{c}(\bar{ε_{(2)ijk・}}-\bar{\bar{ε}})^2}{abc-1}\)]
よって、
E[\(S_{ε(2)}\)]=abc(d-1)\(σ_{e(2)}^2\)
分散分析表をまとめる
データの構造式
xijkl=μ+αi+ βj+ γk
+(αβ)ij+ (αγ)ik+ (βγ)jk+ ε(1)ijk
+ ε(2)ijkl
の分散分析をまとめます。
φ | E[V] | |
A | a-1 | \(σ_{e(2)}\)+d\(σ_{e(1)}\)+bcd\(σ_A\) |
B | b-1 | \(σ_{e(2)}\)+d\(σ_{e(1)}\)+acd\(σ_B\) |
C | c-1 | \(σ_{e(2)}\)+d\(σ_{e(1)}\)+abd\(σ_C\) |
A×B | (a-1)(b-1) | \(σ_{e(2)}\)+d\(σ_{e(1)}\)+cd\(σ_{A×B}\) |
A×C | (a-1)(c-1) | \(σ_{e(2)}\)+d\(σ_{e(1)}\)+bd\(σ_{A×C}\) |
B×C | (b-1)(c-1) | \(σ_{e(2)}\)+d\(σ_{e(1)}\)+ad\(σ_{B×C}\) |
e(1) | (a-1)(b-1)(C-1) | \(σ_{e(2)}\)+d\(σ_{e(1)}\) |
e(2) | abc(d-1) | \(σ_{e(2)}\) |
T | abcd-1 | – |
<
h2>データの構造式から直交表活用の注意点がわかる
直交表全列の平方和の総和≦総平方和
直交表の列をすべてみると、3因子の場合は、A,B,C,A×B,A×C,B×C,e(≡A×B×C)の7種類です。
つまり、e(2)は直交表からはみ出ることになり、直交表全列の平方和の総和は全体の平方和の総和になりません
直交表全列の平方和の総和をST’とします。
ST’= S A + SB + S C + S A×B + S A×C + S B×C + S e(1))
ですが、
ST= ST’+ S e(2))
となります。
つまり、
ST’≦ ST
に注意しましょう。なお、S e(2))=0なら、両者は一致します。
S e(2))=0とは、繰返しによるデータのズレが無いことですから、同じデータを繰り返した場合が考えられます。
下表にまとめます。黄色枠が直交表からはみ出る部分です。
直交表 | φ | |
A | ○ | a-1 |
B | ○ | b-1 |
C | ○ | c-1 |
A×B | ○ | (a-1)(b-1) |
A×C | ○ | (a-1)(c-1) |
B×C | ○ | (b-1)(c-1) |
e(1) | ○ | (a-1)(b-1)(C-1) |
T'(ABC)計 | ○ | abc-1 |
e(2) | × | abc(d-1) |
T(ABCD)計 | × | abcd-1 |
よって、ST’は直交表または直交表以外から導出
STは直交表以外から導出
する必要があります。
ST’の個別の求め方
直交表の全列の平方和を総和すれば導出できますが、直接求めることも可能です。
T’はABCと表記し、TはABCDと表記しました。
つまり、
ST’= SABC (SA×B×Cでは無い)
ST= SABCD (SA×B×C×Dでは無い)
です。
具体的な計算を解説します。
L27の事例
直交表L27にて、3回繰り返した場合の分散分析をしましょう。平方和ST’の導出も解説します。
直交表L27を使って実験
データを用意します。
行/列 | x1 | x2 | x3 | 計 |
1 | 14 | 20 | 22 | 56 |
2 | 24 | 21 | 17 | 62 |
3 | 23 | 22 | 26 | 71 |
4 | 27 | 23 | 19 | 69 |
5 | 25 | 22 | 27 | 74 |
6 | 19 | 14 | 20 | 53 |
7 | 14 | 19 | 10 | 43 |
8 | 16 | 18 | 27 | 61 |
9 | 19 | 24 | 31 | 74 |
10 | 22 | 20 | 26 | 68 |
11 | 27 | 26 | 15 | 68 |
12 | 28 | 22 | 16 | 66 |
13 | 12 | 23 | 29 | 64 |
14 | 24 | 23 | 10 | 57 |
15 | 26 | 14 | 12 | 52 |
16 | 19 | 21 | 27 | 67 |
17 | 24 | 19 | 24 | 67 |
18 | 20 | 24 | 33 | 77 |
19 | 15 | 24 | 33 | 72 |
20 | 10 | 27 | 30 | 67 |
21 | 20 | 15 | 30 | 65 |
22 | 19 | 22 | 29 | 70 |
23 | 19 | 15 | 19 | 53 |
24 | 29 | 25 | 19 | 73 |
25 | 12 | 30 | 28 | 70 |
26 | 27 | 23 | 10 | 60 |
27 | 20 | 27 | 30 | 77 |
計 | 554 | 583 | 619 | 1756 |
直交表に割当てます。
行/列 | 1 | 2 | ・・・ | 13 | データ1 | データ2 | データ3 |
1 | 1 | 1 | ・・・ | 1 | 14 | 20 | 22 |
・・・ | ・・・ | ・・・ | ・・・ | ・・・ | ・・・ | ・・・ | ・・・ |
27 | 3 | 3 | ・・・ | 2 | 20 | 27 | 30 |
成分 | a | ・・・ | a | 計554 | 計583 | 計619 | |
b | ・・・ | 2b | – | – | – | ||
・・・ | 2c | – | – | – |
各列の総和と平方和を算出します。
列 | 成分 | 効果 | 1の総和 | 2の総和 | 3の総和 | 合計 | 平方和S | ||
1 | a | A | 563 | 586 | 607 | 1756 | 35.88 | ||
2 | b | B | 595 | 565 | 596 | 1756 | 22.99 | ||
3 | a | b | A×B | 596 | 605 | 555 | 1756 | 52.62 | |
4 | a | 2b | A×B | 569 | 611 | 576 | 1756 | 37.51 | |
5 | c | C | 579 | 569 | 608 | 1756 | 30.39 | ||
6 | a | c | A×C | 543 | 611 | 602 | 1756 | 101.06 | |
7 | a | 2c | A×C | 575 | 604 | 577 | 1756 | 19.43 | |
8 | b | c | B×C | 562 | 628 | 566 | 1756 | 101.43 | |
9 | a | b | c | B×C | 574 | 580 | 602 | 1756 | 16.09 |
10 | a | 2b | 2c | e(1) | 567 | 600 | 589 | 1756 | 20.91 |
11 | b | 2c | e(1) | 608 | 555 | 593 | 1756 | 55.28 | |
12 | a | 2b | c | e(1) | 611 | 555 | 590 | 1756 | 59.28 |
13 | a | 2b | 2c | e(1) | 586 | 557 | 613 | 1756 | 58.09 |
なお、全列の平方和の総和は
35.88+22.99+…+58.09=610.99
総和Tの平方和と残差e(2)の平方和の導出
総平方和ST,直交表の総平方和ST’と残差e(2)の平方和Se(2)を導出します。
STの導出
平方和の定義どおり、
ST =(各データの2乗の和)-(データの和の2乗)/データ数
で求めます。(右辺)第2項はよく修正項CTとして使われます。
ST=142+202+…+222-CT
CT=17562/81=38068.37
ST=40730-38068.37=2661.65
ST’の導出
本記事で初めての平方和ですが、直交表から
ST’= SABC
とわかります。
ABCについては各回のデータについて、繰返し3回分の合計について、平方和を導出すればよいです。
ST’=\(\frac{\sum_{ijk}^{abc}(x_{ijk1}+…+x_{ijkl})^2}{3(=繰返し回数)}\)-CT
とします。
ST’=\frac{(14+20+22)^2+(24+21+17)^2+…(20+27+30)^2}{3}\)-CT
=38679.33-38068.35=610.99
全列の平方和の総和と一致します。
Se(2)の導出
STとSTの差分となります。
Se(2)= ST– ST
=2661.65-610.99=2050.67
となります。
分散分析の結果
結果をまとめます。直交表L27を活用しながら、STとSe(2)は独自で導出する点に注意が必要です。
自由度φ | 平方和S | 平均平方V | F値 | |||
A | a-1 | 2 | 35.88 | 17.94 | VA/Ve(1) | 0.929 |
B | b-1 | 2 | 22.99 | 11.49 | VB/Ve(1) | 0.596 |
C | c-1 | 2 | 30.39 | 15.19 | VC/Ve(1) | 0.787 |
A×B | (a-1)(b-1) | 4 | 90.12 | 22.53 | VA×B/Ve(1) | 1.167 |
A×C | (a-1)(c-1) | 4 | 120.49 | 30.12 | VA×C/Ve(1) | 1.561 |
B×C | (b-1)(c-1) | 4 | 156.72 | 39.18 | VB×C/Ve(1) | 2.03 |
e(1) | (a-1)(b-1)(c-1) | 8 | 154.39 | 19.29 | Ve(1)/Ve(2) | 0.508 |
T’ | abc-1 | 26 | 610.99 | – | – | – |
e(2) | abc(d-1) | 54 | 2050.67 | 37.98 | – | – |
T’ | abcd-1 | 80 | 2661.65 | – | – | – |
まとめ
直交表を繰り返し使う場合の分散分析について解説しました。
- ➀データの構造式から分散分析を理解する
- ②直交表を繰返し使う場合の注意点がわかる
- ③直交表L27の事例
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119