繰返し数が異なる一元配置実験の分散の期待値が計算できる
「繰返し数が異なる一元配置実験の分散分析の分散の期待値の導出方法がわからない」、「繰返し数が同じ場合とどこが違うのかがわからない」など、繰返し数が異なる場合の分散の期待値が計算できずに困っていませんか?
こういう疑問に答えます。
本記事のテーマ
繰返し数が異なる一元配置実験の分散の期待値の導出
- ①【導入】一元配置実験(繰返し数が同じ)場合
- ②一元配置実験(繰返し数が異なる)場合
- ③擬水準法への適用(紹介で次の記事へ)
記事の信頼性
記事を書いている私は、実験計画法に磨きをかけていますので、わかりやすく解説します。分散分析から分散の期待値の導出は実験計画法の肝なので、必読です!
●You tube動画もご覧ください。
①【導入】一元配置実験(繰返し数が同じ)場合
本記事の理解を深めるために、一元配置実験(繰返し数が同じ)の分散の期待値を導出します。
関連記事確率変数の期待値と分散が計算できる【初心者向け】をご覧ください。
一元配置実験のデータの構造式
\(x_{ij}\)=μ+\(α_i\)+\(ε_{ij}\)
\(\bar{x_{i・}}\)=μ+\(α_i\)+\(\bar{ε_{i・}}\)
\(\bar{\bar{x}}\)=μ+\(\bar{\bar{ε}}\)
すらすら書けるようになりましょう。QCプラネッツではたくさんのデータの構造式について解説しています。
分散分析から分散の期待値を導出
主効果Aの分散の期待値
SA
=E[\(\sum_{i=1}^{a}\sum_{i=1}^{b}(\bar{x_{i・}}-\bar{\bar{x}})^2\)]
=E[\(\sum_{i=1}^{a}\sum_{i=1}^{b}(α_i+(\bar{ε_{i・}}-\bar{\bar{ε}}))^2\)]
=E[\(\sum_{i=1}^{a}\sum_{i=1}^{b}α_i^2\)]+ E[\(\sum_{i=1}^{a}\sum_{i=1}^{b}(\bar{ε_{i・}}-\bar{\bar{ε}})^2\)]
=b(a-1)\(σ_A^2\)+(a-1)\(σ_e^2\)
ここで、
\(σ_A^2\)=\(\frac{1}{a-1}\) E[\(\sum_{i=1}^{a}α_i^2\)]
\(σ_e^2\)=\(\frac{1}{a-1}\) E[\(\sum_{i=1}^{a}\sum_{i=1}^{b} (\bar{ε_{i・}}-\bar{\bar{ε}})^2\)]
とします。何度も見て慣れましょう。
残差eの分散の期待値
Se
=E[\(\sum_{i=1}^{a}\sum_{i=1}^{b}(x_{ij}-\bar{x_{i・}})^2\)]
=E[\(\sum_{i=1}^{a}\sum_{i=1}^{b}(ε_{ij}-\bar{ε_{i・}})^2\)]
=a(b-1) \(σ_e^2\)
ここで、
\(σ_e^2\)=\(\frac{1}{a(b-1)}\) E[\(\sum_{i=1}^{a}\sum_{i=1}^{b} (ε_{ij}-\bar{ε_{i・}})^2\)]
とします。何度も見て慣れましょう。
②一元配置実験(繰返し数が異なる)場合
繰返し数が同じと異なる場合の違い
繰返し数が異なる場合は、同じ場合と比べて、どこが変化するかを見ながら解説します。
主効果Aの分散の期待値
まず、繰返し数が同じの場合は、どのi(1~a)に対してもデータ数はn=bで同じです。
i/j | 1 | 2 | … | b | データ数 |
1 | x11 | x12 | … | x1b | n=b |
2 | x21 | x22 | … | x2b | n=b |
… | … | … | … | … | … |
a | xa1 | xa2 | … | xab | n=b |
なので、\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)とa,bそれぞれのΣをつけて平方和と分散の期待値をします。
一方、繰返し数が異なる場合は、それぞれのi(1~a)に対して、データ数は変わってきます。
すべてデータがある場合(n=b)、そうでない場合(n
その場合、データ数はniとして定義します。繰返し数が同じ場合と異なるポイントです。
i/j | 1 | 2 | … | b | データ数 |
1 | x11 | x12 | … | x1b | n=n1=b |
2 | x21 | x22 | … | データ無し | n=n2<b |
… | … | … | … | … | … |
a | xa1 | xa2 | … | データ無し | n=na<b |
なので、\(\sum_{i=1}^{a}\sum_{j=1}^{b}\)→\(\sum_{i=1}^{a}n_i\)に変わります。
繰返し数が異なる:\(n_i\)
繰返し数が異なる場合の分散の期待値への導出
主効果Aの分散の期待値
SA
=E[\(\sum_{i=1}^{a}\sum_{i=1}^{b}(\bar{x_{i・}}-\bar{\bar{x}})^2\)]
ではなく、
=E[\(\sum_{i=1}^{a} n_i (\bar{x_{i・}}-\bar{\bar{x}})^2\)]
にします。
=E[\(\sum_{i=1}^{a}n_i(α_i+(\bar{ε_{i・}}-\bar{\bar{ε}}))^2\)]
=E[\(\sum_{i=1}^{a} n_i α_i^2\)] (第1項)
+E[\(\sum_{i=1}^{a} n_i α_i(\bar{ε_{i・}}-\bar{\bar{ε}})\)](第2項)
+ E[\(\sum_{i=1}^{a} n_i (\bar{ε_{i・}}-\bar{\bar{ε}})^2\)](第3項)
(第1項)から\(σ_A^2\)としたいのですが、
\(σ_A^2\)=E[\(\frac{1}{a-1}\sum_{i=1}^{a}α_i^2\)]とE[\(\sum_{i=1}^{a} n_i α_i^2\)]
を区別することが多く、
E[\(\sum_{i=1}^{a} n_i α_i^2\)]のままにします。
(第2項)
= E[\(\sum_{i=1}^{a} n_i α_i(\bar{ε_{i・}}-\bar{\bar{ε}})\)]
合計\( n_i\bar{ε_{i・}}\)は合計\( n_i\bar{\bar{ε}}\)と等しいため、
差は0になり、第2項は0になります。
(第3項)
=E[\(\sum_{i=1}^{a} n_i (\bar{ε_{i・}}-\bar{\bar{ε}})^2\)]
は誤差扱いとして、
\(σ_e^2\)= E[\(\frac{1}{a-1}\sum_{i=1}^{a} n_i (\bar{ε_{i・}}-\bar{\bar{ε}})^2\)]
して扱います。
まとめると
SA= E[\(\sum_{i=1}^{a} n_i α_i^2\)]+(a-1) \(σ_e^2\)
VA= E[\(\frac{1}{a-1}\sum_{i=1}^{a} n_i α_i^2\)]+ \(σ_e^2\)
教科書では、導出過程を省かれていることが多いので、丁寧に解説しました。
残差eの分散の期待値
Se
=E[\(\sum_{i=1}^{a}\sum_{i=1}^{b}(x_{ij}-\bar{x_{i・}})^2\)]
ではなく、
=E[\(\sum_{i=1}^{a} n_i (x_{i(ni)}-\bar{x_{i・}})^2\)]
とします。
=E[\(\sum_{i=1}^{a} n_i (ε_{i(ni)}-\bar{ε_{i・}})^2\)]
ここで、
\(σ_e^2\)= E[\(\frac{1}{a(b-1)-m}\sum_{i=1}^{a} n_i (ε_{i(ni)}-\bar{ε_{i・}})^2\)]
とおきます。mは欠測値の数です。
自由度を見ておくと、下表になります。
繰返し数 | ||
同じ | 異なる | |
A | a-1 | a-1 |
e | a(b-1) | a(b-1)-m |
T | ab-1 | ab-1-m |
よって、まとめると、
Se=(a(b-1)-m)\(σ_e^2\)
Ve=\(σ_e^2\)
教科書では、導出過程を省かれていることが多いので、丁寧に解説しました。
③擬水準法への適用
詳細は、関連記事で解説しますが、エッセンスは繰返し数が異なる一元配置実験と同じなので、紹介します。
繰返し数が異なる:\(n_i\)
・2水準系直交表で3水準を割当てる場合
・3水準系直交表で2水準を割当てる場合
の分散の期待値を導出する際に、Σではなくniを使って計算します。
直交表の応用レベルの擬水準法ですが、繰返し数が異なる一元配置実験の分散の期待値の導出と同じ方法を使います。是非関連記事をご覧下さい。
まとめ
繰返し数が異なる一元配置実験の分散分析の分散の期待値の導出方法
を詳細に解説しました。
- ①【導入】一元配置実験(繰返し数が同じ)場合
- ②一元配置実験(繰返し数が異なる)場合
- ③擬水準法への適用
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119