実験計画法の水準は等間隔が良い理由がわかる
「水準の間隔は等間隔が望ましいのはなぜ?」、「水準の間隔が等間隔でないと何が問題?」など、実験計画法の水準の決め方について疑問に思いませんか?
こういう疑問に答えます。
本記事のテーマ
実験計画法の水準は等間隔が良い理由がわかる
- ➀局所管理の原理に反しているから
- ②水準が等間隔でない場合の分散分析を調べるとよくわかる
記事の信頼性
記事を書いている私は、実験計画法に磨きをかけていますので、わかりやすく解説します。実験計画法を学ぶ中で、気になるし、試して確認したいけど、解けないもやもやを解説していきます。
本記事ではわかりやすくするために、二元配置実験(繰り返し有り)を使って説明します。
➀局所管理の原理に反しているから
本記事の結論は、局所管理に反しているからの一言で終わりますが、ちゃんと理解した上で結論に結び付けます。
局所管理とは?
関連記事【簡単】実験計画法のフィッシャー3原則がすぐわかる方法を確認ください。
フィッシャーの3原則を簡単にまとめると、下の3点です。
- 反復:効果と残差を分離させるため
- 無作為化:ありのままの残差平方和Seにするため
- 局所管理:ありのままの効果の平方和(SAなど)にするため
本記事は、局所管理です。
有意性は、効果(例えば因子A)と残差eとの分散比で検定します。ところが、適切な水準にしないと、効果の平方和SA、分散VAの値が高くなり、残差eとの分散比VA/Veが高くなります。分散比が高くなると有意性があると判定しやすくなります。
言葉で書いてもイメージしづらいので、実際に分散分析しながら局所管理の注意点を理解しましょう。
②水準が等間隔でない場合の分散分析を調べるとよくわかる
二元配置実験(繰り返し有り)で調べる
事例として、二元配置実験(繰り返し有り)を持ってきます。
データについて以下の仮定と置きます。
データzはa,bの関数であり、z=f(a,b)とする。
水準が等間隔で実験した場合
実験で入力する変数a,bは次の通りです。
a | b | ||
A1 | 10 | B1 | 5 |
A2 | 20 | B2 | 10 |
A3 | 30 | B3 | 15 |
B4 | 20 |
等間隔もしくは等間隔に近い変数を入力したことがわかります。この二元配置実験(繰り返し有り)のデータは下表のようになりました。
xijk | B1 | B2 | B3 | B4 | 計 |
A1 | 11 | 4 | 19 | 19 | 80 |
5 | 14 | 7 | 1 | ||
A2 | 3 | 21 | 15 | 31 | 136 |
13 | 9 | 23 | 21 | ||
A3 | 24 | 15 | 46 | 54 | 264 |
10 | 33 | 34 | 48 | ||
計 | 66 | 96 | 144 | 174 | 480 |
ABの和も表にします。
xijk | B1 | B2 | B3 | B4 | 計 |
A1 | 16 | 18 | 26 | 20 | 80 |
A2 | 16 | 30 | 38 | 52 | 136 |
A3 | 34 | 48 | 80 | 102 | 264 |
計 | 66 | 96 | 144 | 174 | 480 |
各効果の平方和がさっと計算できますか?
CT=4802/24=9600
ST=(112+…+482)-CT=4868
SA=\(\frac{1}{8}\)(802+…+2642)-CT=2224
SB=\(\frac{1}{6}\)(662+…+1742)-CT=1164
SAB=\(\frac{1}{2}\)(162+…+1022)
SA×B= SAB– SA– SB-CT=856
完全配置実験については、関連記事二元配置実験(繰り返し有り)の分散分析・区間推定が解けるで復習しましょう。
分散分析をまとめます。
効果 | S | Φ | V | F | F0 |
A | 2224 | 2 | 1112 | 15.59 | 3.89 |
B | 1164 | 3 | 388 | 5.44 | 3.49 |
A×B | 624 | 6 | 104 | 1.46 | 3 |
e | 856 | 12 | 71.33 | – | – |
T | 4868 | 23 | – | – | – |
水準が等間隔にしないで実験した場合1
極端に変数を変えた場合の分散分析を見ましょう。A3についてa=30→300に変えた場合、A3のデータ値が10倍に上がったとします。
二元配置実験(繰り返し有り)のデータも変化します。
xijk | B1 | B2 | B3 | B4 | 計 |
A1 | 11 | 4 | 19 | 19 | 80 |
5 | 14 | 7 | 1 | ||
A2 | 3 | 21 | 15 | 31 | 136 |
13 | 9 | 23 | 21 | ||
A3 | 240 | 150 | 460 | 540 | 2640 |
100 | 330 | 340 | 480 | ||
計 | 372 | 528 | 864 | 1092 | 2856 |
分散分析の結果を見ましょう。
効果 | S | Φ | V | F | F0 |
A | 534448 | 2 | 267224 | (15.59→)90.31 | 3.89 |
B | 52824 | 3 | 17608 | (5.49→)5.95 | 3.49 |
A×B | 89544 | 6 | 14924 | (1.46→)5.04 | 3 |
e | 35506 | 12 | 2959 | – | – |
T | 712322 | 23 | – | – | – |
F値を見ると因子AのF値が高くなったことがわかります。F0より高いため、有意性があるとしたいのですが、水準を等間隔にしなかった影響の方が強いため、適切なF検定であるとは言えません。
水準が等間隔にしないで実験した場合2
極端に変数を変えた場合の分散分析を見ましょう。B4についてb=20→200に変えた場合、B4のデータ値が10倍に上がったとします。
二元配置実験(繰り返し有り)のデータも変化します。
xijk | B1 | B2 | B3 | B4 | 計 |
A1 | 11 | 4 | 19 | 190 | 260 |
5 | 14 | 7 | 10 | ||
A2 | 3 | 21 | 15 | 310 | 604 |
13 | 9 | 23 | 210 | ||
A3 | 24 | 15 | 46 | 540 | 1182 |
10 | 33 | 34 | 480 | ||
計 | 66 | 96 | 144 | 1740 | 2046 |
分散分析の結果を見ましょう。
効果 | S | Φ | V | F | F0 |
A | 54271 | 2 | 27135.5 | (15.59→)13.78 | 3.89 |
B | 335896.5 | 3 | 111965.5 | (5.49→)56.87 | 3.49 |
A×B | 117669 | 6 | 19611.5 | (1.46→)9.96 | 3 |
e | 23626 | 12 | 1968.83 | – | – |
T | 531462.5 | 23 | – | – | – |
F値を見ると因子BのF値が高くなったことがわかります。F0より高いため、有意性があるとしたいのですが、水準を等間隔にしなかった影響の方が強いため、適切なF検定であるとは言えません。
水準が等間隔でない場合の弊害について、実例を挙げて解説しました。
まとめ
実験計画法の水準は等間隔が良い理由を解説しました。
- ➀局所管理の原理に反しているから
- ②水準が等間隔でない場合の分散分析を調べるとよくわかる
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119