【簡単】データの構造式で実験計画法がわかる(必読)
「多元配置実験、乱塊法、分割法といっぱい手法があってわからない」、「解き方を1つ1つ覚えていくのが大変」、ど、実験計画法を習得するのにいろいろ困っていませんか?
こういう疑問に答えます。
本記事のテーマ
データの構造式からわかる実験計画法
- ➀データの構造式は誤差項を機械的に書き出す
- ②乱塊法、分割法等はデータの構造式の誤差項を書き換えただけ
- ③データの構造式の項から自由度がわかる
さっそく見ていきましょう。
➀データの構造式は誤差項を機械的に書き出す
実験計画法のポイント2つだけ
(B)誤差を要因ごとに分解し、誤差の大きさを比較する。
に書いたとおり、(A)(B)の2つだけでOKです。
ここで、最も重要になるのが、データの構造式です。どの教科書にも書いていますが、分散分析や平方和に目が行くので、データの構造式は脇役になりがちです。
しかし、データの構造式がわかれば、多元配置実験、乱塊法、分割法、枝分れ実験、直交表をそれぞれ理解する必要もありませんし、自由度もデータの構造式からすべてわかります。
例えば、3つの因子を使ったデータの構造式を書きましょう。
\(x_{ijk} =μ+α_i+β_j+γ_k\)+\((αβ)_{ij}+(αγ)_{ik}+(βγ)_{jk}\)+\(e_{ijk}\)
と書けます。平均と、3因子の総組み合わせ6通りと誤差1つの計8項から構成されますね。
なお、3因子交互作用\((αβγ)_{ijk}\)と誤差\(e_{ijk}\)は交絡しますが、これは交絡のところで話をします。
データの構造式は機械的にすべての項を一旦書く事が重要です。
プーリングや調べない主効果・交互作用があれば誤差に含めればよいのです。
\(x_{ijk} =μ+α_i+β_j+γ_k\)+\((αβ)_{ij}+(αγ)_{ik}+(βγ)_{jk}\)+\(e_{ijk}\)
例えば、\((αγ)_{ik}\)は誤差に含め、\((βγ)_{jk}\)は確認対象外とすると、
\(x_{ijk} =μ+α_i+β_j+γ_k\)+\((αβ)_{ij}\)+\(e_{ijk}\)
\(e_{ijk}\)は\(e_{ijk}+(αγ)_{ik}+(βγ)_{jk}\)になります。
機械的に書き出すだけなので、簡単ですね。
②乱塊法、分割法はデータの構造式の誤差項を書き換えただけ
3つの因子を使ったデータの構造式
\(x_{ijk} =μ+α_i+β_j+γ_k\)+\((αβ)_{ij}+(αγ)_{ik}+(βγ)_{jk}\)+e_{ijk}\)
は三元配置実験のデータの構造式ですね。
これを乱塊法、乱塊法+分割法の式に変えましょう。下図になります。
乱塊法のデータの構造式は三元配置実験から\(γ_k\)を反復因子に変えて、
γを含む項をすべて誤差\(e_{ijk}\)に移せば完成です。
分割法はよく乱塊法と組み合わせて出てきます。これが初めて習う時に、
「分割法だけでもしんどいのに、何でさらにわからない乱塊法がくっついてくるの?」
とため息が出ますよね。この理由も、ここで話しますが、
分割法+乱塊法の方が、データの構造式が書きやすく、平方和が計算しやすいからです。
分割法+乱塊法のデータの構造式は三元配置実験から\(γ_k\)を反復因子に変えて、
\((αγ)_{ik}\)を\(e_{(1)ik}\)に変えて、\((βγ)_{jk}\)を誤差\(e_{ijk}\)に移せば完成です。
γが反復因子と特別な因子に設定したので、γを含む交互作用に意味がなくなるため、誤差に入れました。
ただし、γを含む交互作用をそのまま項にして平方和を計算することはできます。
多くの参考書は、乱塊法、分割法をそれぞれの章で取り上げるため、個別に解き方を暗記しようとします。
しかし、多元配置実験のシンプルなデータの構造式を書き換えているだけにすぎません。
なぜなら、多元配置実験のデータの構造式はすべての場合を書き出しているため、乱塊法、分割法などの応用手法はその構造式の項の組み合わせを変えているだけだからです。
データの構造式がベースとなる多元配置実験を組み合わせて応用したものが、乱塊法・分割法などの応用手法だとわかれば、難しいと思わなくなるはずです。
③データの構造式の項から自由度がわかる
データの構造式の項から自由度がわかる最重要ポイント
データの構造式の項まとめ
\(x_{ijk} =μ+α_i+β_j+γ_k\)+\((αβ)_{ij}+(αγ)_{ik}+(βγ)_{jk}\)+\(e_{ijk}\)
の各項を別表現します。自由度の算出や分散分析の期待値導出に必須です。
・μ=\(\bar{\bar{x}}\)
・\(α_i\)=\( \bar{x_{i‥}}-\bar{\bar{x}}\)
・\(β_j\)=\( \bar{x_{・j・}}-\bar{\bar{x}}\)
・\(γ_k\)=\( \bar{x_{・・k}}-\bar{\bar{x}}\)
・\((αβ)_{ij}\)=\(\bar{x_{ij・}}-\bar{x_{i‥}}-\bar{x_{・j・}}+\bar{\bar{x}}\)
・\((βγ)_{jk}\)=\(\bar{x_{・jk}}-\bar{x_{・j・}}-\bar{x_{・・k}}+\bar{\bar{x}}\)
・\((αγ)_{ik}\)=\(\bar{x_{i・k}}-\bar{x_{i‥}}-\bar{x_{・・k}}+\bar{\bar{x}}\)
・\(e_{ijk}\)=?? (書けますか?)
と2因子の交互作用までなら暗記してもよいですが、3因子の交互作用以上になると式を求めるのが大変です。
ここで、自由度の表を提案します!
自由度の表を提案します!
(B)主効果、2因子交互作用を構成する項の係数を入れる
(C)合計Tの係数に合うように、誤差eを構成する項の係数を求める。
自由度の表を作ると多因子のどんな場合でも簡単に自由度や係数を求めることができます。とても便利なので活用ください。
i・・ | ・j・ | ・・k | ij・ | ・jk | i・k | ijk | μ | |
A | 1 | -1 | ||||||
B | 1 | -1 | ||||||
C | 1 | -1 | ||||||
A×B | -1 | -1 | 1 | 1 | ||||
A×C | -1 | -1 | 1 | 1 | ||||
B×C | -1 | -1 | 1 | 1 | ||||
e(A×B×C) | 1 | 1 | 1 | -1 | -1 | -1 | 1 | -1 |
T | 0 | 0 | 0 | 0 | 0 | 0 | 1 | -1 |
表を見ながら、誤差eを構成する式が書けますね。結構長い式ですが。
・\(e_{ijk}\)=\(x_{ijk}+(\bar{x_{i‥}}+\bar{x_{・j・}}+\bar{x_{・・k}})\)-\((\bar{x_{ij・}}+\bar{x_{・jk}}+\bar{x_{i・k}})\)-\(\bar{\bar{x}}\)
まとめると、
・μ=\(\bar{\bar{x}}\)
・\(α_i\)=\( \bar{x_{i‥}}-\bar{\bar{x}}\)
・\(β_j\)=\( \bar{x_{・j・}}-\bar{\bar{x}}\)
・\(γ_k\)=\( \bar{x_{・・k}}-\bar{\bar{x}}\)
・\(αβ_{ij}\)=\(\bar{x_{ij・}}-\bar{x_{i‥}}-\bar{x_{・j・}}+\bar{\bar{x}}\)
・\(βγ_{jk}\)=\(\bar{x_{・jk}}-\bar{x_{・j・}}-\bar{x_{・・k}}+\bar{\bar{x}}\)
・\(αγ_{ik}\)=\(\bar{x_{i・k}}-\bar{x_{i‥}}-\bar{x_{・・k}}+\bar{\bar{x}}\)
・\(e_{ijk}\)=\(x_{ijk}+(\bar{x_{i‥}}+\bar{x_{・j・}}+\bar{x_{・・k}})\)-\((\bar{x_{ij・}}+\bar{x_{・jk}}+\bar{x_{i・k}})\)-\(\bar{\bar{x}}\)
データの構造式から自由度がわかる
因子3個の交互作用なら(a-1)(b-1)(c-1)と暗記していませんか?なぜ自由度がそうなるのか、説明できますか?
自由度はデータの構造式からすべてわかりますし、自由度から各主効果、交互作用の構造式の形が書けます。
平均μの自由度は1
・μ=\(\bar{\bar{x}}\)
ですが、平均は1つに決まるので、自由度は1です。
主効果の自由度はn-1
・\(α_i\)=\( \bar{x_{i‥}}-\bar{\bar{x}}\)
\( \bar{x_{i‥}}\)において、主効果Aの水準はaとすると、自由度はaです。
\(\bar{\bar{x}}\)は、自由度1の平均です。
引くので、自由度はa-1となります。
2因子交互作用の自由度は(n-1)(m-1)
・\((αβ)_{ij}\)=\(\bar{x_{ij・}}-\bar{x_{i‥}}-\bar{x_{・j・}}+\bar{\bar{x}}\)
因子Aはa水準、因子Bはb水準としましょう。
\(\bar{x_{ij・}}\):自由度ab
\(\bar{x_{i‥}}\): 自由度a
\(\bar{x_{・j・}}\): 自由度b
\(\bar{\bar{x}}\): 自由度1
まとめると、自由度はab-a-b+1=(a-1)(b-1)です。
多因子交互作用や、複数の項を加算した誤差の自由度もデータ構造式から求めることができます。
ここまで、読むと次のことも気がつきませんか?
自由度がわかればデータの構造式も書ける
・\(αβ_{ij}\)=\(\bar{x_{ij・}}-\bar{x_{i‥}}-\bar{x_{・j・}}+\bar{\bar{x}}\)
にデータの構造式が書けますよね!
3因子交互作用の自由度は公式暗記から(a-1)(b-1)(c-1)ですから、展開して
(a-1)(b-1)(c-1)=abc-ab-ac-bc+a+b+c-1
\( (αβγ)_{ijk}\)=\( x_{ijk}\)-\(x_{ij・}\)・・・ と書けますよね。
多因子交互作用や、複数の項を加算した誤差の自由度もデータ構造式から求めることができます。
では、次の問いを考えてみましょう。本記事を読めば同様に解けるはずです。なお、解説は解説集にありますので、ご覧下さい。
(1) \(x_{ijk} =μ+γ_k+α_i+β_j\)+\((αβ)_{ij}+e_{ijk}\) :[\(e_{ijk}\)] (乱塊法)
(2) \(x_{ijk} =μ+γ_k+α_i+e_{(1)ik}\)+\(β_j+(αβ)_{ij}\)+\(e_{(2)ijk}\) :[\(e_{(2)ijk}\)] (乱塊法+分割法)
まとめ
教科書ではあまりスポットライトが当たらない、データの構造式ですが、データの構造式だけで実験計画法がほぼわかることを解説しました。
- ➀データの構造式は誤差項を機械的に書き出す
- ②乱塊法、分割法はデータの構造式の誤差項を書き換えただけ
- ③データの構造式の項から自由度がわかる
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119