繰返しのある単回帰分析の分散分析がよくわかる
「繰返しのある単回帰分析の分散分析がよくわからない」と困っていませんか?
こういう疑問に答えます。
本記事のテーマ
おさえておきたいポイント
- ①単回帰分析による分散分析
- ➁一元配置実験による分散分析
- ➂分散分析の比較(回帰分析vs実験計画法)
- ➃(必読!)データの構造式と平方和の分解
回帰分析と実験計画法では
何が違うのか?何をそれぞれ見ているのか?
が気になりますね。
(気になってほしいです!)
なので、解説します!
(ii)データの構造式から「平方和の分解」を確認して
(iii)分散分析して
(iv)分散分析の結果を比較します!
繰返しの無い場合についても関連記事で解説しています。比較しながら本記事とセットで習得しましょう!
回帰分析と実験計画法の違いがよくわかる(繰返しデータ無しの場合) 同じ分散分析でも回帰分析と実験計画法では結果がどう違うか説明できますか?本記事では単回帰分析(繰返しデータが無い場合)について解説します。QC検定®2級、1級に出題されてもいい事例なので読んでください。 |
①単回帰分析による分散分析
データの用意
例えば、下表のようなデータを用意します。
i | j | xi | yij |
1 | 1 | 0 | 3.3 |
1 | 2 | 0 | 2.8 |
1 | 3 | 0 | 3.7 |
1 | 4 | 0 | 4 |
2 | 1 | 1 | 4.5 |
2 | 2 | 1 | 3.9 |
2 | 3 | 1 | 3.2 |
2 | 4 | 1 | 3.5 |
2 | 1 | 2 | 4.8 |
3 | 2 | 2 | 4.2 |
3 | 3 | 2 | 5.5 |
3 | 4 | 2 | 4.9 |
3 | 1 | 3 | 4.9 |
4 | 2 | 3 | 5.7 |
4 | 3 | 3 | 5 |
4 | 4 | 3 | 4.3 |
– | 合計 | 24 | 68.2 |
– | 平均 | 1.5 | 4.2625 |
グラフを描くとこんな感じです。
確かに、繰返しがあるデータですね。
なお、各値は次の通りです(計算してみてください)。
●平方和\(S_{xx}\)=20
●平方和\(S_{yy}\)=10.60
●平方和\(S_{xy}\)=11.3
より、
●寄与率R=\(\frac{S_{xy}^2}{S_{xx} S_{yy}}\)=0.776
●回帰平方和\(S_R\)=\(\frac{S_{xy}^2}{S_{xx}}\)=6.38
●残差平方和\(S_{er}\)=\(S_T\)-\(S_R\)=4.21
●総平方和\(S_T\)=\(S_{yy}\)=10.60
単回帰分析による分散分析
各平方和が計算出来たので、分散分析は下表のとおりになります。
– | S | Φ |
R | 6.38 | 1 |
er | 4.22 | 14 |
T | 10.60 | 15 |
次に、同じデータを実験計画法の分散分析をやってみましょう。
➁一元配置実験による分散分析
よくみると一元配置実験である
繰返しのある単回帰分析のデータは、一元配置実験と同じなんです。
実験計画法っぽく表を作り変えます。
A | データ | |||
A0 | 3.3 | 2.8 | 3.7 | 4 |
A1 | 4.5 | 3.9 | 3.2 | 3.5 |
A2 | 4.8 | 4.2 | 5.5 | 4.9 |
A3 | 4.9 | 5.7 | 5 | 4.3 |
こう書くと、単純な一元配置実験ですよね。
●一元配置実験はQC検定®2級レベル
●繰返しのある単回帰分析はQC検定®1級レベル
別々とせず、両者の違いを理解しながら、まとめて勉強しましょう!その方が速い!
①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。
●リンクページ
データの構造式
データ構造式はQCプラネッツでいっぱい書いていますので関連記事で復習しましょう。
【まとめ2】データの構造式さえあれば実験計画法がマスターできる 実験計画法の肝である、データの構造式について詳細に解説しました。データの構造式さえおさえれば実験計画法はマスターできます。教科書には書いていない実験計画法のマスター方法を解説します。 |
一元配置実験のデータ構造式は、下のとおりです。
\((y_{ij}-\bar{\bar{y}})\)=\((\bar{y_{i・}}-\bar{\bar{y}})\)(主効果)+\(( y_{ij}-\bar{y_{i・}})\)(残差)
ですね。
一元配置実験による分散分析
実験計画法による分散分析すると次の結果になります。
– | S | Φ |
A | 7.00 | 3 |
e | 3.60 | 12 |
T | 10.60 | 15 |
となります。
➂分散分析の比較(回帰分析vs実験計画法)
元データは同じですが、
●繰返しのある単回帰分析による分散分析
●一元配置実験による分散分析
の2つができました。
比較してみましょう。
単回帰分析 | S | Φ | 実験計画法 | S | Φ |
R | 6.38 | 1 | A | 7.00 | 3 |
er | 4.22 | 14 | e | 3.60 | 12 |
T | 10.60 | 15 | T | 10.60 | 15 |
となり、合計の平方和と自由度は同じですが、
回帰R,主効果A,残差eとerでそれぞれ値が違いますね。
単回帰分析では、両者の違いを埋めるために
当てはまりの悪さ lof を使って、
平方和\(S_{lof}\)と自由度\(Φ_{lof}\)を定義します。
\(S_T\)=\(S_R\)+\(S_{er}\)=\(S_A\)+\(S_e\)より、
平方和\(S_{lof}\)は
\(S_{lof}\)=\(S_A\)-\(S_R\)=\(S_{er}\)-\(S_e\)から求めます。
自由度も同様に、
\(Φ_T\)=\(Φ_R\)+\(Φ_{er}\)=\(Φ_A\)+\(Φ_e\)より、
平方和\(Φ_{lof}\)は
\(Φ_{lof}\)=\(Φ_A\)-\(Φ_R\)=\(Φ_{er}\)-\(Φ_e\)から求めます。
再度、分散分析表で両手法を比較しましょう。
単回帰分析 | S | Φ | 実験計画法 | S | Φ | |
R | 6.38 | 1 | A | 7.00 | 3 | |
er | lof | 0.62 | 2 | |||
er | e | 3.60 | 12 | e | 3.60 | 12 |
T | 10.60 | 15 | T | 10.60 | 15 |
分散分析表と当てはまりの悪さを早くマスターしたいなら、
一元配置実験を持ってくると良いです!
繰返しありの単回帰分析で難しい分散分析が簡単に理解できましたね!
➃(必読!)データの構造式と平方和の分解
単回帰分析と実験計画法から分散分析しました。
その元になる理論も解説します。平方和の分解をひたすら計算します。
データの構造式
単回帰分析のデータの構造式を書いてみましょう。
データの構造式は、
\((y_{ij} – \bar{\bar{y}})\)=\((\hat{y_i} – \bar{\bar{y}})\)(回帰R)+\((y_{ij} -\hat{y_i}\))(残差er)
となりますね。
次に実験計画法・一元配置実験のデータの構造式を書いてみましょう。
データの構造式は、
\((y_{ij} – \bar{\bar{y}})\)=\((\bar{y_{i・}} – \bar{\bar{y}})\)(主効果A)+\((y_{ij} -\bar{y_{i・}}\))(残差e)
となりますね。
で、回帰直線に乗る\(\hat{y_i}\)と、主効果の平均\(\bar{y_{i・}}\)の2つがあるので、図で関係性を確認します。
平方和の分解
上の図から、単回帰分析と実験計画法の両者のデータの構造式をまとめると次の式ができます。
\((y_{ij} – \bar{\bar{y}})\)=\((\hat{y_i} – \bar{\bar{y}})\)(回帰R)+\((\bar{y_{i・}} -\hat{y_i}\))(lof)+\((y_{ij} -\bar{y_{i・}}\))(残差e)
ここからそれぞれの平方和を分解することができます。
平方和を求める式を作ると
\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\(( y_{ij} – \bar{\bar{y}})^2\)
=\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\(((\hat{y_i} – \bar{\bar{y}})\)+\((\bar{y_{i・}} -\hat{y_i}\))+\((y_{ij} -\bar{y_{i・}}))^2\)
この(右辺)を計算すると、不思議な事に、
\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\(((\hat{y_i} – \bar{\bar{y}})\)+\((\bar{y_{i・}} -\hat{y_i}\))+\((y_{ij} -\bar{y_{i・}}))^2\)
=\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\((\hat{y_i} – \bar{\bar{y}})^2\)(\(S_R\))+
\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\((\bar{y_{i・}} -\hat{y_i})^2\)(\(S_{lof}\))+
\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\((y_{ij} -\bar{y_{i・}})^2\)(\(S_{e}\))
となり、
\(S_T\)=\(S_R\)+\(S_{lof}\)+\(S_{e}\)
となりますよね。
ここでよく見ると
\((x+y+z)^2\)=\(x^2+y^2+z^2+2xy+2xz+2yz\)
ですが、
中間積和である
●\(xy\)=0
●\(xz\)=0
●\(yz\)=0
なんですよね。
つまり、
●\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\((\hat{y_i} – \bar{\bar{y}})\)\((\bar{y_{i・}} -\hat{y_i}\))=0
●\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\((\hat{y_i} – \bar{\bar{y}})\)\((y_{ij} -\bar{y_{i・}}\))=0
●\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\((\bar{y_{i・}} -\hat{y_i}\))\((y_{ij} -\bar{y_{i・}}\))=0
が成り立ちます。
証明はここにあります。
ここまで、読んでいただくと、回帰分析と実験計画法の両方の分散分析が自由自在に使いこなせるはずです。
まとめ
「繰返しのある単回帰分析の分散分析がよくわかる」を解説しました。
- ①単回帰分析による分散分析
- ➁一元配置実験による分散分析
- ➂分散分析の比較(回帰分析vs実験計画法)
- ➃(必読!)データの構造式と平方和の分解
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119