回帰分析と実験計画法の違いがよくわかる（繰返しデータ有りの場合）

「繰返しのある単回帰分析の分散分析がよくわからない」と困っていませんか？

こういう疑問に答えます。

本記事のテーマ

繰返しのある単回帰分析の分散分析がよくわかる

おさえておきたいポイント

①単回帰分析による分散分析
➁一元配置実験による分散分析
➂分散分析の比較(回帰分析vs実験計画法)
➃(必読！)データの構造式と平方和の分解

[themoneytizer id=”105233-2″]

【QC検定®１級合格】回帰分析問題集を販売します！

QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。

【QC検定®合格】「回帰分析(単回帰分析・重回帰分析)」問題集を販売します！内容は、①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用、の５章全４１題を演習できる問題集です。

確かに、同じ分散分析しますが、
回帰分析と実験計画法では
何が違うのか？何をそれぞれ見ているのか？
が気になりますね。
(気になってほしいです！)

なので、解説します！

(i)モデル式である「データの構造式」を立てて
(ii)データの構造式から「平方和の分解」を確認して
(iii)分散分析して
(iv)分散分析の結果を比較します！

繰返しの無い場合についても関連記事で解説しています。比較しながら本記事とセットで習得しましょう！

回帰分析と実験計画法の違いがよくわかる（繰返しデータ無しの場合）
同じ分散分析でも回帰分析と実験計画法では結果がどう違うか説明できますか？本記事では単回帰分析（繰返しデータが無い場合）について解説します。QC検定®２級、１級に出題されてもいい事例なので読んでください。

①単回帰分析による分散分析

データの用意

例えば、下表のようなデータを用意します。

i	j	xi	yij
1	1	0	3.3
1	2	0	2.8
1	3	0	3.7
1	4	0	4
2	1	1	4.5
2	2	1	3.9
2	3	1	3.2
2	4	1	3.5
2	1	2	4.8
3	2	2	4.2
3	3	2	5.5
3	4	2	4.9
3	1	3	4.9
4	2	3	5.7
4	3	3	5
4	4	3	4.3
–	合計	24	68.2
–	平均	1.5	4.2625

グラフを描くとこんな感じです。

繰返しのある単回帰分析

確かに、繰返しがあるデータですね。

i,jで区分していますが、気にせず全16個のデータについて寄与率、相関係数を計算します！

なお、各値は次の通りです（計算してみてください）。
●平方和\(S_{xx}\)=20
●平方和\(S_{yy}\)=10.60
●平方和\(S_{xy}\)=11.3
より、
●寄与率R=\(\frac{S_{xy}^2}{S_{xx} S_{yy}}\)=0.776
●回帰平方和\(S_R\)=\(\frac{S_{xy}^2}{S_{xx}}\)=6.38
●残差平方和\(S_{er}\)=\(S_T\)-\(S_R\)=4.21
●総平方和\(S_T\)=\(S_{yy}\)=10.60

単回帰分析による分散分析

各平方和が計算出来たので、分散分析は下表のとおりになります。

–	S	Φ
R	6.38	1
er	4.22	14
T	10.60	15

次に、同じデータを実験計画法の分散分析をやってみましょう。

➁一元配置実験による分散分析

よくみると一元配置実験である

繰返しのある単回帰分析のデータは、一元配置実験と同じなんです。

実験計画法っぽく表を作り変えます。

A	データ
A0	3.3	2.8	3.7	4
A1	4.5	3.9	3.2	3.5
A2	4.8	4.2	5.5	4.9
A3	4.9	5.7	5	4.3

こう書くと、単純な一元配置実験ですよね。

同じデータでも
●一元配置実験はＱＣ検定®2級レベル
●繰返しのある単回帰分析はＱＣ検定®１級レベル
別々とせず、両者の違いを理解しながら、まとめて勉強しましょう！その方が速い！

●商標使用について、
①ＱＣ検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
➂ＱＣプラネッツは、ＱＣ検定®と品質管理検定®の商標使用許可を受けています。
●リンクページ

データの構造式

データ構造式はＱＣプラネッツでいっぱい書いていますので関連記事で復習しましょう。

【まとめ2】データの構造式さえあれば実験計画法がマスターできる
実験計画法の肝である、データの構造式について詳細に解説しました。データの構造式さえおさえれば実験計画法はマスターできます。教科書には書いていない実験計画法のマスター方法を解説します。

一元配置実験のデータ構造式は、下のとおりです。
\((y_{ij}-\bar{\bar{y}})\)=\((\bar{y_{i・}}-\bar{\bar{y}})\)(主効果)+\(( y_{ij}-\bar{y_{i・}})\)(残差)
ですね。

一元配置実験による分散分析

実験計画法による分散分析すると次の結果になります。

–	S	Φ
A	7.00	3
e	3.60	12
T	10.60	15

となります。

➂分散分析の比較(回帰分析vs実験計画法)

元データは同じですが、
●繰返しのある単回帰分析による分散分析
●一元配置実験による分散分析
の２つができました。

比較してみましょう。

単回帰分析	S	Φ	実験計画法	S	Φ
R	6.38	1	A	7.00	3
er	4.22	14	e	3.60	12
T	10.60	15	T	10.60	15

となり、合計の平方和と自由度は同じですが、
回帰Ｒ，主効果Ａ，残差eとerでそれぞれ値が違いますね。

単回帰分析では、両者の違いを埋めるために
当てはまりの悪さ lof を使って、
平方和\(S_{lof}\)と自由度\(Φ_{lof}\)を定義します。

\(S_T\)=\(S_R\)+\(S_{er}\)=\(S_A\)+\(S_e\)より、
平方和\(S_{lof}\)は
\(S_{lof}\)=\(S_A\)-\(S_R\)=\(S_{er}\)-\(S_e\)から求めます。

自由度も同様に、
\(Φ_T\)=\(Φ_R\)+\(Φ_{er}\)=\(Φ_A\)+\(Φ_e\)より、
平方和\(Φ_{lof}\)は
\(Φ_{lof}\)=\(Φ_A\)-\(Φ_R\)=\(Φ_{er}\)-\(Φ_e\)から求めます。

再度、分散分析表で両手法を比較しましょう。

単回帰分析		S	Φ	実験計画法	S	Φ
R		6.38	1	A	7.00	3
er	lof	0.62	2	A	7.00	3
er	e	3.60	12	e	3.60	12
T		10.60	15	T	10.60	15

繰返しありの単回帰分析で
分散分析表と当てはまりの悪さを早くマスターしたいなら、
一元配置実験を持ってくると良いです！

繰返しありの単回帰分析で難しい分散分析が簡単に理解できましたね！

➃(必読！)データの構造式と平方和の分解

単回帰分析と実験計画法から分散分析しました。

その元になる理論も解説します。平方和の分解をひたすら計算します。

本記事で最も重要なので、絶対読んでね！

データの構造式

単回帰分析のデータの構造式を書いてみましょう。
データの構造式は、
\((y_{ij} – \bar{\bar{y}})\)=\((\hat{y_i} – \bar{\bar{y}})\)(回帰R)+\((y_{ij} -\hat{y_i}\))(残差er)
となりますね。

次に実験計画法・一元配置実験のデータの構造式を書いてみましょう。
データの構造式は、
\((y_{ij} – \bar{\bar{y}})\)=\((\bar{y_{i・}} – \bar{\bar{y}})\)(主効果A)+\((y_{ij} -\bar{y_{i・}}\))(残差e)
となりますね。

で、回帰直線に乗る\(\hat{y_i}\)と、主効果の平均\(\bar{y_{i・}}\)の2つがあるので、図で関係性を確認します。

データの構造式

平方和の分解

上の図から、単回帰分析と実験計画法の両者のデータの構造式をまとめると次の式ができます。
\((y_{ij} – \bar{\bar{y}})\)=\((\hat{y_i} – \bar{\bar{y}})\)(回帰R)+\((\bar{y_{i・}} -\hat{y_i}\))(lof)+\((y_{ij} -\bar{y_{i・}}\))(残差e)

ここからそれぞれの平方和を分解することができます。
平方和を求める式を作ると

\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\(( y_{ij} – \bar{\bar{y}})^2\)
=\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\(((\hat{y_i} – \bar{\bar{y}})\)+\((\bar{y_{i・}} -\hat{y_i}\))+\((y_{ij} -\bar{y_{i・}}))^2\)

この(右辺)を計算すると、不思議な事に、
\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\(((\hat{y_i} – \bar{\bar{y}})\)+\((\bar{y_{i・}} -\hat{y_i}\))+\((y_{ij} -\bar{y_{i・}}))^2\)
=\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\((\hat{y_i} – \bar{\bar{y}})^2\)(\(S_R\))+
\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\((\bar{y_{i・}} -\hat{y_i})^2\)(\(S_{lof}\))+
\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\((y_{ij} -\bar{y_{i・}})^2\)(\(S_{e}\))

となり、
\(S_T\)=\(S_R\)+\(S_{lof}\)+\(S_{e}\)
となりますよね。

ここでよく見ると
\((x+y+z)^2\)=\(x^2+y^2+z^2+2xy+2xz+2yz\)
ですが、
中間積和である
●\(xy\)=0
●\(xz\)=0
●\(yz\)=0
なんですよね。

つまり、
●\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\((\hat{y_i} – \bar{\bar{y}})\)\((\bar{y_{i・}} -\hat{y_i}\))=0
●\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\((\hat{y_i} – \bar{\bar{y}})\)\((y_{ij} -\bar{y_{i・}}\))=0
●\(\sum_{i=1}^{a} \sum_{j=1}^{b}\)\((\bar{y_{i・}} -\hat{y_i}\))\((y_{ij} -\bar{y_{i・}}\))=0
が成り立ちます。

しんどいけど、ちゃんと計算して0になることを確かめよう！

証明はここにあります。

平方和の分解(中間積和が0になる理由>

ここまで、読んでいただくと、回帰分析と実験計画法の両方の分散分析が自由自在に使いこなせるはずです。

回帰分析と実験計画法は、分散分析するので、総平方和からどの成分がどれくらい分解されるかを意識して計算しましょう。

まとめ

「繰返しのある単回帰分析の分散分析がよくわかる」を解説しました。

①単回帰分析による分散分析
➁一元配置実験による分散分析
➂分散分析の比較(回帰分析vs実験計画法)
➃(必読！)データの構造式と平方和の分解

回帰分析

繰返しのある単回帰分析の分散分析がよくわかる