QCプラネッツ 品質のプロフェッショナルを育成するサイト

繰返しのある単回帰分析がわかる

回帰分析

「繰返しのある単回帰分析がわからない」と困っていませんか?

こういう疑問に答えます。

本記事のテーマ

繰返しのある単回帰分析がわかる

おさえておきたいポイント

  • ①繰返しのある単回帰分析とは
  • ➁平方和\(S_{xx}\),\(S_{xx}\),\(S_{xx}\)を計算
  • ➂回帰の分散分析を計算
  • ➃回帰直線を導出
  • ➄実験計画法(一元配置実験)と比較するとよくわかる

おさえておきたい2つのポイント

(i)平方和、回帰の分散分析、回帰直線の求め方は、繰返し有り無し関係なく1つの解法でOK
(ii) 分散分析は実験計画法(一元配置実験)と比較しながら理解を深めよう!

この2点を中心に解説します。

①繰返しのある単回帰分析とは

繰返し有無の違い

繰返しのある単回帰分析とは、
同じ\(x\)で\(y\)の値が同じ複数個データがある特殊な場合です。

グラフで繰返しの有りを理解しましょう。

繰返しのある単回帰分析

繰返しがあると何に注意すべきか?

結論から言うと、

(i)平方和、回帰の分散分析、回帰直線の求め方は、繰返し有り無し関係なく1つの解法でOK
(ii) 分散分析は実験計画法(一元配置実験)と比較しながら理解を深めよう!

でしたね。

これは、データの構造式で説明できます。後で解説します。

本記事で扱うデータを用意

次の16組のデータを用意します。

i j xi yij
1 1 0 3.3
1 2 0 2.8
1 3 0 3.7
1 4 0 4
2 1 1 4.5
2 2 1 3.9
2 3 1 3.2
2 4 1 3.5
2 1 2 4.8
3 2 2 4.2
3 3 2 5.5
3 4 2 4.9
3 1 3 4.9
4 2 3 5.7
4 3 3 5
4 4 3 4.3
合計 24 68.2
平均 1.5 4.2625

グラフを描くとこんな感じです。

繰返しのある単回帰分析

上表で、i(=1,2,3,4)が変数\(x_i\)が変化する値で、
i(=1,2,3,4)が同じ変数\(x_i\)で繰り返す値となり、
4×4=16個のデータとなっています。

➁平方和\(S_{xx}\),\(S_{xx}\),\(S_{xx}\)を計算

注意してほしい点

数式を書くとわかりにくいので、単純に16組全部のデータ組み合わせについて平方和を計算します。繰返し有無関係なく、同じ解き方です。

上表を使って、全組から平方和を計算します。

i j x y A=
\((x-\bar{x})\)
B=
\((y-\bar{y})\)
A2 B2 AB=
\((x-\bar{x})(y-\bar{y})\)
1 1 0 3.3 -1.5 -0.96 2.25 0.93 1.44
1 2 0 2.8 -1.5 -1.46 2.25 2.14 2.19
1 3 0 3.7 -1.5 -0.56 2.25 0.32 0.84
1 4 0 4 -1.5 -0.26 2.25 0.07 0.39
2 1 1 4.5 -0.5 0.24 0.25 0.06 -0.12
2 2 1 3.9 -0.5 -0.36 0.25 0.13 0.18
2 3 1 3.2 -0.5 -1.06 0.25 1.13 0.53
2 4 1 3.5 -0.5 -0.76 0.25 0.58 0.38
3 1 2 4.8 0.5 0.54 0.25 0.29 0.27
3 2 2 4.2 0.5 -0.06 0.25 0 -0.03
3 3 2 5.5 0.5 1.24 0.25 1.53 0.62
3 4 2 4.9 0.5 0.64 0.25 0.41 0.32
4 1 3 4.9 1.5 0.64 2.25 0.41 0.96
4 2 3 5.7 1.5 1.44 2.25 2.07 2.16
4 3 3 5 1.5 0.74 2.25 0.54 1.11
4 4 3 4.3 1.5 0.04 2.25 0 0.06
合計 24 68.2 0 0 20 10.6 11.3
平均 1.5 4.2625 ↑\(S_{xx}\) ↑\(S_{yy}\) ↑\(S_{xy}\)

確かに、16組から平方和が計算できて、繰返し有無は気にしなくてもOKですね。

平方和\(S_{xx}\),\(S_{xx}\),\(S_{xx}\)を式で書く

式で書くと
●\(S_{xx}\)=\(\sum_{i=1}^{a}\)\(\sum_{j=1}^{b}\)\((x_{i}-\bar{x})^2\)
●\(S_{yy}\)=\(\sum_{i=1}^{a}\)\(\sum_{j=1}^{b}\)\((y_{ij}-\bar{y})^2\)
●\(S_{xy}\)=\(\sum_{i=1}^{a}\)\(\sum_{j=1}^{b}\)\((x_{i}-\bar{x})(y_{ij}-\bar{y})\)
と機械的に書けます。

変数\(x\)は\(i\)についての変数なので\((x_{i}\)であり、\(j\)には関係ありません。
一方、変数\(y\)は\(i,j\)両方についての変数なので\((y_{ij}\)です。

よって、式を変形すると、ややこしいですけど、
●\(S_{xx}\)=\(\sum_{i=1}^{a}\)\(\sum_{j=1}^{b}\)\((x_{i}-\bar{x})^2\)
=\(b\)\(\sum_{i=1}^{a}\)\((x_{i}-\bar{x})^2\)
と変形できます。残り2つはそのままです。
●\(S_{yy}\)=\(\sum_{i=1}^{a}\)\(\sum_{j=1}^{b}\)\((y_{ij}-\bar{y})^2\)
●\(S_{xy}\)=\(\sum_{i=1}^{a}\)\(\sum_{j=1}^{b}\)\((x_{i}-\bar{x})(y_{ij}-\bar{y})\)

➂回帰の分散分析を計算

基本は、繰返し有無に意識しなくていい

平方和\(S_{xx}\),\(S_{xx}\),\(S_{xx}\)から回帰分析の分散分析と、回帰直線に必要な傾きとy切片が計算できます。これも、繰返し有無関係なく1つの解法でできます。

平方和\(S_T\),\(S_R\),\(S_{er}\)を計算

単回帰分析では、
●総平方和:\(S_T\)=\(S_{yy}\)
●回帰平方和:\(S_R\)=\(\frac{S_{xy}^2}{S_{xx}}\)
●回帰残差平方和:\(S_{er}\)=\(S_T\)-\(S_R\)
から計算できて、これは繰返し有無関係なく同じ解法ですね。

実際に計算すると
●\(S_T\)=10.60
●\(S_R\)=6.38
●\(S_{er}\)=4.22
ですね。

分散分析表を作ると

S Φ
R 6.38 1
er 4.22 14
T 10.60 15

ですね。

繰返し有無関係なく、回帰の分散分析はできますね。

➃回帰直線を導出

これも同様に、繰返し有無関係なく1つの解法でできますね。

回帰直線の傾きとy切片は、
●傾き:\(β_1\)=\(\frac{S_{xy}}{S_{xx}}\)
●y切片:\(β_0\)=\(\bar{y}\)-\(β_1 \bar{x}\)
から求めます。確かに繰返し有無関係ないですね。

計算すると、
●傾き:\(β_1\)=0.565
●y切片:\(β_0\)=3.415
より、回帰直線は
y=0.565x+3.415
になります。

➄実験計画法(一元配置実験)と比較するとよくわかる

ここからが、繰返し有りの場合で意識しておくべき内容です。

両者の分散分析については関連記事で詳細に解説しています。是非読んでください。

実験計画法(一元配置実験)と比較しながら、まとめて理解した方が分かりやすい!

データを比較

下図を見ると、同じデータでも、
繰返し有りの回帰分析でも、
実験計画法(一元配置実験)にもなっていますね。

繰返しのある単回帰分析

データの構造式の違い

下図を見るとよくわかります。

繰返しのある単回帰分析

この関係が平方和につながり、分散分析が比較できます。

分散分析の比較

以下、関連記事に書いていますので読んでください。

(i)平方和、回帰の分散分析、回帰直線の求め方は、繰返し有り無し関係なく1つの解法でOK
(ii) 分散分析は実験計画法(一元配置実験)と比較しながら理解を深めよう!

まとめ

「繰返しのある単回帰分析がわかる」を解説しました。

  • ①繰返しのある単回帰分析とは
  • ➁平方和\(S_{xx}\),\(S_{xx}\),\(S_{xx}\)を計算
  • ➂回帰の分散分析を計算
  • ➃回帰直線を導出
  • ➄実験計画法(一元配置実験)と比較するとよくわかる

error: Content is protected !!