QCプラネッツ 品質のプロフェッショナルを育成するサイト

ダービンワトソン比がよくわかる

重回帰分析

「ダービンワトソン比がわからない」と困っていませんか?

こういう疑問に答えます。

本記事のテーマ

ダービンワトソン比がよくわかる

おさえておきたいポイント

  • ①ダービンワトソン比とは
  • ➁ダービンワトソン比の範囲を導出
  • ➂ダービンワトソン比の値とデータの特性
ダービンワトソン比が0~4の範囲になる理由と、
ダービンワトソン比の値とグラフの関係を実例をあげて解説するのはQCプラネッツだけ!

①ダービンワトソン比とは

ダービンワトソン比とは

ある回帰直線において、回帰線分と残差成分に分けた時、
\(y_i\)=\(βx_i\)(回帰)+\(e_i\)(残差) (\(i=1,2,…,n\))
残差\(e_i\)について、ダービンワトソン比を定義します。

DW=\(\frac{\sum_{i=2}^{n}(e_i-e_{i-1})^2}{\sum_{i=1}^{n}e_i^2}\)
隣り合った残差の関係を調べることで、データに異常がないかをチェックします。

ダービンワトソン比の式を展開する

DW=\(\frac{\sum_{i=2}^{n}(e_i-e_{i-1})^2}{\sum_{i=1}^{n}e_i^2}\)を展開します。
DW=\(\frac{\sum_{i=2}^{n}(e_i-e_{i-1})^2}{\sum_{i=1}^{n}e_i^2}\)
=\(\frac{\sum_{i=2}^{n} e_i^2-2\sum_{i=2}^{n} e_{i-1} e_i +\sum_{i=2}^{n} e_{i-1}^2}{\sum_{i=1}^{n}e_i^2}\)
=(式1)

ここで、
●\(\sum_{i=1}^{n} e_i^2\)=\(e_1^2 +\sum_{i=2}^{n} e_i^2\)
●\(\sum_{i=1}^{n} e_i^2\)=\(\sum_{i=2}^{n} e_{i-1}^2+e_n^2\)
に注意して、(式1)に代入します。

(式1)
=\(\frac{(\sum_{i=1}^{n} e_i^2-e_1^2)-2\sum_{i=2}^{n} e_{i-1} e_i +(\sum_{i=1}^{n} e_{i}^2-e_n^2)}{\sum_{i=1}^{n}e_i^2}\)
=\(\frac{2\sum_{i=1}^{n} e_i^2-2\sum_{i=2}^{n} e_{i-1} e_i -(e_1^2+e_n^2)}{\sum_{i=1}^{n}e_i^2}\)
=2-2\(\frac{\sum_{i=2}^{n} e_{i-1} e_i}{\sum_{i=1}^{n}e_i^2}\)-\(\frac{ e_1^2+e_n^2}{\sum_{i=1}^{n}e_i^2}\)
=(式3)

(式3)の第3項においては、\(n\)が十分大きいと
\(\frac{ e_1^2+e_n^2}{\sum_{i=1}^{n}e_i^2}\)
=\(\frac{e_1^2+e_n^2}{e_1^2+e_2^2+e_3^2+…+e_n^2}\)
となり、(分子) \(\ll\) (分母)とみなせるので、

\(\frac{ e_1^2+e_n^2}{\sum_{i=1}^{n}e_i^2}\) \(\approx\) 0
とします。

次に第2項の
\(\frac{\sum_{i=2}^{n} e_{i-1} e_i}{\sum_{i=1}^{n}e_i^2}\)
ですが、よく相関係数\(ρ\)と定義して、
\(ρ\)=\(\frac{\sum_{i=2}^{n} e_{i-1} e_i}{\sum_{i=1}^{n}e_i^2}\)
とおくことがあります。

➁ダービンワトソン比の範囲を導出

残差どうしの相関係数の範囲を導出

\(ρ\)=\(\frac{\sum_{i=2}^{n} e_{i-1} e_i}{\sum_{i=1}^{n}e_i^2}\)
の範囲を求めましょう。相関係数というくらいなので、-1 ≤ \(ρ\) ≤ 1となります。

証明してみましょう。

(分子)= \(\sum_{i=2}^{n} e_{i-1} e_i \)をあえて絶対値をつけて
(分子)= |\(\sum_{i=2}^{n} e_{i-1} e_i \)|とします。

(分母)-(分子)
=\(\sum_{i=1}^{n}e_i^2\)-|\(\sum_{i=2}^{n} e_{i-1} e_i \)|
=(\(e_1^2+e_2^2+…+e_n^2\))-(|\(e_1 e_2\)|+|\(e_2 e_3\)|+…+|\(e_{n-1} e_n\)|)
上手く変形すると
=\(\frac{1}{2}(|e_1-e_2|)^2\)+\(\frac{1}{2}(|e_2-e_3|)^2\)+…+\(\frac{1}{2}(|e_{n-1}-e_n|)^2\)+\(\frac{1}{2}e_n^2\)
=\(\frac{1}{2}(e_1-e_2)^2\)+\(\frac{1}{2}(e_2-e_3)^2\)+…+\(\frac{1}{2}(e_{n-1}-e_n)^2\)+\(\frac{1}{2}e_n^2\) ≥ 0

よって、

\(\sum_{i=1}^{n}e_i^2\) ≥ |\(\sum_{i=2}^{n} e_{i-1} e_i \)|
両辺ともに正なので、
\(\frac{|\sum_{i=2}^{n} e_{i-1} e_i |}{\sum_{i=1}^{n}e_i^2}\) ≤ 1
絶対値を外すと
-1 ≤ \(\frac{|\sum_{i=2}^{n} e_{i-1} e_i |}{\sum_{i=1}^{n}e_i^2}\) ≤ 1
-1 ≤ \(ρ\) ≤ 1
となります。

ダービンワトソン比の範囲を導出

もう一度、ダービンワトソン比の式(式3)を再掲します。
DW=2-2\(\frac{\sum_{i=2}^{n} e_{i-1} e_i}{\sum_{i=1}^{n}e_i^2}\)-\(\frac{ e_1^2+e_n^2}{\sum_{i=1}^{n}e_i^2}\)
第3項は0で近似して、第2項は-1~1の範囲ですから、

0 ≤ DW ≤ 4
の範囲で動くことになります。
暗記しなくても自力で導出できますね!

➂ダービンワトソン比の値とデータの特性

ダービンワトソン比の範囲と相関の関係

よく、下の3つに分類されます。

DW 相関性 相関係数\(ρ\)
0~2 正の相関あり \(ρ\) ≥ 0
2 相関なし \(ρ\) = 1
2~4 負の相関あり \(ρ\) ≤ 0

相関係数\(ρ\)=\(\frac{\sum_{i=2}^{n} e_{i-1} e_i}{\sum_{i=1}^{n}e_i^2}\)の正負や値を見ても、どんなグラフやデータなのかがイメージできませんよね!

なので、実例を使ってダービンワトソン比を調べてみましょう。

パターン1 パターン2
No x1 y1 x2 y2
1 10 56 10 40
2 12 62 11 60
3 14 64 12 42
4 13 68 13 62
5 10 72 14 44
6 25 76 15 64
7 22 80 16 46
8 25 82 17 66
9 23 80 18 48
10 16 90 19 68

それぞれのデータをプロットします。

ダービンワトソン比

ダービンワトソン比が0~2の間の場合

パターン1のデータのダービンワトソン比DWを計算します。

No \(x_1\) \(y\) X=
\(x_1-\bar{x_1}\)
Y=
\(y-\bar{y}\)
\(X^2\) \(Y^2\) XY \(\hat{y_i}\) \(e_i\)
1 10 56 -7 -17 49 289 119 65.047 -9.047
2 12 62 -5 -11 25 121 55 67.320 -5.320
3 14 64 -3 -9 9 81 27 69.592 -5.592
4 13 68 -4 -5 16 25 20 68.456 -0.456
5 10 72 -7 -1 49 1 7 65.047 6.953
6 25 76 8 3 64 9 24 82.089 -6.089
7 22 80 5 7 25 49 35 78.680 1.320
8 25 82 8 9 64 81 72 82.089 -0.089
9 23 80 6 7 36 49 42 79.817 0.183
10 16 90 -1 17 1 289 -17 71.864 18.136
sum 170 730 0 657 338 994 384
ave 17 73 \(S_{xx}\) \(S_{yy}\) \(S_{xy}\)

なお、回帰直線と平方和も計算すると、
●y切片=53.687
●傾き=1.136
●回帰平方和\(S_R\)=436.26
●残差平方和\(S_e\)=557.74
●総平方和\(S_T\)=994
となります。一度は計算してみてくださいね。

ダービンワトソン比DWを計算

各\(e_i\)の値が求まったので、ダービンワトソン比を計算しましょう。
DW=\(\frac{\sum_{i=2}^{n}(e_i-e_{i-1})^2}{\sum_{i=1}^{n}e_i^2}\)
=\(\frac{((-5.320)-(-9.047))^2}{(-5.320)^2}\)+\(\frac{((-5.592)-(-5.320))^2}{(-5.320)^2}\)+…+\(\frac{((18.136-0.183)^2}{0.183^2}\)
=1.156

ダービンワトソン比が0~2の間になりました。

ダービンワトソン比DWが0~2の状態とは?

x-yグラフと、残差\(e_i\)の変化をプロットします。

ダービンワトソン比

残差のプロットからは
\(e_i\)が5以下の値で固まっており、2点大きく飛び出ているのが特徴で、相関係数\(ρ\)は正です。

ダービンワトソン比における相関係数が正の場合のデータのイメージです。

では、ダービンワトソン比DWが2~4の状態とは?どんな感じかを調べてみましょう。

ダービンワトソン比が2~4の間の場合

パターン2のデータのダービンワトソン比DWを計算します。

No \(x_1\) \(y\) X=\(x_1-\bar{x_1}\) Y=\(y-\bar{y}\) \(X^2\) \(Y^2\) XY \(\hat{y_i}\) \(e_i\)
1 10 40 -4.5 -14 20.25 196 63 46.909 -6.909
2 11 60 -3.5 6 12.25 36 -21 48.485 11.515
3 12 42 -2.5 -12 6.25 144 30 50.061 -8.061
4 13 62 -1.5 8 2.25 64 -12 51.636 10.364
5 14 44 -0.5 -10 0.25 100 5 53.212 -9.212
6 15 64 0.5 10 0.25 100 5 54.788 9.212
7 16 46 1.5 -8 2.25 64 -12 56.364 -10.364
8 17 66 2.5 12 6.25 144 30 57.939 8.061
9 18 48 3.5 -6 12.25 36 -21 59.515 -11.515
10 19 68 4.5 14 20.25 196 63 61.091 6.909
sum 145 540 0 486 82.5 1080 130
ave 14.5 54 \(S_{xx}\) \(S_{yy}\) \(S_{xy}\)

なお、回帰直線と平方和も計算すると、
●y切片=31.152
●傾き=1.576
●回帰平方和\(S_R\)=204.84
●残差平方和\(S_e\)=875.15
●総平方和\(S_T\)=1080
となります。一度は計算してみてくださいね。

ダービンワトソン比DWを計算

各\(e_i\)の値が求まったので、ダービンワトソン比を計算しましょう。
DW=\(\frac{\sum_{i=2}^{n}(e_i-e_{i-1})^2}{\sum_{i=1}^{n}e_i^2}\)
=\(\frac{(11.515-(-6.909))^2}{(-6.909)^2}\)+\(\frac{((-8.061)-11.515)^2}{11.515^2}\)+…+\(\frac{((6.909-(-11.515))^2}{(-11.515)^2}\)
=3.691

ダービンワトソン比が2~4の間になりました。

ダービンワトソン比DWが2~4の状態とは?

x-yグラフと、残差\(e_i\)の変化をプロットします。

ダービンワトソン比

残差のプロットからは
\(e_i\)が大きな値と小さな値がジグザグに入れ替わっている特徴がありますね。相関係数\(ρ\)は負です。

ダービンワトソン比における相関係数が負の場合のデータのイメージです。

まとめ

「ダービンワトソン比がよくわかる」を解説しました。

  • ①ダービンワトソン比とは
  • ➁ダービンワトソン比の範囲を導出
  • ➂ダービンワトソン比の値とデータの特性


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!