QCプラネッツ 品質のプロフェッショナルを育成するサイト

重回帰分析の推定区間の式が導出できる(その2)

重回帰分析

「重回帰分析の推定区間の式の導出がわからない」と困っていませんか?

こういう疑問に答えます。

本記事のテーマ

重回帰分析の推定区間の式が導出できる(その2)

おさえておきたいポイント

  • ①推定区間の式(その1)
  • ➁導出に必要な関係式を導出(その1)
  • ➂傾き\(β_j\)の期待値が導出できる(その1)
  • 傾き\(β_j\)の分散が導出できる(その2)
  • 傾き\(β_j\)の共分散が導出できる(研究中)(その2)
  • 推定区間の式が導出できる(その2)
2回に分けて解説!
「➄傾き\(β_j\)の共分散が導出できる」
は完全に証明できていないので、QCプラネッツの宿題となっています(笑)

①推定区間の式(その1)

➁導出に必要な関係式を導出(その1))

➂傾き\(β_j\)の期待値が導出できる(その1))

期待値の導出までは、関連記事「重回帰分析の推定区間の式が導出できる(その1)」で解説済です。読んでください。本記事は続編を解説します。

重回帰分析の推定区間の式が導出できる(その1)
重回帰分析の推定区間の式は導出できますか?公式代入だけで終わっていませんか? 本記事では2記事にわたり、重回帰分析の推定区間の式が導出をわかりやすく解説します。多変量解析を学ぶ人は必読です。

では、分散の導出に行ってみよう!

➃傾き\(β_j\)の分散が導出できる(その2)

(復習)大事な関係式を再掲

関連記事「重回帰分析の推定区間の式が導出できる(その1)」で解説しましたが、本記事でも扱うので再掲します。

\(β_j\)=\(S^{j1}S_{1y}\)+\(S^{j2}S_{2y}\)+…+\(S^{jk}S_{ky}\)+…+\(S^{jp}S_{py}\)
\(\sum_{k=1}^{p}S_{ik} S^{kj}\)=1 (\(i\)=\(j\))
\(\sum_{k=1}^{p}S_{ik} S^{kj}\)=0 (\(i\)≠\(j\))
となります。この関係式をあとで使います。

分散の式を作る

では行きましょう。傾き\(β_j\)の分散は
V[\(β_j\)]
=V[\(S^{j1}S_{1y}\)+\(S^{j2}S_{2y}\)+…+\(S^{jk}S_{ky}\)+…+\(S^{jp}S_{py}\)]
=(式1)
ですね。では行きますね。

(式1)を展開していきます。
(式1)=
V[\(\sum_{k=1}^{p} S^{jk}\)\(\sum_{i=1}^{n}(x_{ik}-\bar{x_k})(y_i-\bar{y})\)]
=(式2)

(式2)の中の
\(\sum_{i=1}^{n}(x_{ik}-\bar{x_k})\)\((y_i-\bar{y})\)
=\(\sum_{i=1}^{n}(x_{ik}-\bar{x_k})y_i\)-\(\bar{y}\sum_{i=1}^{n}(x_{ik}-\bar{x_k})\)
で第2項の\(\sum_{i=1}^{n}(x_{ik}-\bar{x_k})\)=0なので、
\(\sum_{i=1}^{n}(x_{ik}-\bar{x_k})\)\((y_i-\bar{y})\)=\(\sum_{i=1}^{n}(x_{ik}-\bar{x_k})y_i\)
です。これを(式2)に代入します。

(式2)
= V[\(\sum_{k=1}^{p} S^{jk}\)\(\sum_{i=1}^{n}(x_{ik}-\bar{x_k})y_i\)]
=V[\(\sum_{i=1}^{n}(\sum_{k=1}^{p} S^{jk}(x_{ik}-\bar{x_k}) y_i )\)]
=(式3)
とxについての項だけでまとめます。

(式3)について、xについての項は定数扱いなので、2乗にしてV[ ] の外に出せます。
(式3)= \(\sum_{i=1}^{n}(\sum_{k=1}^{p} S^{jk}(x_{ik}-\bar{x_k}))^2\)V[\(y_i\)]
=\(σ^2\)\(\sum_{i=1}^{n}(\sum_{k=1}^{p} S^{jk}(x_{ik}-\bar{x_k}))^2\)
=(式4)
(V[\(y_i\)]=\(σ^2\)を代入しました。)

(式4)は
(式4)= \(σ^2\)\(\sum_{i=1}^{n} \sum_{k=1}^{p} S^{jk}(x_{ik}-\bar{x_k})\)\(\sum_{l=1}^{p} S^{jl} (x_{il}-\bar{x_l})\)
=\(σ^2\)\(\sum_{k=1}^{p} \sum_{l=1}^{p}\)\( S^{jk} S^{jl}\)\(\sum_{i=1}^{n}(x_{ik}-\bar{x_k})(x_{il}-\bar{x_l})\)
=(式5)

(式5)で、\(\sum_{i=1}^{n}(x_{ik}-\bar{x_k})(x_{il}-\bar{x_l})\)=\(S_{kl}\)なので、代入すると
(式5)
=\(σ^2\)\(\sum_{k=1}^{p} \sum_{l=1}^{p}\)\( S^{jk} S^{jl}\)\(S_{kl}\)
=\(σ^2\)\(\sum_{k=1}^{p} S^{jk} δ_{jk}\)
=\(σ^2\)\(S^{jj}\)

出ました!まとめると、

V[\(β_j\)]=\(σ^2\)\(S^{jj}\)

まとめると、
V[\(β_j\)]=\(σ^2\)\(S^{jj}\)

➄傾き\(β_j\)の共分散が導出できる(研究中)(その2)

実は、これはまだよくわかっていませんが、

V[\(β_j\)]=\(σ^2\)\(S^{jj}\)
V[\(β_j\)]=Cov(\(β_j\),\(β_j\))=\(σ^2\)\(S^{jj}\)
と見立てると
Cov(\(β_i\),\(β_j\))=\(σ^2\)\(S^{ij}\)
とできる!

ちょっと強引だし、「何で?」となるので、わかり次第報告しますが、この式を使わせていただきます。

⑥推定区間の式が導出できる(その2)

だいぶ準備かけましたが、いよいよ推定区間の式を導出しましょう。

推定区間の式

目的変数\(y\)は
\(y\)=\(\bar{y}\)+\(β_1 (x_1-\bar{x_1})\)+\(β_2 (x_2-\bar{x_2})\)+…+\(β_p (x_p-\bar{x_p})\)+\(ε\)
ですね。この値の分散V[\(y\)]を計算しましょう。マハラビノス距離が出て来ます。

分散V[\(y\)]を計算

V[\(y\)]=V[\(\bar{y}\)+\(β_1 (x_1-\bar{x_1})\)+\(β_2 (x_2-\bar{x_2})\)+…+\(β_p (x_p-\bar{x_p})\)+\(ε\)]
=V[\(\bar{y}\)+\(β_1 (x_1-\bar{x_1})\)+\(β_2 (x_2-\bar{x_2})\)+…+\(β_p (x_p-\bar{x_p})\)+\(ε\)]
とマーカで3つに分けます。分散を展開すると
V[\(y\)]=V[\(\bar{y}\))]+V[\(β_1 (x_1-\bar{x_1})\)+\(β_2 (x_2-\bar{x_2})\)+…+\(β_p (x_p-\bar{x_p})\)]+V[\(ε\)]
+2Cov(\(\bar{y}\)),\(β_1 (x_1-\bar{x_1})\)+\(β_2 (x_2-\bar{x_2})\)+…+\(β_p (x_p-\bar{x_p})\))
+2Cov(\(β_1 (x_1-\bar{x_1})\)+\(β_2 (x_2-\bar{x_2})\)+…+\(β_p (x_p-\bar{x_p})\),\(ε\))
+2Cov(\(\bar{y}\),\(ε\))

ここで、\(\bar{y}\),\(β_1 (x_1-\bar{x_1})\)+\(β_2 (x_2-\bar{x_2})\)+…+\(β_p (x_p-\bar{x_p})\),\(ε\)は互いに独立と仮定するので、共分散Covはすべて0になります。

また、
●V[\(\bar{y}\)]=V[\(\frac{y}{n}\)]=\(\frac{1}{n}\)V[\(y\)]=\(\frac{σ^2}{n}\)
●V[\(ε\)]=\(σ^2\)
代入すると

V[\(y\)]
= V[\(\bar{y}\))]+V[\(β_1 (x_1-\bar{x_1})\)+\(β_2 (x_2-\bar{x_2})\)+…+\(β_p (x_p-\bar{x_p})\)]+V[\(ε\)]
=\(\frac{σ^2}{n}\)+ V[\(β_1 (x_1-\bar{x_1})\)+\(β_2 (x_2-\bar{x_2})\)+…+\(β_p (x_p-\bar{x_p})\)]+\(σ^2\)
=(式6)となります。

あとは、
V[\(β_1 (x_1-\bar{x_1})\)+\(β_2 (x_2-\bar{x_2})\)+…+\(β_p (x_p-\bar{x_p})\)]
=(式7)
を計算すればよいことになります。やってみましょう。

(式7)を計算して、V[\(y\)] =(式6)をまとめましょう。

(続)分散V[\(y\)]を計算

(式7)において、まず\((x_i-\bar{x_i})\)は定数扱いなので、分散V、共分散Covの外側に出せます。分散の加法性を使って、めっちゃ展開します。

(式7)= V[\(β_1 (x_1-\bar{x_1})\)+\(β_2 (x_2-\bar{x_2})\)+…+\(β_p (x_p-\bar{x_p})\)]
=\(\sum_{i=1}^{p}\)\((x_i -\bar{x_i})^2 \)V[\(β_i\)]
+\(\sum_{i=1}^{p-1}\)\(\sum_{j=1}^{p}\)\((x_i -\bar{x_i})(x_j -\bar{x_j})\)Cov(\(β_i,β_j\))
=(式8)
第1項目は同じ添え字を掛け算するp個について、第2項目は違う添え字同士で共分散を求めるp(p-1)個についてまとめました。ちょっと難しいけど、時間かけて確認ください。いい勉強になります!

(式8)にV[\(β_i\)]=\(σ^2 S^{ii}\), Cov(\(β_i,β_j)\)=\(σ^2 S^{ij}\)を代入すると、
(式8)= \(\sum_{i=1}^{p}\)\((x_i -\bar{x_i})^2 \)\(σ^2 S^{ii}\)
+\(\sum_{i=1}^{p-1}\)\(\sum_{j=1}^{p}\)\((x_i -\bar{x_i})(x_j -\bar{x_j})\)\(σ^2 S^{ij}\)
=(式9)

一旦、(式9)の\(σ^2\)は外した残りを計算しましょう。(式9’)とします。

(式9’)は行列表記できます。
\((x_i -\bar{x_i})^2 S^{ii}\)=\((x_i -\bar{x_i}) S^{ii} (x_i -\bar{x_i})\)
\((x_i -\bar{x_i})(x_j -\bar{x_j}) S^{ij}\)=\((x_i -\bar{x_j}) S^{ij} (x_i -\bar{x_j})\)
という形を意識すると、

(式9’)=
\(\begin{pmatrix}
x_1-\bar{x_1} & x_2-\bar{x_2} & \ldots & x_p-\bar{x_p}
\end{pmatrix}\)\(\left(
\begin{array}{cccc}
S^{11} & S^{12} & \ldots & S^{1p} \\
S^{21} & S^{22} & \ldots & S^{2p} \\
\vdots & \vdots & \ddots & \vdots \\
S^{p1} & S^{p2} & \ldots & S^{pp}
\end{array}
\right)\)\(\left(
\begin{array}{c}
x_1-\bar{x_1} \\
x_2-\bar{x_2} \\
\vdots \\
x_p-\bar{x_p}
\end{array}
\right)\)

とまとめることができ、この式こそ、マハラビノス距離\(D^2\)と表記できます。
(式9)=(式9’)×\(σ^2\)より
(式9)=\(σ^2\)\(D^2\)
となります。

よって
(式7)= V[\(β_1 (x_1-\bar{x_1})\)+\(β_2 (x_2-\bar{x_2})\)+…+\(β_p (x_p-\bar{x_p})\)]
=\(\sum_{i=1}^{p}\)(\(x_i -\bar{x_i})^2 \)V[\(β_i\)]
=(式8,9)と計算して
=\(σ^2\)\(D^2\) (マハラビノス距離)
となります。

V[\(y\)]をまとめると

V[\(y\)] =(式6)
=\(\frac{σ^2}{n}\)+ V[\(β_1 (x_1-\bar{x_1})\)+\(β_2 (x_2-\bar{x_2})\)+…+\(β_p (x_p-\bar{x_p})\)]+\(σ^2\)
=\(\frac{σ^2}{n}\)+ \(σ^2\)\(D^2\) +\(σ^2\)
=\(σ^2\)(\(1+\frac{1}{n}+D^2\))
とまとめることができます。

V[\(y\)]=\(σ^2\)(\(1+\frac{1}{n}+D^2\))

できましたね!

公式と比べるとちょっと違う?

結果を比較すると、
●V[\(y\)]=\(σ^2\)(\(1+\frac{1}{n}+D^2\)) (式11)
ですが、元々
●\(\sqrt{(1+\frac{1}{n}+\frac{D^2}{n-1})V_e}\) (式12)
でしたよね。

よく見ると、(式12)を2乗して、\(σ^2\)=\(V_e\)として比較すると、
●V[\(y\)]=(\(1+\frac{1}{n}+D^2\)\(V_e\)) (式11A)
ですが、元々
●V[\(y\)]=(\(1+\frac{1}{n}+\frac{D^2}{n-1})V_e\) (式12A)
とちかづきますが、

上の式は\(D^2\)なのに、下の式は\(\frac{D^2}{n-1}\)
と違う?何で? となりますね。

実は、

下の式のDは上の式のDの値に\(n-1)\)をかけたものとして定義しています。
なので、一緒です。おそらく、推定区間の式は\(Ve/ne\)とnで割ったように見せたいからと思われます。ちゃんと導出すると、別に要らないとわかりました。

QCプラネッツは別に、
V[\(y\)]=(\(1+\frac{1}{n}+D^2)\)\(V_e\))
としてもOKです。

と、細かくみてきましたが、ちゃんと、

\(\sqrt{(1+\frac{1}{n}+\frac{D^2}{n-1})V_e}\)
が導出できました。

目的変数\(y\)が
\(y\)=\(β_0\)+\(β_1 x_1\)+\(β_2 x_2\)+…+\(β_p x_p\)+\(ε\)
の信頼度(100-α)%の推定区間は、

\(β_0\)+\(β_1 x_1\)+\(β_2 x_2\)+…+\(β_p x_p\) ±t(\(n-p-1,α)\)\(\sqrt{(1+\frac{1}{n}+\frac{D^2}{n-1})V_e}\)
で与えられる。
(ただし、\(D\)はマハラビノス距離)

の導出がちゃんとできました! めでたしめでたし!

導出が難しい式だからといって、暗記に走らず、ちゃんと導出しましょう。

まとめ

「重回帰分析の推定区間の式が導出できる(その2)」を解説しました。

  • ①推定区間の式(その1)
  • ➁導出に必要な関係式を導出(その1)
  • ➂傾き\(β_j\)の期待値が導出できる(その1)
  • 傾き\(β_j\)の分散が導出できる(その2)
  • 傾き\(β_j\)の共分散が導出できる(研究中)(その2)
  • 推定区間の式が導出できる(その2)


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!