QCプラネッツ 品質のプロフェッショナルを育成するサイト

回帰直線の区間推定が導出できる(その1)

回帰分析

「回帰直線の区間推定の求め方かがわからない」など、疑問に思いませんか?

こういう疑問に答えます。

2回に分けて解説します!

本記事のテーマ

回帰直線の区間推定が導出できる(その1)

おさえておきたいポイント

  • ①回帰直線の推定区間とは(その1)
  • ➁【重要】回帰直線の区間推定導出のポイント(その1)
  • ➂導出過程に必要な値を事前に計算(その1)
  • ➃回帰直線の傾き\(a\)の期待値と分散を導出(その2)
  • ➄回帰直線の\(y\)切片の\(b\)の期待値と分散を導出(その2)
  • ⑥回帰直線の区間推定領域を図示(その2)

①回帰直線の推定区間とは

回帰直線の求め方は、関連記事に書いています。

回帰分析と相関係数をマスターする
回帰分析と相関係数。学びやすく、試験で点数化したい領域ですが、重要なポイントと回帰分析の導出を解説しました。本記事を一通りマスターしておけば試験では確実に点数とれます。

回帰直線が導出できることを前提として、区間推定を解説します。

回帰直線の区間推定とは

下図のように、回帰直線には、区間推定の領域があります。

回帰直線

回帰直線の係数の推定区間を導出

回帰直線には、区間推定の領域があり理由は簡単で、

実データ\(y_i\)はランダムな誤差とする残差\(ε_i\)が入り、
ばらつきを与えるので、
回帰直線の傾き\(a\)とy切片\(b\)もばらつくため、
区間推定を考える必要があります。

回帰直線の係数の推定区間の式が難しい

要するに

回帰直線の傾き\(a\)とy切片\(b\)
の区間推定の式が出来ればOKですが、
●傾き\(a\)は、平均\(a\),分散が\(\frac{σ^2}{S_{xx}}\)の正規分布に従い、
●y切片\(b\)は、平均\(b\),分散が\(σ^2(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}}))\)の正規分布に従うのですが、
どうやってこの式になるのか?疑問ですよね!
導出できない公式は使うな!
式の導出をちゃんと理解しよう!

ということで、本記事で導出していきます。

平均は理解できるけど、分散の式が意味不明ですよね!

なので、以下の流れで解いていきます。

  1. まず、導出の途中過程で必要な式を事前に計算
  2. 回帰直線の傾き\(a\)の期待値と分散を導出
  3. 回帰直線の\(y\)切片の\(b\)の期待値と分散を導出
  4. 回帰直線の区間推定領域を図示

➁【重要】回帰直線の区間推定導出のポイント

回帰直線の傾き\(a\)と\(y\)切片の\(b\)の期待値と分散を導出する際に、最も意識してほしいのは、

誤差を含むのは\(y_i\)だけ。
\(x_i\)だけの式は定数扱いで変形していくこと

分散V[a]の式の[a]の中から外にさらっと出す式変形が多々でてきますが、
変数は\(y\)に関わるものとしてみてください。ここが抜けると式変形が完全に理解できません。

➂導出過程に必要な値を事前に計算

必要に応じて計算する値を解説します。読み飛ばしていただいてOKですが、
「➃回帰直線の傾き\(a\)の期待値と分散を導出」
「➄回帰直線の\(y\)切片の\(b\)の期待値と分散を導出」
「⑥回帰直線の区間推定から\(\hat{y_i}\)の期待値と分散を導出」
で何度か、引用しますので、都度戻ってきてください。

各値の定義

平均\(\bar{x},\bar{y}\)、回帰直線に乗る点\(\hat{x_i},\hat{y_i}\)の位置関係を下図にあります。分散分析も含めた関連記事で復習しましょう。

回帰分析
繰返しのある単回帰分析の分散分析がよくわかる
繰返しのある単回帰分析の分散分析や当てはまりの悪さが何かが説明できますか?本記事では繰返しのある単回帰分析と実験計画法の一元配置実験を使って、分散分析をわかりやすく解説します。回帰分析をマスターしたい方は必読です。

事前に導出した値は以下の通りです。

  1. V[\(y_i\)]=\(σ^2\)
  2. V[\(\bar{y}\)]=\(\frac{σ^2}{n}\)
  3. 共分散の性質で、\(X_i\)と\(Y_j\)が互いに独立ならば、
    ●Cov(\(X_1+X_2\),\(Y_1+Y_2\))=
    Cov(\(X_1\),\(Y_1\))+ Cov(\(X_1\),\(Y_2\))
    +Cov(\(X_2\),\(Y_1\))+ Cov(\(X_2\),\(Y_2\))
  4. \(σ^2\)は計測できないので、\(σ^2\)=Ve=\(\frac{Se}{Φe(=n-2)}\)を使う

さっと導出します。

V[\(y_i\)]=\(σ^2\)の導出

データ\(y_i\)は、\(x_i\)、回帰直線の傾き\(a\)、y切片\(b\)と
正規分布N(0,\(σ^2\))に従う(と仮定する)誤差\(ε_i\)を使って、

\(y_i\)=\(ax_i+b+ε_i\)

と表現できます。

誤差\(ε_i\)のばらつきによって、回帰直線の区間推定幅があると考えるので、
V[\(y_i\)]=V[\(ax_i+b+ε_i\)]=V[\(ε_i\)]=\(σ^2\)
とします。

分散V[\(\bar{y}\)]=\(\frac{σ^2}{n}\)の導出

\(\bar{y}\)=\(\frac{1}{n}(y_1+y_2+…+y_n)\)より、
V[\(\bar{y}\)]=V[\(\frac{1}{n}(y_1+y_2+…+y_n)\)]
=\(\frac{1}{n^2}\) (V[\(y_1\)]+ V[\(y_2\)]+…+V[\(y_n\)])
=\(\frac{n}{n^2}\) (V[\(y_i\)])
=\(\frac{σ^2}{n}\) (V[\(y_i\)]=\(σ^2\)より)

共分散Covの性質

共分散の性質で、\(X_i\)と\(Y_j\)が互いに独立ならば、
●Cov(\(X_1+X_2\),\(Y_1+Y_2\))= Cov(\(X_1\),\(Y_1\))+ Cov(\(X_1\),\(Y_2\))+ Cov(\(X_2\),\(Y_1\))+ Cov(\(X_2\),\(Y_2\))
となります。

\(σ^2\)は計測できないので、\(σ^2\)=Ve=\(\frac{Se}{Φe(=n-2)}\)を使う

「⑥回帰直線の区間推定から\(\hat{y_i}\)の期待値と分散を導出」のところで使う値です。

以上、回帰直線の区間推定を求めるための下ごらえが終わりましたので、(その2)で導出過程を解説します。

まとめ

「回帰直線の区間推定が導出できる(その1)」を解説しました。

  • ①回帰直線の推定区間とは(その1)
  • ➁【重要】回帰直線の区間推定導出のポイント(その1)
  • ➂導出過程に必要な値を事前に計算(その1)
  • ➃回帰直線の傾き\(a\)の期待値と分散を導出(その2)
  • ➄回帰直線の\(y\)切片の\(b\)の期待値と分散を導出(その2)
  • ⑥回帰直線の区間推定領域を図示(その2)


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!