カテゴリー: 回帰分析

  • 回帰母数の検定と推定がよくわかる

    回帰母数の検定と推定がよくわかる

    「回帰母数の検定と推定がわからない」など、疑問に思いませんか?

    こういう疑問に答えます。

    本記事のテーマ

    回帰母数の検定と推定がよくわかる

    おさえておきたいポイント

    • ①回帰母数の検定・推定に必要な公式
    • ➁回帰の検定が理解できる例題
    • ➂回帰直線の傾きについての検定と推定
    • ➃回帰直線の\(y\)切片についての検定と推定
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】回帰分析問題集を販売します!

    QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。
    【QC検定®合格】「回帰分析(単回帰分析・重回帰分析)」問題集を販売します! 内容は、①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用、の5章全41題を演習できる問題集です。

    ①回帰母数の検定・推定に必要な公式

    基本は、回帰直線の推定区間の導出から得られる公式を使って解いていきます。
    理論は関連記事で確認ください。

    回帰直線の区間推定が導出できる(その1)
    回帰直線の区間推定が暗記せず、公式が導出できますか?本記事では2回に分けて導出過程をわかりやすく解説します。公式暗記に頼らず式を理解することがとても大事です。回帰分析を勉強する人は必読です。

    回帰直線の区間推定が導出できる(その2)
    回帰直線の区間推定が暗記せず、公式が導出できますか?本記事では2回に分けて導出過程をわかりやすく解説します。公式暗記に頼らず式を理解することがとても大事です。回帰分析を勉強する人は必読です。

    傾き\(a\)について

    関連記事からは、傾き\(a\)の期待値E[\(a\)]と分散V[\(a\)]は以下の式です。

    ●E[\(a\)]= \(a\)
    ●V[\(a\)]= \(\frac{σ^2}{S_{xx}}\)

    なので、これが正規分布に従うとしたら、
    傾き\(a\)は、N[\(a\)、\(\frac{σ^2}{S_{xx}}\)]
    に従うと書けますね。

    標準化して、正規分布を使った検定統計量を式にすると

    \(u\)=\(\frac{a-a_0}{\sqrt{σ^2/S_{xx}}}\)
    は正規分布N(0,\(1^2\))に従います。

    ただし、実際は\(σ^2\)を推定しないといけないので、よくt分布の直して検定と推定を行いますね。個人的には、別に正規分布のままで検定と推定してもよいと思いますけど。

    \(σ^2\)→Veに直して、 残差の自由度\(n-2\)を使って、t分布に従う検定統計量を書き直します。

    ●検定統計量\(t\)=\(\frac{a-a_0}{\sqrt{Ve/S_{xx}}}\)
    は自由度\(n-2\)のt分布に従い、
    ●区間推定は \(a\)± \(t(n-2,α)\)\(\sqrt{\frac{Ve}{S_{xx}}}\)
    から計算します。

    \(y\)切片\(b\)について

    関連記事からは、傾きy切片\(b\)の期待値E[\(b\)]と分散V[\(b\)]は以下の式です。

    ●E[\(b\)]= \(b\)
    ●V[\(b\)]=\(σ^2(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})\)

    なので、これが正規分布に従うとしたら、
    傾き\(y\)切片\(b\)は、N[\(b\)、\(σ^2(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})\)]
    に従うと書けますね。

    標準化して、正規分布を使った検定統計量を式にすると

    \(u\)=\(\frac{b-b_0}{\sqrt{σ^2(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})}}\)
    は正規分布N(0,\(1^2\))に従います。

    ただし、実際は\(σ^2\)を推定しないといけないので、よくt分布の直して検定と推定を行いますね。個人的には、別に正規分布のままで検定と推定してもよいと思いますけど。

    \(σ^2\)→Veに直して、 残差の自由度\(n-2\)を使って、t分布に従う検定統計量を書き直します。

    ●検定統計量\(t\)=\(\frac{b-b_0}{\sqrt{Ve(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})}}\)
    は自由度\(n-2\)のt分布に従い、
    ●区間推定は \(b\)± \(t(n-2,α)\)\(\sqrt{Ve(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})}\)
    から計算します。

    OKですね。では、実例を使って計算してみましょう。

    ➁回帰の検定が理解できる例題

    例題をあげましょう。

    10個のデータがあったが、再実験して下表のデータが得られた。
    元のデータにおいては、
    ●傾き\(a_0\)=1.2
    ●\(y\)切片\(b_0\)=-8
    だった。
    (1) 傾き\(a\)において、元の傾きから変化したかどうかを検定せよ。
    (2) 傾き\(a\)における信頼率95%の信頼区間を計算せよ。
    (3) \(y\)切片\(b\)において、元の\(y\)切片から変化したかどうかを検定せよ。
    (4) \(y\)切片\(b\)における信頼率95%の信頼区間を計算せよ。
    No
    1 1.3 2.4
    2 3.4 4.5
    3 5.6 3.6
    4 7.5 6.7
    5 9.1 8.9
    6 11.2 6.6
    7 13.4 14.3
    8 13.7 24.5
    9 14.2 20.8
    10 16.2 30.5
    合計 95.6 122.8

    平方和 分散分析 S Φ V データ
    Sxx 226.50 R 659.52 1 659.52 傾き\(a\) 1.7
    Syy 866.28 e 206.76 8 25.84 \(y\)切片\(b\) -4.03
    Sxy 386.50 T 866.28 9 R 0.76

    回帰分析

    では解いてみましょう。

    ➂回帰直線の傾きについての検定と推定

    傾きについての検定

    検定統計量を使って計算します。

    ●検定統計量\(t\)=\(\frac{a-a_0}{\sqrt{Ve/S_{xx}}}\)

    ●\(t\)=\(\frac{1.70-1.2}{\sqrt{25.84/226.50}}\)
    =1.50 < \(t(10-2,0.05)\)=2.306
    より、傾きが変化したとはいえないという結果になります。

    傾きについての推定

    ●区間推定は \(a\)± \(t(n-2,α)\)\(\sqrt{\frac{Ve}{S_{xx}}}\)

    ●区間推定=1.70± 2.306×\(\sqrt{\frac{25.84}{226.50}}\)
    =0.93~2.49
    となります。

    基本をしっかりおさえていれば、あとは公式代入で解けます。もちろん、理論が一番大事ですよ!

    ➃回帰直線の\(y\)切片についての検定と推定

    ●検定統計量\(t\)=\(\frac{b-b_0}{\sqrt{Ve(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})}}\)

    ●\(t\)=\(\frac{-4.03-(-8)}{\sqrt{25.84(\frac{1}{10}+\frac{\bar{9.56^2}}{226.50})}}\)
    =1.10 < \(t(10-2,0.05)\)=2.306
    より、\(y\)切片が変化したとはいえないという結果になります。

    傾きについての推定

    ●区間推定は \(b\)± \(t(n-2,α)\)\(\sqrt{Ve(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})}\)

    ●区間推定=-4.03±2.306×\(\sqrt{25.84(\frac{1}{10}+\frac{\bar{9.56^2}}{226.50})}\)
    =-12.35~4.29
    となります。

    結構幅が広いことがわかりますね。

    難しい計算問題でしたが、ちゃんとできましたね!

    公式は導出できてから使いましょう。

    まとめ

    「回帰母数の検定と推定がよくわかる」を解説しました。

    • ①回帰母数の検定・推定に必要な公式
    • ➁回帰の検定が理解できる例題
    • ➂回帰直線の傾きについての検定と推定
    • ➃回帰直線の\(y\)切片についての検定と推定

  • スピアマンの順位相関係数とピアソンの相関係数を比較する

    スピアマンの順位相関係数とピアソンの相関係数を比較する

    「スピアマンの順位相関係数とピアソンの相関係数の違いがよくわからない」など、疑問に思いませんか?

    こういう疑問に答えます。

    本記事のテーマ

    スピアマンの順位相関係数とピアソンの相関係数を比較する

    おさえておきたいポイント

    • ➀スピアマンの順位相関係数とピアソンの相関係数を比較
    • ➁スピアマンの順位相関係数とピアソンの相関係数が一致する条件
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】回帰分析問題集を販売します!

    QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。
    【QC検定®合格】「回帰分析(単回帰分析・重回帰分析)」問題集を販売します! 内容は、①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用、の5章全41題を演習できる問題集です。

    スピアマンの順位相関係数については、特別に公式暗記する必要はありません。自分で導出できます。

    導出過程は関連記事で確認ください。

    スピアマンの順位相関係数が導出できる
    スピアマンの順位相関係数は導出できますか?本記事では、一般的に使うピアソンの相関係数からスピアマンの順位相関係数を導出します。公式暗記は不要で自力で導出できるので、マスターしましょう

    スピアマンの順位相関係数の正負の入れ替えがわかる
    スピアマンの順位相関係数では、変数の順位が降順・降順で入れ替わると相関係数の正負が入れ替わります。その理由をわかりやすく解説します。スピアマンの順位相関係数はピアソンの相関係数から計算できるので、スピアマンの順位相関係数のための公式暗記は一切不要です。

    ピアソンの相関係数と比較することで、スピアマンの順位相関係数の理解を深めましょう。大事な記事です!

    ➀スピアマンの順位相関係数とピアソンの相関係数を比較

    データを用意

    変数\(x,y\)からなる、変量データを用意します。下表のとおりです。

    No x y
    1 0.15 8.05
    2 1.2 4.05
    3 2.08 5.77
    4 2.42 11.2
    5 4.82 20.17
    6 5.93 17.21
    7 6.15 15.22
    8 6.5 18.38
    9 7.32 30.59
    10 8.45 8.99

    ピアソンの相関係数

    平方和\(S_{xx}\),\(S_{yy}\),\(S_{xy}\)を計算します。
    ●\(S_{xx}\)=\(\sum_{i=1}^{n}(x_i -\bar{x})^2\)
    ●\(S_{yy}\)=\(\sum_{i=1}^{n}(y_i -\bar{y})^2\)
    ●\(S_{xy}\)=\(\sum_{i=1}^{n}(x_i -\bar{x})(y_i-\bar{y})\)
    表を追加します。

    No x y \((x-\bar{x})^2\) \((y-\bar{y})^2\) \((x-\bar{x})(y-\bar{y})\)
    1 0.15 8.05 18.94 34.96 25.73
    2 1.2 4.05 10.9 98.27 32.73
    3 2.08 5.77 5.87 67.13 19.84
    4 2.42 11.2 4.33 7.63 5.75
    5 4.82 20.17 0.1 38.53 1.97
    6 5.93 17.21 2.04 10.54 4.64
    7 6.15 15.22 2.72 1.58 2.07
    8 6.5 18.38 3.99 19.51 8.83
    9 7.32 30.59 7.94 276.46 46.85
    10 8.45 8.99 15.59 24.73 -19.63
    合計 45.02 139.63 72.42 579.34 128.79
    平均 4.502 13.963 ↑(\(S_{xx}\)) ↑(\(S_{yy}\)) ↑(\(S_{xy}\))

    よって、ピアソンの相関係数\(r\)は、

    ピアソンの相関係数\(r\)
    \(r\)=\(\frac{S_{xy}}{\sqrt{S_{xx} S_{yy}}}\)
    =\(\frac{128.79}{\sqrt{72.42×579.34}}\)
    =0.629

    これは、簡単ですね。

    スピアマンの順位相関係数

    変数\(x,y\)の順位をつけましょう。下表のとおりに変化しますね。

    実測データ 順位
    No x y x y
    1 0.15 8.05 1 3
    2 1.2 4.05 2 1
    3 2.08 5.77 3 2
    4 2.42 11.2 4 5
    5 4.82 20.17 5 9
    6 5.93 17.21 6 7
    7 6.15 15.22 7 6
    8 6.5 18.38 8 8
    9 7.32 30.59 9 10
    10 8.45 8.99 10 4

    スピアマンの順位相関係数\(r’\)を計算します。

    関連記事から、導出式を使います。

    スピアマンの順位相関係数が導出できる
    スピアマンの順位相関係数は導出できますか?本記事では、一般的に使うピアソンの相関係数からスピアマンの順位相関係数を導出します。公式暗記は不要で自力で導出できるので、マスターしましょう

    ●スピアマンの順位相関係数
    \(r\)=1-\(\frac{6\sum_{i=1}^{n}d_i^2}{n(n^2-1)}\)
    ここで、\(d_i\)=\(x_i -y_i\)

    計算に必要なデータは下表にあります。

    No x y d=x-y d2
    1 1 3 -2 4
    2 2 1 1 1
    3 3 2 1 1
    4 4 5 -1 1
    5 5 9 -4 16
    6 6 7 -1 1
    7 7 6 1 1
    8 8 8 0 0
    9 9 10 -1 1
    10 10 4 6 36
    合計 62
    ●スピアマンの順位相関係数
    \(r\)=1-\(\frac{6\sum_{i=1}^{n}d_i^2}{n(n^2-1)}\)
    =1-\(\frac{6×62}{10(10^2-1)}\)
    =0.624

    スピアマンの順位相関係数とピアソンの相関係数を比較

    図を比較します。

    スピアマンの順位相関係数

    ●ピアソンの相関係数\(r\)=0.629
    ●スピアマンの順位相関係数=0.624
    とスピアマンの順位相関係数の方が若干小さくなりました。
    データ値によって、
    ピアソンの相関係数とスピアマンの順位相関係数の
    大小関係の入れ替えはあります。

    ➁スピアマンの順位相関係数とピアソンの相関係数が一致する条件

    では、次の疑問が沸きますよね!

    スピアマンの順位相関係数とピアソンの相関係数が一致する条件って何?
    どんなデータを用意すればいいのか?

    一致するデータを用意

    結論からいいますと、

    スピアマンの順位相関係数とピアソンの相関係数が一致する条件は、
    各データから求まるR=\(\frac{S_{xy}^2}{S_{xx}S_{yy}}\)
    が一致する場合

    そりゃそうでしょう!というオチですが、
    スピアマンの順位相関係数とピアソンの相関係数の計算式は実は同じで、
    変数データを順位データに変換しても、寄与率Rの値が変化しなければOKです。

    スピアマンの順位相関係数とピアソンの相関係数が一致する例

    いろいろ例がありますが、

    1. ピアソンの相関係数とスピアマンの順位相関係数で扱うデータ値が完全に一致する場合
    2. ピアソンの相関係数側のデータが回帰直線に完全に乗る場合(つまり相関係数=1の場合)
    3. など(他の例も見つけてみてください)

    例えば、ピアソンの相関係数側のデータが回帰直線に完全に乗る場合(つまり相関係数=1の場合)ですが、実測データが完全に回帰直線に乗る場合(例としてy=3x-1)を下表に示します。

    No x y x順位 y順位
    1 0.15 -0.55 1 1
    2 1.2 2.6 2 2
    3 2.08 5.24 3 3
    4 2.42 6.26 4 4
    5 4.82 13.46 5 5
    6 5.93 16.79 6 6
    7 6.15 17.45 7 7
    8 6.5 18.5 8 8
    9 7.32 20.96 9 9
    10 8.45 24.35 10 10
    10 8.45 24.35 10 10

    グラフに描くと、確かに両者の相関係数は一致しています。

    スピアマンの順位相関係数

    などなど、いろいろ例がありますので、調べてみましょう。

    大事なのは、ピアソンの相関係数の式からスピアマンの順位相関係数の性質が導出できます!スピアマンの順位相関係数のための公式暗記は一切不要!導出過程を理解しましょう!

    まとめ

    「スピアマンの順位相関係数とピアソンの相関係数を比較する」を解説しました。

    • ➀スピアマンの順位相関係数とピアソンの相関係数を比較
    • ➁スピアマンの順位相関係数とピアソンの相関係数が一致する条件

  • 回帰分析と相関係数をマスターする

    回帰分析と相関係数をマスターする

    「回帰分析と相関係数の重要なポイントを速く知りたいけど、どうすればいいの?」

    こういう疑問に答えます。

    本記事のテーマ

    回帰分析と相関係数をマスターする

    おさえておきたいポイント

    • ➀相関係数の導出方法を覚える
    • ②相関係数とグラフのイメージをつかむ
    • ③回帰分析と分散分析
    • ④回帰分析の導出を理解する

    回帰分析の試験問題で、絶対に落とせない範囲です。本記事で重要ポイントを網羅しておさえます。

    ●You tube動画でも解説しています。ご覧ください。

    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】回帰分析問題集を販売します!

    QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。
    【QC検定®合格】「回帰分析(単回帰分析・重回帰分析)」問題集を販売します! 内容は、①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用、の5章全41題を演習できる問題集です。

    ➀相関係数の導出方法を覚える

    相関係数rの公式は、平方和の公式と合わせて覚える

    \(r=\frac{S_{xy}}{\sqrt{S_{xx} S_{yy}}}\)

    \(S_{xx}\)=\(\sum_{i=1}^{n} x_i^2-\frac{(\sum_{i=1}^{n} x_i)^2}{n}\)

    \(S_{yy}\)=\(\sum_{i=1}^{n} y_i^2-\frac{(\sum_{i=1}^{n} y_i)^2}{n}\)

    \(S_{xy}\)=\(\sum_{i=1}^{n} x_i y_i – \frac{\sum_{i=1}^{n} x_i \sum_{i=1}^{n} y_i}{n}\)

    平方和と似た公式なので、合わせて覚えると覚えやすいです。

    相関係数は-1≦r≦1と
    寄与率R=r2は0≦R≦1

    ②相関係数とグラフのイメージをつかむ

    相関係数r=-1,0,0.5のグラフ例を作る

    r=-1は、誤差のない完全な右下がりの直線
    r=0、直線ではないもの
    r=0.5は、中途半端にばらつきのある右上がりの直線

    相関係数r=-1、0,0.5のグラフ例(寄与率で表示)

    相関係数

    イメージしておきましょう。

    ③回帰分析と分散分析

    分散分析表はワンパターンなので、表ごと覚えましょう。

    平方和S 自由度φ 不偏分散V 分散比F
    回帰R \(S_R=\frac{(S_{xy})^2}{S_{xx}}\) \(φ_R \)=1 \(V_R \)=\(\frac{S_R}{φ_R}\) F=\(\frac{V_R}{V_e}\)
    残差e \(S_e=S_T-S_R\) \(φ_e \)=n-2 \(V_e \)=\(\frac{S_e}{φ_e}\)
    全変動T \(S_T=S_{yy}\) \(φ_T \)=n-1

    ④回帰分析の導出を理解する

    上の①②③だけでは、物足りないあなたは回帰分析の導出もできるようになっておきましょう。

    1.回帰直線の導出

    回帰直線を\(y=a+bx\)と定義します。
    測定データ(\(x_i,y_i\))と回帰直線との差を最小にする条件が、回帰直線の傾きとy切片です。

    \(Q(a,b)\)=\( \sum_{i=1}^{n} (y_i-(a+bx_i)^2\) → min
    \(Q(a,b)\)=\( \sum_{i=1}^{n} ((y_i-\bar{y})-b(x_i-\bar{x})+(\bar{y}-a-b\bar{x}))^2\)
    =\(S_{xx}(b-\frac{S_{xy}}{S_{xx}})^2\)+\(n(\bar{y}-a-b\bar{x})^2\)+\((S_{yy}-\frac{S_{xy}^2}{S_{xx}})\)

    \(Q(a,b)\)が最小になる条件は、
    \(b-\frac{S_{xy}}{S_{xx}}\)=0かつ、\(\bar{y}-a-b\bar{x}\)=0

    b=\(\frac{S_{xy}}{S_{xx}}\), \(a\)=\(\bar{y}-\frac{S_{xy}}{S_{xx}}\bar{x}\)
    が回帰直線の傾きと、y切片になります。

    演習問題
    \(Q(a,b)\)=\(S_{xx}(b-\frac{S_{xy}}{S_{xx}})^2\)+\(n(\bar{y}-a-b\bar{x})^2\)+\((S_{yy}-\frac{S_{xy}^2}{S_{xx}})\)を導出せよ。

    ブログなので、結論として完結にまとめていますが、実際は泥臭い展開をしています。力アップのためにもぜひ導出してください。

    2.平方和の分解

    ST= SR+ Seを導出します。

    平方和

    ①実測データ(xi, yi)、②回帰直線上の点(xi,y)と③データの平均値(\(\bar{x},\bar{y}\))を用いると、上図から下式のように分解できます。

    \(y_i – \bar{y}\) = \(ε_i\)+ \(r_i\)
    (回帰:\(r_i\)=\(u_i – \bar{y}\),
    残差:\(ε_i\)=\(y_i – u_i\))
    \(y_i – \bar{y}\) = \(b(x_i-\bar{x})+ε_i\)
    と書くことができます。

    平方和を計算します。
    \(\sum_{i=1}^{n} (y_i – \bar{y})^2\)=\(\sum_{i=1}^{n} (b(x_i-\bar{x})+ε_i)^2\)
    =\(b^2\sum_{i=1}^{n} (x_i-\bar{x})^2+2b\sum_{i=1}^{n}(x_i-\bar{x})ε_i +\sum_{i=1}^{n}ε_i^2\)

    ●\(\sum_{i=1}^{n} (y_i – \bar{y})^2\)は合計Tの平方和ST
    ●\(b^2\sum_{i=1}^{n} (x_i-\bar{x})^2\)は回帰Rの平方和SR
    ●\(\sum_{i=1}^{n}ε_i^2\)は残差eの平方和Se
    に一致します。

    つまり、
    ST= SR+2b\(\sum_{i=1}^{n}(x_i-\bar{x})ε_i \)+ Se
    となります。

    ところで、回帰直線となる条件は残差eを最小にする条件です。
    残差の平方和Se=\(\sum_{i=1}^{n} ε_i ^2\)=\(\sum_{i=1}^{n} (y_i – (a+bx_i))^2\)です。

    回帰直線は、残差Seが最小になる条件なので、次の式が成り立ちます。
    \(\displaystyle \frac{\partial S_e}{\partial a }\)=0, \(\displaystyle \frac{\partial S_e}{\partial b }\)=0

    つまり、
    ●\(\displaystyle \frac{\partial S_e}{\partial a }\)=\(\sum_{i=1}^{n} (y_i – (a+bx_i))\)
    =\(\sum_{i=1}^{n} (ε_i)\)=0
    ●\(\displaystyle \frac{\partial S_e}{\partial b }\)=\(\sum_{i=1}^{n} (y_i – (a+bx_i)) x_i\)
    =\(\sum_{i=1}^{n} (ε_i x_i)\)=0
    が成り立ちます。

    ST= SR+2b\(\sum_{i=1}^{n}(x_i-\bar{x})ε_i \)+ Se
    の第2項に注目します。
    \(\sum_{i=1}^{n}(x_i-\bar{x})ε_i \)=\(\sum_{i=1}^{n}(x_i ε_i \)-\(\bar{x}\sum_{i=1}^{n}ε_i \)
    =0-0=0
    と第2項は0になります。

    つまり、
    ST= SR+Se
    となります。

    3.寄与率の導出

    寄与率Rを平方和の比SR/ STで定義します。
    SR=b2Sxx
    ST= Syy
    b=\(\frac{S_{xy}}{S_{xx}}\)
    を代入します。

    R=\(\frac{S_R}{S_T}\)=\(b^2 \frac{S_{xx}}{S_{yy}}\)
    =\(\frac{S_{xy}^2}{S_{xx}^2} \frac{S_{xx}}{S_{yy}}\)
    =\(\frac{S_{xy}^2}{S_{xx} S_{yy}} \)

    複雑な計算ですが、一通り導出しておけば、試験では完璧です。重回帰分析への準備にもなりますので、ぜひ解いておきましょう。

    まとめ

    回帰分析と相関係数について、おさえておくべき重要事項と導出方法を解説しました。

    • ➀相関係数の導出方法を覚える
    • ②相関係数とグラフのイメージをつかむ
    • ③回帰分析と分散分析
    • ④回帰分析の導出を理解する

  • 無相関の検定がわかる

    無相関の検定がわかる

    「相関係数があるのになんで相関の有無を検定する必要があるの?」、「無相関の検定の検定統計量の式がどうしてあの式なの?」など、疑問に思いませんか?

    こういう疑問に答えます。

    本記事のテーマ

    無相関の検定がわかる

    おさえておきたいポイント

    • ➀相関係数があるのになんで相関の有無を調べたいのか?
    • ②無相関の検定の検定統計量を導出

    試験でよく出る問題なので、公式暗記して代入すれば試験はOKですが、意味がよくわからないはずです。どの教科書にも無相関の検定について十分な説明がないからです。

    ●You tube動画もごらんください。

    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】回帰分析問題集を販売します!

    QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。
    【QC検定®合格】「回帰分析(単回帰分析・重回帰分析)」問題集を販売します! 内容は、①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用、の5章全41題を演習できる問題集です。

    ➀相関係数があるのになんで相関の有無を調べたいのか?

    相関係数rがある(0ではない)のに、無相関の検定ってどういうこと?
    と思いますよね。

    どの教科書にも書いていませんでしたので、私の考えを紹介します。

    標本データから相関係数を算出しますが、母集団は本当に相関性があるのか?は気になります。

    標本データから母集団の相関性を調べるための方法が、無相関の検定と考えるとよいでしょう。イメージ図を下図に書きます。

    無相関の検定

    よくあるのが、たまたま線形性(相関性)の高いデータが集まった標本データをとったが、データ全体を見ると均一にばらついていることがよくあります。木を見て森を見ずです。

    たまたま、標本データに強い相関性が出たからといって、母集団も相関性があるかどうかはわからない。だから、本当にデータ集団全体も相関性があるかを確認する必要あります。

    ②無相関の検定の検定統計量を導出

    検定統計量

    無相関の検定について、検定統計量は次式です。

    \( t(n-2,α)\)=\(\frac{|r|\sqrt{n-2}}{\sqrt{1-r^2}}\)

    t分布、相関係数の両方が出て来るので、テストによく出題されます。

    でも、どうやって導出したの? 自由度はなんで、n-2なの? 気になりませんか? なので、導出しましょう!

    検定統計量の導出

    F分布から導出

    検定統計量はt分布の式でした。でもなんでF分布なの? と不思議ですが、導出していきます。

    標本データから母集団を推測する方法

    分散を使って、標本データと母集団はそれほど差がなく同じものと仮定します。よって分散比を使ったF分布からスタートします。統計学は数学を使って厳密に解く場合と、統計だけにざっくり定義する場合もあります。

    相関の有無

    相関の有無を式で定義しましょう。相関Rが多いか?それとも残差eが多いか?を比較すればよいのです。

    回帰分析における分散分析は、回帰Rと残差eの比較ですね。

    \(\frac{V_R}{V_e}=F(φ_R,φ_e,α)=F(1, φ_e,α)\)ですね。

    \(\frac{V_R}{V_e}= F(1, φ_e,α)\)は一見難しいですが、分散分析表でF値を計算するときに、分散の比と自由度をそれぞれ使うことがわかれば、この式は理解できますね。

    \(\frac{V_R}{V_e}\)をどんどん変形する

    \(\frac{V_R}{V_e}\)=\(\frac{S_R / φ_R}{S_e / φ_e}\)
    =\(\frac{S_R / 1}{S_e / (n-2)}\)
    (\(S_e=S_T-S_R\)を代入)
    = \(\frac{S_R (n-2)}{S_T – S_R}\)
    =(あ)

    (回帰の自由度)=1,(残差自由度)=n-2ですね。

    また、回帰について、T,R,eの平方和を数式で表現します。
    \(S_T\)=\(S_{yy}\)
    \(S_R\)=\(\frac{S_{xy}^2}{S_{xx}} \)
    を(あ)に代入します。

    (あ)= \(\frac{ \frac{S_{xy}^2}{S_{xx}} (n-2)}{ S_{yy} – \frac{S_{xy}^2}{S_{xx}}}\)

    =\(\frac{S_{xy}^2 (n-2)}{S_{xx} S_{yy}- S_{xy}^2}\)

    =\(\frac{\frac{S_{xy}^2}{S_{yy}S_{xx}}(n-2)}{1-\frac{S_{xy}^2}{S_{yy} S_{xx}}}\)

    =\(\frac{r^2(n-2)}{1-r^2}\)

    ここで、\(r^2\)=\(\frac{S_{xy}^2}{S_{xx} S_{yy}}\)です。

    t分布の検定統計量\( t(n-2,α)\)=\(\frac{|r|\sqrt{n-2}}{\sqrt{1-r^2}}\)の2乗の式になりました。

    F分布とt分布の関係
    F(1,φA,α)=t(φA,α)2

    よって、無相関の検定で使う、検定統計量がt分布の式で作ることができます。

    \( t(n-2,α)\)=\(\frac{|r|\sqrt{n-2}}{\sqrt{1-r^2}}\)

    導出を見れば気づくと思いますが、

    無相関の検定はF検定でもよいのです。

    F(1,φe,α)ですから、t分布より簡単な式ですね。無相関の検定をt分布で計算させるのは試験だからと思ってもよいでしょう。

    F分布とt分布の関係(補講)

    t分布の確率変数は t=\(\frac{Z}{\sqrt{\frac{W}{n}}}\)
    (分子ZはN(0,12)の標準正規分布、分母は自由度nのχ2乗分布の平方根)
    とします。これは、t分布の定義です。なぜ?ではなく、そう決めたものです。

    両辺を2乗します。
    \(t^2\)=\(\frac{Z^2}{\frac{W}{n}}\)

    =\(\frac{χ^2(1,α)}{χ^2(n,α)}\)

    =F(1,n,α)
    となります。これは、F分布の定義です。なぜ?ではなく、そう決めたものです。

    まとめ

    無相関の検定について解説しました。相関係数があるのに、相関の有無を検定する理由と、無相関の検定の式が複雑な式である理由を解説しました。

    • ➀相関係数があるのになんで相関の有無を調べたいのか?
    • ②無相関の検定の検定統計量を導出

  • error: Content is protected !!