月: 2023年1月

  • 平方和の分解と分散分析ができる(重回帰分析)

    平方和の分解と分散分析ができる(重回帰分析)

    本記事のテーマ

    平方和の分解と分散分析ができる(重回帰分析)

    おさえておきたいポイント

    • ①重回帰分析のデータの構造式
    • ➁平方和の分解
    • ➂中間積和項が0になる導出過程をすべて見せます!
    • ➃重回帰分析の分散分析

    【QC検定®1級合格】回帰分析問題集を販売します!

    QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。
    【内容】①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用、の5章全41題。

    多変量解析はすべて数式で導出できます。導出過程から本質を理解しましょう。

    重回帰分析の基礎である、回帰式の導出については関連記事に書いています。この関連記事をベースに本記事を作っています。ご確認ください。

    重回帰分析の回帰式が導出できる
    本記事では公式暗記になりがちな重回帰分析の回帰式を途中経過を一切端折らず丁寧に解説します。

    本記事は、暗記しがちな、重回帰分析の分散分析に必要な導出過程を丁寧に解説します。

    ①重回帰分析のデータの構造式

    データの構造式を作る

    下図のように、実測値\(y_i\)に対して、回帰直線上にある予測値\(\hat{y_i}\)と平均値\(\bar{y}\)を使って、差を分割します。

    重回帰分析

    つまり、
    (\(y_i\)-\(\bar{y}\))=(\(\hat{y_i}\)-\(\bar{y}\))+(\(y_i\)-\(\hat{y_i}\))
    (誤差全体)=(回帰成分)+(残差成分)
    に分ける式(データの構造式)を作ります。

    誤差を一次式で分割する「データの構造式」は
    QCで扱う数学の中で一番大事且つ基本的な式で、
    分散分析を扱う
    ●実験計画法
    ●回帰分析
    ●多変量解析
    など、すべてに関わってきます。

    まず、データの構造式を作りましょう。

    ➁平方和の分解

    データの構造式の2乗和が肝

    データの構造式を作ったら、両辺の2乗和を計算します。
    すると、2乗項以外の積和がすべて0になるので、
    平方和が分解できて、
    分散分析ができる!

    これも、超基本ですが、超大事ですね! これを頭で覚えず、ちゃんと計算・導出できてから理解しましょう。自分で計算して平方和が分解できることがわかることが大事です!

    平方和の分解

    (\(y_i\)-\(\bar{y}\))=(\(\hat{y_i}\)-\(\bar{y}\))+(\(y_i\)-\(\hat{y_i}\))
    の両辺の2乗和を取ります。

    \(\sum_{i=1}^{n}\)\((y_i-\bar{y})^2\)
    =\(\sum_{i=1}^{n}\)(\((\hat{y_i}-\bar{y})\)+\((y_i-\hat{y_i}))^2\)
    とします。

    (右辺)を変形すると、
    \(\sum_{i=1}^{n}\)(\((\hat{y_i}-\bar{y})\)+\((y_i-\hat{y_i}))^2\)
    =\(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})^2\) →(1)
    +2\(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})\)\((y_i-\hat{y_i})\) →(2)
    +\(\sum_{i=1}^{n}\)\((y_i-\hat{y_i})^2\) →(3)
    と変形できます。

    実は、
    ●(1):\(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})^2\)=\(S_R\)(回帰平方和)
    ●(2):\(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})\)\((y_i-\hat{y_i})\)=0
    ●(3):\(\sum_{i=1}^{n}\)\((y_i-\hat{y_i})^2\)=\(S_{er}\)((回帰)残差平方和)
    となります。

    (左辺)の
    \(\sum_{i=1}^{n}\)\((y_i-\bar{y})^2\)は総平方和として、
    \(\sum_{i=1}^{n}\)\((y_i-\bar{y})^2\)=\(S_T\)(総平方和)
    となるので、

    まとめると、
    \(S_T\)=\(S_R\)+\(S_{er}\)
    (総平方和)=(回帰平方和)+ ((回帰)残差平方和)
    と平方和が分解できます。

    分散分析をやるので、
    \(S_T\)=\(S_R\)+\(S_{er}\)
    が当たり前に見えるけど
    ●(2):\(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})\)\((y_i-\hat{y_i})\)=0
    はちゃんと証明できる?

    中間積和項である、
    \(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})\)\((y_i-\hat{y_i})\)=0
    はちゃんと導出できますか?

    結構難しいのに、ちゃんと書いていない教科書やサイトが多いので、本記事でばっちり解説します!

    ➂中間積和項が0になる導出過程をすべて見せます!

    ポイントは2つあり、

    1. 回帰直線上の点である条件を活用する
    2. \((y_i-\hat{y_i})\)を\(((y_i-\bar{y})-(\hat{y_i}-\bar{y}))\)に分割する
    3. 回帰式の成立条件式を活用する

    では、丁寧に導出していきます。必ずなぞってください。いい勉強になります。

    回帰直線上の点である条件を活用する

    ここで、
    \(\hat{y_i}\)と\(\hat{y_i}\)は回帰直線\(y=a+bx_1 +cx_2\)上に乗るので
    ●\(\hat{y_i}\)=\(a+bx_{1i}+cx_{2i}\)
    ●\(\bar{y}\)=\(a+b \bar{x_1}+c \bar{x_2}\)
    が成り立ちます。代入しましょう。

    回帰直線上の点である条件を活用する

    ここで、
    \(\hat{y_i}\)と\(\hat{y_i}\)は回帰直線\(y=a+bx_1 +cx_2\)上に乗るので
    ●\(\hat{y_i}\)=\(a+bx_{1i}+cx_{2i}\)
    ●\(\bar{y}\)=\(a+b \bar{x_1}+c \bar{x_2}\)
    が成り立ちます。代入しましょう。

    \(\sum_{i=1}^{n}\)\(((a+bx_{1i}+cx_{2i})-( a+b \bar{x_1}+c \bar{x_2}))\)\((y_i-\hat{y_i})\)
    =\(\sum_{i=1}^{n}\)\( (b(x_{1i}-\bar{x_1})+ c(x_{2i}-\bar{x_2}))\)\((y_i-\hat{y_i})\)
    =\(b\sum_{i=1}^{n}\)\( (x_{1i}-\bar{x_1})\)\((y_i-\hat{y_i})\)
    +\(c\sum_{i=1}^{n}\)\( (x_{2i}-\bar{x_2})\)\((y_i-\hat{y_i})\) (式1)
    と変形します。

    \((y_i-\hat{y_i})\)を\(((y_i-\bar{y})-(\hat{y_i}-\bar{y}))\)に分割する

    (式1)の\((y_i-\hat{y_i})\)を\(((y_i-\bar{y})-(\hat{y_i}-\bar{y}))\)に分割します。

    (式1)
    =\(b\sum_{i=1}^{n}\)\( (x_{1i}-\bar{x_1})\)\(((y_i-\bar{y})-(\hat{y_i}-\bar{y}))\)
    +\(c\sum_{i=1}^{n}\)\( (x_{2i}-\bar{x_2})\)\(((y_i-\bar{y})-(\hat{y_i}-\bar{y}))\) (式2)
    と変形します。

    さらに、
    回帰直線上の点である条件を活用し、

    ●\(\hat{y_i}\)=\(a+bx_{1i}+cx_{2i}\)
    ●\(\bar{y}\)=\(a+b \bar{x_1}+c \bar{x_2}\)
    を、(式2)に代入しましょう。

    (式2)
    =\(b\sum_{i=1}^{n}\)\( (x_{1i}-\bar{x_1})\)\(((y_i-\bar{y})-b(x_{1i}-\bar{x_1})\)\(- c(x_{2i}-\bar{x_2})
    )\)
    +\(c\sum_{i=1}^{n}\)\( (x_{2i}-\bar{x_2})\)\(((y_i-\bar{y})-b(x_{1i}-\bar{x_1})\)\(- c(x_{2i}-\bar{x_2})
    )\) (式3)
    と変形します。

    回帰式の成立条件式を活用する

    (式3)のかっこ()を掛け算すると
    ●\(b\sum_{i=1}^{n}\)\( (x_{1i}-\bar{x_1})\)\((y_i-\bar{y})\)=\(bS_{1y}\)
    ●\(b\sum_{i=1}^{n}\)\( (x_{1i}-\bar{x_1})\)\((-b)(x_{1i}-\bar{x_1})\)=\(-b^2 S_{11}\)
    ●\(b\sum_{i=1}^{n}\)\( (x_{1i}-\bar{x_1})\)\((-c)(x_{2i}-\bar{x_2})\)=\(-bc S_{12}\)
    となりますし、
    ●\(c\sum_{i=1}^{n}\)\( (x_{2i}-\bar{x_2})\)\((y_i-\bar{y})\)=\(cS_{2y}\)
    ●\(c\sum_{i=1}^{n}\)\( (x_{2i}-\bar{x_2})\)\(-b)(x_{1i}-\bar{x_1})\)=\(-bcS_{12}\)
    ●\(c\sum_{i=1}^{n}\)\( (x_{2i}-\bar{x_2})\)\((-c)(x_{2i}-\bar{x_2})\)=\(-c^2 S_{22}\)
    となります。

    (式3)をまとめると
    =\(b\sum_{i=1}^{n}\)\( (x_{1i}-\bar{x_1})\)\(((y_i-\bar{y})-b(x_{1i}-\bar{x_1})\)\(- c(x_{2i}-\bar{x_2})
    )\)
    +\(c\sum_{i=1}^{n}\)\( (x_{2i}-\bar{x_2})\)\(((y_i-\bar{y})-b(x_{1i}-\bar{x_1})\)\(- c(x_{2i}-\bar{x_2})
    )\)
    =\(bS_{1y}\)-\(b^2 S_{11}\) -\(bc S_{12}\)
    +\(cS_{2y}\) -\(bcS_{12}\) -\(c^2 S_{22}\) =(式4)
    となります。

    ところで、回帰直線の成立条件を思い出すと、関連記事からみると

    重回帰分析の回帰式が導出できる
    本記事では公式暗記になりがちな重回帰分析の回帰式を途中経過を一切端折らず丁寧に解説します。

    ●傾き\(β_1\)、\(β_2\)の導出
    \(S_{11}b+S_{12}c\)=\(S_{1y}\)
    \(S_{12}b+S_{22}c\)=\(S_{2y}\)
    を満たす連立方程式から、\(β_1\)、\(β_2\)が導出できます!

    でしたね。(式4)をよくみると、
    (式4)
    =\(bS_{1y}\)-\(b^2 S_{11}\) -\(bc S_{12}\)
    +\(cS_{2y}\) -\(bcS_{12}\) -\(c^2 S_{22}\)
    =\(b\){\( S_{1y}-b S_{11}-c S_{12}\)}
    +\(c\){ \(S_{2y}-b S_{12}-c S_{22}\)}=(式5)
    となり、「{}」の中身が0になるのがわかりますね。

    よって、結果は

    \(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})\)\((y_i-\hat{y_i})\)=0
    となり、中間積和は0になります。これが平方和が分解できる理由ですね。

    難しいですが、必ず解いてから平方和の分解→分散分析と進めましょう。QCの数学で一番大事なところです!

    ➂重回帰分析の分散分析

    回帰平方和\(S_R\)の導出

    平方和が分解できたので、
    \(S_T\)=\(S_R\)+\(S_{er}\)
    (総平方和)=(回帰平方和)+ ((回帰)残差平方和)
    と平方和が分解できます。

    回帰平方和\(S_R\)の求め方の1つである次の公式を紹介・証明をします。結構活用します。

    \(S_R\)=\(β_1 S_{1y}\)+\(β_2 S_{2y}\)

    回帰平方和\(S_R\)は定義から
    \(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})^2\)
    から計算してもよいですが、回帰直線の傾き\(β\)を使って求める方が経験上多いです。

    公式は暗記ではなく、ちゃんと導出できますので、導出過程をしっかりおさえてください。

    \(S_R\)=\(β_1 S_{1y}\)+\(β_2 S_{2y}\)の証明

    \(\hat{y_i}\)と\(\bar{y}\)はともに、
    回帰直線上の点である条件を活用し、
    \((\hat{y_i}-\bar{y})\)=\(β_1(x_{1i}-\bar{x_1})+β_2(x_{2i}-\bar{x_2})\)
    を代入します。

    \(S_R\)
    =\(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})^2\)
    =\(\sum_{i=1}^{n}\)\((β_1(x_{1i}-\bar{x_1})+β_2(x_{2i}-\bar{x_2}))^2\)
    =\(β_1^2 \sum_{i=1}^{n}\)\((x_{1i}-\bar{x_1})^2\)
    +\(2β_1 β_2\)\(\sum_{i=1}^{n}\)\((x_{1i}-\bar{x_1})(x_{2i}-\bar{x_2})\)
    +\(β_2^2 \sum_{i=1}^{n}\)\((x_{2i}-\bar{x_2})^2\)
    =(式6)

    (式6)の∑の中身は各々の平方和なので、表記を変えます。
    (式6)
    =\(β_1^2 S_{11}\)+\(2β_1 β_2 S_{12}\)+\(β_2^2 S_{22}\)
    =\(β_1\)(\(β_1 S_{11}+β_2 S{12}\))+\(β_2\)(\(β_1 S_{12}+β_2 S{22}\))
    =(式7)

    ここで、

    ●傾き\(β_1\)、\(β_2\)の導出
    \(S_{11}b+S_{12}c\)=\(S_{1y}\)
    \(S_{12}b+S_{22}c\)=\(S_{2y}\)
    を満たす連立方程式から、\(β_1\)、\(β_2\)が導出できます!

    を使うと、(式7)は
    (式7)
    =\(β_1\)(\(β_1 S_{11}+β_2 S{12}\))+\(β_2\)(\(β_1 S_{12}+β_2 S{22}\))
    =\(β_1\)\(S_{1y}\)+\(β_2\)\(S_{2y}\)
    となります。ちゃんと導出できますね!

    よって、

    \(S_R\)=\(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})^2\)
    =\(β_1 S_{1y}\)+\(β_2 S_{2y}\)
    が導出できます! 暗記より導出方法をしっかりマスターしましょう!

    重回帰分析の分散分析表

    よく使う分散分析表は下表のとおりです。

    平方和S 自由度φ
    回帰R \(S_R\) k
    e \(S_{er}\) n-k-1
    T \(S_T\) n-1

    ここで、kは説明変数の種類ですね。

    なお、重回帰分析の分散分析については別の関連記事で詳しく解説します。

    まとめ

    「平方和の分解と分散分析ができる(重回帰分析)」を解説しました。

    • ①重回帰分析のデータの構造式
    • ➁平方和の分解
    • ➂中間積和項が0になる導出過程をすべて見せます!
    • ➃重回帰分析の分散分析
  • 重回帰分析の回帰式が導出できる

    重回帰分析の回帰式が導出できる

    本記事のテーマ

    重回帰分析の回帰式が導出できる

    おさえておきたいポイント

    • ①回帰式は誤差を最小にする条件で導出
    • ➁回帰式を導出
    • ➂【実例】回帰式を作る

    【QC検定®1級合格】回帰分析問題集を販売します!

    QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。
    【内容】①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用、の5章全41題。

    多変量解析はすべて数式で導出できます。導出過程から本質を理解しましょう。

    ①回帰式は誤差を最小にする条件で導出

    データの構造式を作る

    本記事は、説明変数が2つ(\(x_1,x_2\))、目的変数\(y\)についての回帰式を作ります。

    導出過程を一切端折らず解説しますので、一度などって下さい。理解が深まります!

    回帰式をなす、データの構造式は
    \(y=a+bx_1+cx_2\)
    として、定数\(a,b,c\)を求めていきます。回帰式となる定数\(a,b,c\)を
    ●\(a\)=\(β_0\)
    ●\(b\)=\(β_1\)
    ●\(c\)=\(β_2\)
    でよく表現します。

    回帰式は誤差を最小にする条件で導出

    ここで、同じ\(x_1,x_2\)について、実測値\(y_i\)と回帰式で求められる\(\hat{y_i}\)の2つを考えます。

    重回帰分析

    図は、理解しやすくするために、あえて2次元で描いています。

    実測値\(y_i\)と予測値\(\hat{y_i}\)の差を
    \(Q(a,b,c)\)と定義して
    \(Q(a,b,c)\)=\(\sum_{i=1}^{n}(y_i – \hat{y_i})^2\)
    が最小となる条件が、重回帰分析の回帰式を求める条件となります。

    つまり、実測値と予測値の差(誤差)を最小にする条件から回帰式を作ります。

    「(誤差)を最小にする条件」が最も大事です!

    複雑な計算になりますが、エッセンスは、「(誤差)を最小にする条件」です。

    ➁回帰式を導出

    2乗和を展開(導出過程すべて見せます!)

    \(Q(a,b,c)\)=\(\sum_{i=1}^{n}(y_i – \hat{y_i})^2\)

    \(Q(a,b,c)\)=\(\sum_{i=1}^{n}((y_i -\bar{y}) –(\hat{y_i}-\bar{y}))^2\)
    と間に\(\bar{y}\)を入れます。

    また、\(\bar{y}\)と\(\hat{y_i}\)は回帰式を通るので、
    ●\(\bar{y}\)=\(a_+b \bar{x_1}+c \bar{x_2}\)
    ●\(\hat{y}\)=\(a_+b x_{1i}+c x_{2i}\)
    が成り立つので、\(Q(a,b,c)\)に代入します。

    代入すると、
    \(Q(a,b,c)\)= \(\sum_{i=1}^{n}((y_i -\bar{y})\) –\(b(x_{1i}-\bar{x_1})\)-\( c(x_{2i}-\bar{x_2}))^2\)
    さらに、意図的に
    ●\(\bar{y}\)=\(a_+b \bar{x_1}+c \bar{x_2}\)を
    0=\(\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}\))
    として、\(Q(a,b,c)\)に代入します。

    よって、
    \(Q(a,b,c)\)= \(\sum_{i=1}^{n}((y_i -\bar{y})\)
    -\(b(x_{1i}-\bar{x_1})\)
    -\( c(x_{2i}-\bar{x_2})\)
    +\((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2})))^2\)
    となります。

    2乗和を整理

    この長い2乗式を展開します。

    \(Q(a,b,c)\)
    = \(\sum_{i=1}^{n}\) \( ((y_i -\bar{y})^2 \) →(1)
    +\(b^2(x_{1i}-\bar{x_1})^2\) →(2)
    +\(c^2(x_{2i}-\bar{x_2})^2\) →(3)
    +\(((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))^2\) →(4)
    -\(2b(y_i -\bar{y})(x_{1i}-\bar{x_1})\) →(5)
    -\(2c (y_i -\bar{y})(x_{2i}-\bar{x_2})\) →(6)
    +\(2(y_i -\bar{y})(\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))\) →(7)
    + \(2bc(x_{1i}-\bar{x_1})(x_{2i}-\bar{x_2})\) →(8)
    -\(2b(x_{1i}-\bar{x_1})\)\((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))\) →(9)
    -\(2c(x_{2i}-\bar{x_2})\)\((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2})))\) →(10)
    と展開します。長いですが、頑張りましょう。

    上の計算式を(1)~(10)に分けて、それぞれ見ていきましょう。

    ●(1)は
    \(\sum_{i=1}^{n}\) \( (y_i -\bar{y})^2 \)=\(S_{yy}\)と置けます。
    以下、Sは平方和を使って式を簡単に書いていきます。

    ●(2)は
    \(\sum_{i=1}^{n}\) \(b^2(x_{1i}-\bar{x_1})^2\) =\(b^2 S_{11}\)と置けます。

    ●(3)は
    \(\sum_{i=1}^{n}\) \(c^2(x_{2i}-\bar{x_2})^2\) =\(c^2 S_{22}\)と置けます。

    ●(4)はちょっとややこしいですが、定数を∑するので、
    \(\sum_{i=1}^{n}\)\(((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))^2\)
    =\(n((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))^2\)
    となります。あとで定数\(a\)を求めるための大事な式になります。

    ●(5)は
    \(\sum_{i=1}^{n}\)\(2b(y_i -\bar{y})(x_{1i}-\bar{x_1})\)
    =\(2b S_{1y}\)と置けます。

    ●(6)は
    \(\sum_{i=1}^{n}\)\(2c (y_i -\bar{y})(x_{2i}-\bar{x_2})\)
    = \(2c S_{2y}\)と置けます。

    ●(7)は、
    \(\sum_{i=1}^{n}\)\(2(y_i -\bar{y})(\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))\)
    =2\((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))\)\(\sum_{i=1}^{n}\)\((y_i -\bar{y})\)
    と定数を∑の外に出せて、かつ、
    \(\sum_{i=1}^{n}\)\((y_i -\bar{y})\)=0
    なので、
    (7)=0になります。

    ●(8)は、
    \(\sum_{i=1}^{n}\) \(2bc(x_{1i}-\bar{x_1})(x_{2i}-\bar{x_2})\)
    =\(2bc S_{12}\)
    と置けます。

    ●(9)は、
    \(\sum_{i=1}^{n}\)\(2b(x_{1i}-\bar{x_1})\)\((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))\)
    =\(2b(\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))\)\(\sum_{i=1}^{n}\)\((x_{1i}-\bar{x_1})\)
    と定数を∑の外に出せて、かつ、
    \(\sum_{i=1}^{n}\)\((x_{1i}-\bar{x_1})\)=0
    なので、
    (9)=0になります。

    ●(10)は、
    \(\sum_{i=1}^{n}\)\(2c(x_{2i}-\bar{x_2})\)\((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2})))\)
    =\(2c(\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2})))\)\(\sum_{i=1}^{n}\)\((x_{2i}-\bar{x_2})\)
    と定数を∑の外に出せて、かつ、
    \(\sum_{i=1}^{n}\)\(\sum_{i=1}^{n}\)\((x_{2i}-\bar{x_2})\)=0
    なので、
    (10)=0になります。

    誤差を最小にする条件

    (1)~(10)をまとめると、

    \(Q(a,b,c)\)= \(S_{yy}\)-\(b^2 S_{11}\)+\(c^2 S_{22}\)
    +\(n((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))^2\)
    -\(2b S_{1y}\)- \(2c S_{2y}\)+\(2bc S_{12}\)
    と整理できます。

    だいぶスッキリしましたね。機械的に計算しているだけなので、公式暗記の前に一回はなぞって理解しましょう。

    回帰式を導出

    ここで、回帰式の係数とy切片を求めます。つまり、
    ●\(a\)=\(β_0\)
    ●\(b\)=\(β_1\)
    ●\(c\)=\(β_2\)
    の各値です。

    回帰式は\(Q(a,b,c)\)が最小となる条件です。

    y切片 \(β_0\)の導出

    (Q(a,b,c))が最小となる条件で、定数(a)が有る項は、

    \(Q(a,b,c)\)= \(S_{yy}\)-\(b^2 S_{11}\)+\(c^2 S_{22}\)
    +\(n((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))^2\)
    -\(2b S_{1y}\)- \(2c S_{2y}\)+\(2bc S_{12}\)

    \(((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))^2\)
    の部分ですね。

    黄色マーカの2乗が最小になるのは、中身が0の時ですね。
    よって、
    \(\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2})\)=0
    が条件となり、変形すると、
    \(β_0\)=\(a\)=\(\bar{y}\)-(\(b \bar{x_1}+c \bar{x_2})\)
    が求める式となります。

    傾き\(β_1\)、\(β_2\)の導出

    \(Q(a,b,c)\)= \(S_{yy}\)-\(b^2 S_{11}\)+\(c^2 S_{22}\)
    +\(n((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))^2\)
    -\(2b S_{1y}\)- \(2c S_{2y}\)+\(2bc S_{12}\)
    は、\(b,c\)の変数なので、
    偏微分=0
    から求めます。

    ●\(\displaystyle \frac{\partial Q(b,c)}{\partial b}\)=0
    ●\(\displaystyle \frac{\partial Q(b,c)}{\partial c}\)=0
    から条件式を作ります。

    ●\(\displaystyle \frac{\partial Q(b,c)}{\partial b}\)
    =\(2bS_{11}-2S_{1y}+2cS_{12}\)=0
    ●\(\displaystyle \frac{\partial Q(b,c)}{\partial c}\)
    =\(2cS_{22}-2S_{2y}+2bS_{12}\)=0
    となる連立方程式ができます。

    よって、
    \(S_{11}b+S_{12}c\)=\(S_{1y}\)
    \(S_{12}b+S_{22}c\)=\(S_{2y}\)
    を満たす連立方程式から、
    傾き\(b\)=\(β_1\)、\(c\)=\(β_2\)が導出できます。

    【結論】回帰式の導出

    ●y切片 \(β_0\)の導出
    \(β_0\)=\(a\)=\(\bar{y}\)-(\(b \bar{x_1}+c \bar{x_2})\)
    から計算し、
    ●傾き\(β_1\)、\(β_2\)の導出
    \(S_{11}b+S_{12}c\)=\(S_{1y}\)
    \(S_{12}b+S_{22}c\)=\(S_{2y}\)
    を満たす連立方程式から、\(β_1\)、\(β_2\)が導出できます!

    ちゃんと、導出できましたね!一切途中経過を端折っていないので、なぞるだけでも理解が深まります!

    では、具体的な数字を使って回帰式を作ってみましょう。

    ➂【実例】回帰式を作る

    データ例

    以下のデータを使って重回帰分析の回帰式を作ってみましょう。

    x1 x2 y
    3 1 3
    2 4 4
    4 2 4
    4 5 7
    5 4 7
    6 2 5

    導出式から回帰式を計算する

    ●y切片 \(β_0\)の導出
    \(β_0\)=\(a\)=\(\bar{y}\)-(\(b \bar{x_1}+c \bar{x_2})\)
    から計算し、
    ●傾き\(β_1\)、\(β_2\)の導出
    \(S_{11}b+S_{12}c\)=\(S_{1y}\)
    \(S_{12}b+S_{22}c\)=\(S_{2y}\)
    を満たす連立方程式から、\(β_1\)、\(β_2\)が導出できます!

    なので、
    ●平均\(\bar{x_1},\bar{x_2},\bar{y}\)と
    ●平方和\(S_{11}\),\(S_{12}\),\( S_{1y}\),\( S_{22}\),\( S_{2y}\)
    を計算しましょう。結構、計算が必要ですね。
    下表に結果をまとめましょう。

    x1 x2 y A=
    \(x_1\)-\(\bar{x_1}\)
    B=
    \(x_2\)-\(\bar{x_2}\)
    C=
    \(y-\bar{y}\)
    \(A^2\)=\(S_{11}\) \(AC\)=\(S_{1y}\) \(AB\)=\(S_{12}\) \(B^2\)=\(S_{22}\) \(BC\)=\(S_{2y}\) \(C^2\)=\(S_{yy}\)
    3 1 3 -1 -2 -2 1 2 2 4 4 4
    2 4 4 -2 1 -1 4 2 -2 1 -1 1
    4 2 4 0 -1 -1 0 0 0 1 1 1
    4 5 7 0 2 2 0 0 0 4 4 4
    5 4 7 1 1 2 1 2 1 1 2 4
    6 2 5 2 -1 0 4 0 -2 1 0 0
    合計 24 18 30 0 0 0 10 6 -1 12 10 14
    平均 4 3 5 ↑\(S_{11}\) ↑\(S_{1y}\) ↑\(S_{12}\) ↑\(S_{22}\) ↑\(S_{2y}\) ↑\(S_{yy}\)

    よって、
    ●y切片 \(β_0\)の導出
    \(β_0\)=\(a\)=\(\bar{y}\)-(\(b \bar{x_1}+c \bar{x_2})\)
    から計算し、
    ●傾き\(β_1\)、\(β_2\)の導出
    \(10b-c\)=6
    \(-b+12c\)=10
    から、
    \(b=β_1\)=\(\frac{82}{119}\)
    \(c=β_2\)=\(\frac{106}{109}\)

    \(β_0\)=\(a\)=\(\bar{y}\)-(\(b \bar{x_1}+c \bar{x_2})\)
    から
    5-\(\frac{82}{119}\)×4-\(\frac{106}{109}\)×3=-\(\frac{51}{109}\)

    以上、
    \(y\)=-\(\frac{51}{109}\)+\(\frac{82}{119}x_1\)+\(\frac{106}{109}x_2\)
    =-0.429+0.689\(x_1\)+0.891\(x_2\)
    となります。

    Excelから回帰式を計算する

    関数を使って一発で出せます。

    LINEST関数を使います。下図のように、縦5マス、横3マス分を選択して、
    「=LINEST(D3:D8,B3:C8,TRUE,TRUE)」
    の関数を入力して
    「ctrl+shift」を同時に押して、「enter」すると自動計算されます。

    重回帰分析

    自動計算は一瞬でできて、下図の結果になります。

    重回帰分析

    確かに、手計算で求めた
    \(y\)=-\(\frac{51}{109}\)+\(\frac{82}{119}x_1\)+\(\frac{106}{109}x_2\)
    =-0.429+0.689\(x_1\)+0.891\(x_2\)
    と一致します。

    当然、手計算でもExcel関数からでも結果は一致します。Excel関数の方が楽チンですが、意味を理解するためにも手計算で一度解くことを勧めます。

    まとめ

    「重回帰分析の回帰式が導出できる」を解説しました。

    • ①回帰式は誤差を最小にする条件で導出
    • ➁回帰式を導出
    • ➂【実例】回帰式を作る
  • 【まとめ】単回帰分析がわかる

    【まとめ】単回帰分析がわかる

    本記事のテーマ

    【まとめ】単回帰分析がわかる
    • ①単回帰分析の重要ポイント
    • ②QCプラネッツの単回帰分析の関連ブログを紹介
    • ③QCプラネッツがまとめた単回帰分析の冊子を紹介

    解説記事、冊子に、問題集(有料)を用意しています。是非ご活用ください!

    【QC検定®1級合格】回帰分析問題集を販売します!

    QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。
    ★関連リンク★
    【QC検定®合格】「回帰分析(単回帰分析・重回帰分析)」問題集

    【ポイント】

    ①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用を演習!

    ①単回帰分析の重要ポイント

    4テーマがあり、それぞれを詳細に関連ブログや冊子で紹介します。

    • ①回帰分析の超基本
    • ➁単回帰分析の基本(相関係数、回帰直線 分散分析)
    • ➂単回帰の検定と推定
    • ➃繰返しのある単回帰分析

    単回帰分析でマスターしたい内容をQCプラネッツがすべて解説!

    1. 無相関の検定
    2. 回帰分析と相関係数の計算
    3. 相関係数が-1~1までの理由
    4. クラメールの連関係数の導出
    5. スピアマンの順位相関係数を導出
    6. スピアマンの順位相関係数とピアソンの相関係数の比較
    7. 回帰分析と実験計画法を比較
    8. 繰返しのある単回帰分析の分散分析
    9. 回帰直線の区間推定を導出
    10. 回帰母数の検定と推定
    11. 大波の相関、小波の相関、符号検定
    12. 繰返しのある単回帰分析
    13. 単回帰分析のテコ比

    ②QCプラネッツの単回帰分析の関連ブログを紹介

    それぞれの、関連リンクでご確認ください。

    1. 回帰分析と相関係数をマスターする
    2. 無相関の検定がわかる
    3. 【必読】回帰分析と相関係数は確実に点数化すべし【QC検定®2級対策】
    4. 回帰分析と相関分析の演習問題【QC検定®2級対策】
    5. 回帰母数の検定と推定がよくわかる
    6. スピアマンの順位相関係数とピアソンの相関係数を比較する
    ●商標使用について、
    ①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
    ➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
    ➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。
    1. 回帰分析と相関係数をマスターする
    2. 【必読】相関係数や寄与率が1以上にできない理由がわかる
    3. 無相関の検定がわかる
    4. 回帰分析と実験計画法の違いがよくわかる(繰返しデータ無しの場合)
    5. 【必読】回帰分析と相関係数は確実に点数化すべし【QC検定®2級対策】
    6. 回帰分析と相関分析の演習問題【QC検定®2級対策】
    7. 回帰母数の検定と推定がよくわかる
    8. 回帰直線の区間推定が導出できる(その1)
    9. 回帰直線の区間推定が導出できる(その2)
    10. 繰返しのある単回帰分析がわかる
    11. 繰返しのある単回帰分析の分散分析がよくわかる
    12. 大波の相関、小波の相関、符号検定がよくわかる
    13. スピアマンの順位相関係数が導出できる
    14. スピアマンの順位相関係数の正負の入れ替えがわかる
    15. スピアマンの順位相関係数とピアソンの相関係数を比較する
    16. (必読)クラメールの連関係数が導出できる
    17. クラメールの連関係数の値が0、1の条件がわかる
    18. 単回帰分析のテコ比がよくわかる
    ★関連リンク★
    回帰分析と相関係数をマスターする

    【ポイント】

    回帰分析の基礎をマスターしよう!
    ★関連リンク★
    無相関の検定がわかる

    【ポイント】

    無相関の意味、検定統計量の導出を解説!
    ★関連リンク★
    【必読】回帰分析と相関係数は確実に点数化すべし【QC検定®2級対策】

    【ポイント】

    QC検定®2級で必ず出題される回帰分析と相関係数の解法を解説
    ★関連リンク★
    回帰分析と相関分析の演習問題【QC検定®2級対策】

    【ポイント】

    分散分析、回帰式、無相関の検定まで10分以内に解けるための流れとテクニックを解説!
    ★関連リンク★
    回帰母数の検定と推定がよくわかる【QC検定®2級対策】

    【ポイント】

    【QC検定®1級対策】必読記事です!回帰直線の傾きとy切片の検定と区間推定を解説!
    ★関連リンク★
    スピアマンの順位相関係数とピアソンの相関係数を比較する

    【ポイント】

    【QC検定®1級対策】必読記事です!実例をあげて計算して両者の違いが一致する条件をわかりやすく解説

    ③QCプラネッツがまとめた単回帰分析の冊子を紹介

  • ③QCプラネッツがまとめた単回帰分析の冊子を紹介
  • 以前、ブログ記事としていましたが、まとめて冊子にしました。
    どれも重要なテーマなので勉強しましょう!

    No タイトル
    1 【必読】相関係数や寄与率が1以上にできない理由がわかる
    2 (必読)クラメールの連関係数が導出できる
    3 クラメールの連関係数の値が0、1の条件がわかる
    4 スピアマンの順位相関係数が導出できる
    5 スピアマンの順位相関係数の正負の入れ替えがわかる
    6 回帰分析と実験計画法の違いがよくわかる
    (繰返しデータ無しの場合)
    7 繰返しのある単回帰分析の分散分析がよくわかる
    8 回帰直線の区間推定が導出できる
    9 大波の相関、小波の相関、符号検定がよくわかる
    10 繰返しのある単回帰分析がわかる
    11 単回帰分析のテコ比がよくわかる

    ●You tube動画もごらんください。

    しっかり勉強していきましょう!

    まとめ

    「【まとめ】単回帰分析がわかる」を解説しました。

    • ①単回帰分析の重要ポイント
    • ②QCプラネッツの単回帰分析の関連ブログを紹介
    • ③QCプラネッツがまとめた単回帰分析の冊子を紹介
  • 回帰母数の検定と推定がよくわかる

    回帰母数の検定と推定がよくわかる

    「回帰母数の検定と推定がわからない」など、疑問に思いませんか?

    こういう疑問に答えます。

    本記事のテーマ

    回帰母数の検定と推定がよくわかる

    おさえておきたいポイント

    • ①回帰母数の検定・推定に必要な公式
    • ➁回帰の検定が理解できる例題
    • ➂回帰直線の傾きについての検定と推定
    • ➃回帰直線の\(y\)切片についての検定と推定
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】回帰分析問題集を販売します!

    QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。
    【QC検定®合格】「回帰分析(単回帰分析・重回帰分析)」問題集を販売します! 内容は、①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用、の5章全41題を演習できる問題集です。

    ①回帰母数の検定・推定に必要な公式

    基本は、回帰直線の推定区間の導出から得られる公式を使って解いていきます。
    理論は関連記事で確認ください。

    回帰直線の区間推定が導出できる(その1)
    回帰直線の区間推定が暗記せず、公式が導出できますか?本記事では2回に分けて導出過程をわかりやすく解説します。公式暗記に頼らず式を理解することがとても大事です。回帰分析を勉強する人は必読です。

    回帰直線の区間推定が導出できる(その2)
    回帰直線の区間推定が暗記せず、公式が導出できますか?本記事では2回に分けて導出過程をわかりやすく解説します。公式暗記に頼らず式を理解することがとても大事です。回帰分析を勉強する人は必読です。

    傾き\(a\)について

    関連記事からは、傾き\(a\)の期待値E[\(a\)]と分散V[\(a\)]は以下の式です。

    ●E[\(a\)]= \(a\)
    ●V[\(a\)]= \(\frac{σ^2}{S_{xx}}\)

    なので、これが正規分布に従うとしたら、
    傾き\(a\)は、N[\(a\)、\(\frac{σ^2}{S_{xx}}\)]
    に従うと書けますね。

    標準化して、正規分布を使った検定統計量を式にすると

    \(u\)=\(\frac{a-a_0}{\sqrt{σ^2/S_{xx}}}\)
    は正規分布N(0,\(1^2\))に従います。

    ただし、実際は\(σ^2\)を推定しないといけないので、よくt分布の直して検定と推定を行いますね。個人的には、別に正規分布のままで検定と推定してもよいと思いますけど。

    \(σ^2\)→Veに直して、 残差の自由度\(n-2\)を使って、t分布に従う検定統計量を書き直します。

    ●検定統計量\(t\)=\(\frac{a-a_0}{\sqrt{Ve/S_{xx}}}\)
    は自由度\(n-2\)のt分布に従い、
    ●区間推定は \(a\)± \(t(n-2,α)\)\(\sqrt{\frac{Ve}{S_{xx}}}\)
    から計算します。

    \(y\)切片\(b\)について

    関連記事からは、傾きy切片\(b\)の期待値E[\(b\)]と分散V[\(b\)]は以下の式です。

    ●E[\(b\)]= \(b\)
    ●V[\(b\)]=\(σ^2(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})\)

    なので、これが正規分布に従うとしたら、
    傾き\(y\)切片\(b\)は、N[\(b\)、\(σ^2(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})\)]
    に従うと書けますね。

    標準化して、正規分布を使った検定統計量を式にすると

    \(u\)=\(\frac{b-b_0}{\sqrt{σ^2(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})}}\)
    は正規分布N(0,\(1^2\))に従います。

    ただし、実際は\(σ^2\)を推定しないといけないので、よくt分布の直して検定と推定を行いますね。個人的には、別に正規分布のままで検定と推定してもよいと思いますけど。

    \(σ^2\)→Veに直して、 残差の自由度\(n-2\)を使って、t分布に従う検定統計量を書き直します。

    ●検定統計量\(t\)=\(\frac{b-b_0}{\sqrt{Ve(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})}}\)
    は自由度\(n-2\)のt分布に従い、
    ●区間推定は \(b\)± \(t(n-2,α)\)\(\sqrt{Ve(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})}\)
    から計算します。

    OKですね。では、実例を使って計算してみましょう。

    ➁回帰の検定が理解できる例題

    例題をあげましょう。

    10個のデータがあったが、再実験して下表のデータが得られた。
    元のデータにおいては、
    ●傾き\(a_0\)=1.2
    ●\(y\)切片\(b_0\)=-8
    だった。
    (1) 傾き\(a\)において、元の傾きから変化したかどうかを検定せよ。
    (2) 傾き\(a\)における信頼率95%の信頼区間を計算せよ。
    (3) \(y\)切片\(b\)において、元の\(y\)切片から変化したかどうかを検定せよ。
    (4) \(y\)切片\(b\)における信頼率95%の信頼区間を計算せよ。
    No
    1 1.3 2.4
    2 3.4 4.5
    3 5.6 3.6
    4 7.5 6.7
    5 9.1 8.9
    6 11.2 6.6
    7 13.4 14.3
    8 13.7 24.5
    9 14.2 20.8
    10 16.2 30.5
    合計 95.6 122.8

    平方和 分散分析 S Φ V データ
    Sxx 226.50 R 659.52 1 659.52 傾き\(a\) 1.7
    Syy 866.28 e 206.76 8 25.84 \(y\)切片\(b\) -4.03
    Sxy 386.50 T 866.28 9 R 0.76

    回帰分析

    では解いてみましょう。

    ➂回帰直線の傾きについての検定と推定

    傾きについての検定

    検定統計量を使って計算します。

    ●検定統計量\(t\)=\(\frac{a-a_0}{\sqrt{Ve/S_{xx}}}\)

    ●\(t\)=\(\frac{1.70-1.2}{\sqrt{25.84/226.50}}\)
    =1.50 < \(t(10-2,0.05)\)=2.306
    より、傾きが変化したとはいえないという結果になります。

    傾きについての推定

    ●区間推定は \(a\)± \(t(n-2,α)\)\(\sqrt{\frac{Ve}{S_{xx}}}\)

    ●区間推定=1.70± 2.306×\(\sqrt{\frac{25.84}{226.50}}\)
    =0.93~2.49
    となります。

    基本をしっかりおさえていれば、あとは公式代入で解けます。もちろん、理論が一番大事ですよ!

    ➃回帰直線の\(y\)切片についての検定と推定

    ●検定統計量\(t\)=\(\frac{b-b_0}{\sqrt{Ve(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})}}\)

    ●\(t\)=\(\frac{-4.03-(-8)}{\sqrt{25.84(\frac{1}{10}+\frac{\bar{9.56^2}}{226.50})}}\)
    =1.10 < \(t(10-2,0.05)\)=2.306
    より、\(y\)切片が変化したとはいえないという結果になります。

    傾きについての推定

    ●区間推定は \(b\)± \(t(n-2,α)\)\(\sqrt{Ve(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})}\)

    ●区間推定=-4.03±2.306×\(\sqrt{25.84(\frac{1}{10}+\frac{\bar{9.56^2}}{226.50})}\)
    =-12.35~4.29
    となります。

    結構幅が広いことがわかりますね。

    難しい計算問題でしたが、ちゃんとできましたね!

    公式は導出できてから使いましょう。

    まとめ

    「回帰母数の検定と推定がよくわかる」を解説しました。

    • ①回帰母数の検定・推定に必要な公式
    • ➁回帰の検定が理解できる例題
    • ➂回帰直線の傾きについての検定と推定
    • ➃回帰直線の\(y\)切片についての検定と推定

  • スピアマンの順位相関係数とピアソンの相関係数を比較する

    スピアマンの順位相関係数とピアソンの相関係数を比較する

    「スピアマンの順位相関係数とピアソンの相関係数の違いがよくわからない」など、疑問に思いませんか?

    こういう疑問に答えます。

    本記事のテーマ

    スピアマンの順位相関係数とピアソンの相関係数を比較する

    おさえておきたいポイント

    • ➀スピアマンの順位相関係数とピアソンの相関係数を比較
    • ➁スピアマンの順位相関係数とピアソンの相関係数が一致する条件
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】回帰分析問題集を販売します!

    QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。
    【QC検定®合格】「回帰分析(単回帰分析・重回帰分析)」問題集を販売します! 内容は、①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用、の5章全41題を演習できる問題集です。

    スピアマンの順位相関係数については、特別に公式暗記する必要はありません。自分で導出できます。

    導出過程は関連記事で確認ください。

    スピアマンの順位相関係数が導出できる
    スピアマンの順位相関係数は導出できますか?本記事では、一般的に使うピアソンの相関係数からスピアマンの順位相関係数を導出します。公式暗記は不要で自力で導出できるので、マスターしましょう

    スピアマンの順位相関係数の正負の入れ替えがわかる
    スピアマンの順位相関係数では、変数の順位が降順・降順で入れ替わると相関係数の正負が入れ替わります。その理由をわかりやすく解説します。スピアマンの順位相関係数はピアソンの相関係数から計算できるので、スピアマンの順位相関係数のための公式暗記は一切不要です。

    ピアソンの相関係数と比較することで、スピアマンの順位相関係数の理解を深めましょう。大事な記事です!

    ➀スピアマンの順位相関係数とピアソンの相関係数を比較

    データを用意

    変数\(x,y\)からなる、変量データを用意します。下表のとおりです。

    No x y
    1 0.15 8.05
    2 1.2 4.05
    3 2.08 5.77
    4 2.42 11.2
    5 4.82 20.17
    6 5.93 17.21
    7 6.15 15.22
    8 6.5 18.38
    9 7.32 30.59
    10 8.45 8.99

    ピアソンの相関係数

    平方和\(S_{xx}\),\(S_{yy}\),\(S_{xy}\)を計算します。
    ●\(S_{xx}\)=\(\sum_{i=1}^{n}(x_i -\bar{x})^2\)
    ●\(S_{yy}\)=\(\sum_{i=1}^{n}(y_i -\bar{y})^2\)
    ●\(S_{xy}\)=\(\sum_{i=1}^{n}(x_i -\bar{x})(y_i-\bar{y})\)
    表を追加します。

    No x y \((x-\bar{x})^2\) \((y-\bar{y})^2\) \((x-\bar{x})(y-\bar{y})\)
    1 0.15 8.05 18.94 34.96 25.73
    2 1.2 4.05 10.9 98.27 32.73
    3 2.08 5.77 5.87 67.13 19.84
    4 2.42 11.2 4.33 7.63 5.75
    5 4.82 20.17 0.1 38.53 1.97
    6 5.93 17.21 2.04 10.54 4.64
    7 6.15 15.22 2.72 1.58 2.07
    8 6.5 18.38 3.99 19.51 8.83
    9 7.32 30.59 7.94 276.46 46.85
    10 8.45 8.99 15.59 24.73 -19.63
    合計 45.02 139.63 72.42 579.34 128.79
    平均 4.502 13.963 ↑(\(S_{xx}\)) ↑(\(S_{yy}\)) ↑(\(S_{xy}\))

    よって、ピアソンの相関係数\(r\)は、

    ピアソンの相関係数\(r\)
    \(r\)=\(\frac{S_{xy}}{\sqrt{S_{xx} S_{yy}}}\)
    =\(\frac{128.79}{\sqrt{72.42×579.34}}\)
    =0.629

    これは、簡単ですね。

    スピアマンの順位相関係数

    変数\(x,y\)の順位をつけましょう。下表のとおりに変化しますね。

    実測データ 順位
    No x y x y
    1 0.15 8.05 1 3
    2 1.2 4.05 2 1
    3 2.08 5.77 3 2
    4 2.42 11.2 4 5
    5 4.82 20.17 5 9
    6 5.93 17.21 6 7
    7 6.15 15.22 7 6
    8 6.5 18.38 8 8
    9 7.32 30.59 9 10
    10 8.45 8.99 10 4

    スピアマンの順位相関係数\(r’\)を計算します。

    関連記事から、導出式を使います。

    スピアマンの順位相関係数が導出できる
    スピアマンの順位相関係数は導出できますか?本記事では、一般的に使うピアソンの相関係数からスピアマンの順位相関係数を導出します。公式暗記は不要で自力で導出できるので、マスターしましょう

    ●スピアマンの順位相関係数
    \(r\)=1-\(\frac{6\sum_{i=1}^{n}d_i^2}{n(n^2-1)}\)
    ここで、\(d_i\)=\(x_i -y_i\)

    計算に必要なデータは下表にあります。

    No x y d=x-y d2
    1 1 3 -2 4
    2 2 1 1 1
    3 3 2 1 1
    4 4 5 -1 1
    5 5 9 -4 16
    6 6 7 -1 1
    7 7 6 1 1
    8 8 8 0 0
    9 9 10 -1 1
    10 10 4 6 36
    合計 62
    ●スピアマンの順位相関係数
    \(r\)=1-\(\frac{6\sum_{i=1}^{n}d_i^2}{n(n^2-1)}\)
    =1-\(\frac{6×62}{10(10^2-1)}\)
    =0.624

    スピアマンの順位相関係数とピアソンの相関係数を比較

    図を比較します。

    スピアマンの順位相関係数

    ●ピアソンの相関係数\(r\)=0.629
    ●スピアマンの順位相関係数=0.624
    とスピアマンの順位相関係数の方が若干小さくなりました。
    データ値によって、
    ピアソンの相関係数とスピアマンの順位相関係数の
    大小関係の入れ替えはあります。

    ➁スピアマンの順位相関係数とピアソンの相関係数が一致する条件

    では、次の疑問が沸きますよね!

    スピアマンの順位相関係数とピアソンの相関係数が一致する条件って何?
    どんなデータを用意すればいいのか?

    一致するデータを用意

    結論からいいますと、

    スピアマンの順位相関係数とピアソンの相関係数が一致する条件は、
    各データから求まるR=\(\frac{S_{xy}^2}{S_{xx}S_{yy}}\)
    が一致する場合

    そりゃそうでしょう!というオチですが、
    スピアマンの順位相関係数とピアソンの相関係数の計算式は実は同じで、
    変数データを順位データに変換しても、寄与率Rの値が変化しなければOKです。

    スピアマンの順位相関係数とピアソンの相関係数が一致する例

    いろいろ例がありますが、

    1. ピアソンの相関係数とスピアマンの順位相関係数で扱うデータ値が完全に一致する場合
    2. ピアソンの相関係数側のデータが回帰直線に完全に乗る場合(つまり相関係数=1の場合)
    3. など(他の例も見つけてみてください)

    例えば、ピアソンの相関係数側のデータが回帰直線に完全に乗る場合(つまり相関係数=1の場合)ですが、実測データが完全に回帰直線に乗る場合(例としてy=3x-1)を下表に示します。

    No x y x順位 y順位
    1 0.15 -0.55 1 1
    2 1.2 2.6 2 2
    3 2.08 5.24 3 3
    4 2.42 6.26 4 4
    5 4.82 13.46 5 5
    6 5.93 16.79 6 6
    7 6.15 17.45 7 7
    8 6.5 18.5 8 8
    9 7.32 20.96 9 9
    10 8.45 24.35 10 10
    10 8.45 24.35 10 10

    グラフに描くと、確かに両者の相関係数は一致しています。

    スピアマンの順位相関係数

    などなど、いろいろ例がありますので、調べてみましょう。

    大事なのは、ピアソンの相関係数の式からスピアマンの順位相関係数の性質が導出できます!スピアマンの順位相関係数のための公式暗記は一切不要!導出過程を理解しましょう!

    まとめ

    「スピアマンの順位相関係数とピアソンの相関係数を比較する」を解説しました。

    • ➀スピアマンの順位相関係数とピアソンの相関係数を比較
    • ➁スピアマンの順位相関係数とピアソンの相関係数が一致する条件

  • error: Content is protected !!