重回帰分析のダミー変数の使い方がよくわかる
「ダミー変数の入れ方・値によって重回帰分析の結果にどう影響が出るか心配!」と困っていませんか?
こういう疑問に答えます。
本記事のテーマ
おさえておきたいポイント
- ①ダミー変数とは
- ➁説明変数を変換すると重回帰分析がどう変化するかを理解する
- ➂ダミー変数の入れ方と重回帰分析の変化を理解する
●ダミー変数の回帰直線の傾きの値は変化し、
●回帰直線y切片の値も変化するが、
●他の説明変数の回帰直線の傾きの値は変化しないし、
●平方和(総平方和、回帰平方和、残差平方和)は変化しない
ことを本記事で解説します!
ルールが確定していたら、値は何でもいいけど
回帰直線、平方和、分散分析にどう影響するかを
理解しよう!
では、解説します。
①ダミー変数とは
ダミー変数とは
重回帰分析では、0か1のどちらかの値を取る変数などの「計数値」を変数として使う場合があります。この計数値のことをダミー変数と呼びます。
ダミー変数の入れ方は3パターンある
ダミー変数の入れ方はいろいろなニーズがあります。例えば、
●0と1とか
●0と2とか
●1と2とか
●5と10とか
●-1と1とか
の2値データとか、
たくさんパターンが出ますよね!
●0,1,2,3,…と1ずつ増やしていく多値データとか
いろいろあります。
2値データの応用が多値データなので、2値データで考えましょう。
再掲すると
●0と1とか
●0と2とか
●1と2とか
●5と10とか
●-1と1とか
の2値データとか、
は数式で書くと、3つのパターンに分ける事ができます。
- 0,1が基本パターンで定数倍したもの(x⇒ax)
- 0,1が基本パターンで定数値を加減したもの(x⇒x+a)
- 0,1が基本パターンで定数倍と定数値の加減を組み合わせたもの(x⇒ax+b)
3つに分けてもイマイチ理解できませんよね!
なので、実際に解いてみると下表になります。
パターン | 0,1との比較 | 数式 |
0,2のパターン | 0,1に対して2倍 | 2x |
1,2のパターン | 0,1に対して1加算 | x+1 |
5,10のパターン | 0,1に対して5倍して5加算 | 5(x+1) |
-1,1のパターン | 0,1に対して2倍して1引く | 2x-1 |
いろいろな2値データのパターンがありますが、数式で書くと3つしかないことがわかりますよね。
- x
- ax (a:定数)
- ax+b(a,b:定数)
●0,1のパターン
●0,1に定数倍したパタン
●0,1に定数倍と定数値を加減したパターン
の3つの違いを理解すればOK
ですね。
➁説明変数を変換すると重回帰分析がどう変化するかを理解する
結論は、
●\(x_1’\)の回帰直線の傾き\(β_1’\)が\(\frac{1}{a}β_1\)に変化する。
●\(x_2\)の回帰直線の傾きは変わらない。
●総平方和\(S_T\)、回帰平方和\(S_R\)、残差平方和\(S_e\)は変わらない。
となります。
詳細は、関連記事で解説しています。ご確認ください。
重回帰分析は単位に影響されない理由がわかる 重回帰分析で説明変数の単位を変更すると何が変化するか、しないかは説明できますか? 本記事では、数式で丁寧に導出して説明変数の単位の変化による重回帰分析の影響を解説します。多変量解析を学ぶ人は必読です。 |
●\(x_1’\)の回帰直線の傾き\(β_1’\)が\(\frac{1}{a}β_1\)に変化する。
●\(x_2\)の回帰直線の傾きは変わらない。
●\(x_1’\)の回帰直線のy切片\(β_0’\)が\(β_0-\frac{b}{a}β_0\)に変化する。
●総平方和、回帰平方和、残差平方和は変わらない。
となっていますね。
詳細は、関連記事で解説しています。ご確認ください。
重回帰分析は単位に影響されない理由がわかる(その2) 重回帰分析で説明変数の単位を変更すると何が変化するか、しないかは説明できますか?本記事では、数式で丁寧に導出して説明変数の単位の変化による重回帰分析の影響を解説します。(その1)はx’=axの場合、今回(その2)はx’=ax+bの場合について解説します。ダミー変数導入に必要な記事なので、多変量解析を学ぶ人は必読です。 |
まとめると、
●\(x_1’\)の回帰直線の傾き\(β_1’\)が\(\frac{1}{a}β_1\)に変化する。
●\(x_2\)の回帰直線の傾きは変わらない。
●\(x_1’\)の回帰直線のy切片\(β_0’\)が\(β_0-\frac{b}{a}β_0\)に変化する。
●総平方和、回帰平方和、残差平方和は変わらない。
となっていますね。
ダミー変数の入れ方によって回帰直線のダミー変数が関わる所は変化するが、それ以外は変わらないと理解しておきましょう。
回帰直線の傾き、y切片が変化する理由や
平方和は不変である理由を関連記事で解説しています。
数式を使った証明は関連記事で確認ください。
本記事は具体的な解説例で確認していきます。
本当かどうか、実例を挙げて確認します。
➂ダミー変数の入れ方と重回帰分析の変化を理解する
データを用意
以下のデータを用意します。
x1 | x2 | y |
?? | 3 | 3 |
?? | 2 | 4 |
?? | 4 | 4 |
?? | 4 | 7 |
?? | 5 | 7 |
?? | 6 | 5 |
\(x_1\)の「??」にダミー変数をいれて、2つの説明変数からなる重回帰分析をやってみましょう。
ダミー変数を代入
次の3種類のダミー変数を用意します。
(i-1)x | (i-2)5x | (i-3)2x-1 |
0 | 0 | -1 |
0 | 0 | -1 |
0 | 0 | -1 |
1 | 5 | 1 |
1 | 5 | 1 |
1 | 5 | 1 |
データ表をまとめます。
(i-1)x | (i-2)5x | (i-3)2x-1 | x2 | y |
0 | 0 | -1 | 3 | 3 |
0 | 0 | -1 | 2 | 4 |
0 | 0 | -1 | 4 | 4 |
1 | 5 | 1 | 4 | 7 |
1 | 5 | 1 | 5 | 7 |
1 | 5 | 1 | 6 | 5 |
では、解析しましょう。
重回帰分析の実施結果
回帰直線\(y=β_0+β_1 x_1+β_2 x_2\)と平方和の解析結果を比較しましょう。
黄色マーカが変化したところです。
– | – | (i-1)x | (i-2)5x | (i-3)2x-1 |
回帰直線 | (y切片)\(β_0\) | 5.167 | 5.167 | 7 |
回帰直線 | (x1傾き)\(β_1\) | 3.677 | 0.733 | 1.833 |
回帰直線 | (x2傾き)\(β_2\) | -0.5 | -0.5 | -0.5 |
平方和 | \(S_R\) | 10.667 | 10.667 | 10.667 |
平方和 | \(S_e\) | 3.333 | 3.333 | 3.333 |
平方和 | \(S_T\) | 14 | 14 | 14 |
確かに、
●\(x_1’\)の回帰直線の傾き\(β_1’\)が\(\frac{1}{a}β_1\)に変化する。
●\(x_2\)の回帰直線の傾きは変わらない。
●総平方和\(S_T\)、回帰平方和\(S_R\)、残差平方和\(S_e\)は変わらない。
となります。
●\(x_1’\)の回帰直線の傾き\(β_1’\)が\(\frac{1}{a}β_1\)に変化する。
●\(x_2\)の回帰直線の傾きは変わらない。
●\(x_1’\)の回帰直線のy切片\(β_0’\)が\(β_0-\frac{b}{a}β_0\)に変化する。
●総平方和、回帰平方和、残差平方和は変わらない。
となっていますね。
となっていますね。
●ダミー変数の回帰直線の傾きの値は変化し、
●回帰直線y切片の値も変化するが、
●他の説明変数の回帰直線の傾きの値は変化しないし、
●平方和(総平方和、回帰平方和、残差平方和)は変化しない
ことがわかりましたね!
理由が気になったら関連記事で確認しましょう。数式で理由をわかりやすく解説しています。
まとめ
「重回帰分析のダミー変数の使い方がよくわかる」を解説しました。
- ①ダミー変数とは
- ➁説明変数を変換すると重回帰分析がどう変化するかを理解する
- ➂ダミー変数の入れ方と重回帰分析の変化を理解する
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119