数量化2類ができる(その2)
「数量化2類がわからない」などと困っていませんか?
こういう疑問に答えます。
本記事のテーマ
おさえておきたいポイント
- ①数量化2類は判別分析である(その1)
- ➁データ事例(その1)
- ➂線形判別関数で数量化2類(判別分析) (その1)
- ➃マハラビノス距離で数量化2類(判別分析)(その2)
- ➄線形判別関数とマハラビノス距離の分析結果を比較(その2)
ならば、判別分析でいいじゃん!
本当にそうです
くらいで、手法名変えるな!
判別分析や数量化Ⅱ類とかあると
かえって混乱する!
ただの判別分析ですよ。
①➁➂数量化Ⅱ類を線形判別関数で分析する
数量化Ⅱ類は2つの記事でまとめています。
前編に、「数量化2類ができる(その1)」で解説しています。
先に確認ください。
数量化2類ができる(その1) 数量化2類が分析できますか?数量化2類は判別分析と同じです。本記事は線形判別関数を使った数量化2類の解析をわかりやすく解説します。多変量解析を学ぶ人は必読です。 |
➃マハラビノス距離で数量化2類(判別分析)
データ事例
関連記事と同じデータを用意します。
群 | No | \(x_1\) | \(x_2\) | 平均\(\bar{x_1}\) | 平均\(\bar{x_2}\) |
1 | 1 | 1 | 1 | 1.333 | 1.333 |
2 | 2 | 1 | |||
3 | 1 | 2 | |||
2 | 4 | 2 | 1 | 1.5 | 1.25 |
5 | 1 | 1 | |||
6 | 2 | 1 | |||
7 | 1 | 2 | |||
合計 | 10 | 9 | 全平均 | 1.429 | 1.286 |
グラフは下図のとおりです。
マハラビノス距離の求め方(復習)
マハラビノス距離については関連記事で導出方法や具体的な算出事例を紹介しています。ご確認ください。
マハラビノス距離が導出できる マハラビノス距離が導出できますか? 本記事では、マハラビノス距離を主成分分析から導出し、距離の式をわかりやすくを解説します。公式暗記せず、導出過程をきちんと理解しましょう。多変量解析を学ぶ人は必読です。 |
マハラビノス距離が計算できる マハラノビス距離は計算できますか?本記事では、データ事例をもとに、マハラノビス距離を計算し、ユークリッド距離との比較やマハラノビス距離の楕円分布がわかるように丁寧に解説しています。多変量解析を学ぶ人は必読です。 |
マハラビノス距離を計算
マハラビノス距離(2次元)の場合、関連記事から
\(D_M^2\)=\((x_1 -\bar{x_1}, x_2 -\bar{x_2})\)\(\left(\begin{array}{cccc}
S_{11} & S_{12} \\
S_{21} & S_{22}
\end{array}
\right)^{-1}
\)\(\left(
\begin{array}{c}
x_1 -\bar{x_1}\\
x_2 -\bar{x_2}
\end{array}
\right)
\)
と書けます。
実際は
●\(S_{11}\)⇒\(σ_x^2\)
●\(S_{22}\)⇒\(σ_y^2\)
●\(S_{12}\)⇒\(σ_{xy}^2\)
から計算します。
必要な数値をデータ表から計算すると、下表にまとめられます。
値 | 1群 | 2群 |
\(σ_x^2\) | 0.333 | 0.333 |
\(σ_y^2\) | 0.333 | 0.25 |
\(σ_{xy}^2\) | -0.167 | -0.167 |
\(\bar{x}\) | 1.333 | 1.5 |
\(\bar{y}\) | 1.333 | 1.25 |
a | 4 | 4.5 |
b | 4 | 6 |
c | 4 | 6 |
ここで、マハラビノス距離を展開すると楕円の方程式になるので、
\(a(x-\bar{x})^2+b(x-\bar{x})(y-\bar{y})+c(y-\bar{y})^2\)=\(D\)
の係数\(a,b,c\)を上表に載せています。計算して確認ください。
なお(右辺)の\(D\)は距離です。
マハラビノス距離から分析
マハラビノス距離を計算すると、
●1群: \(4(x-1.333)^2\)+\(4(x-1.333)(y-1.333)\)+\(4(y-1.333)^2\)=\(D\)
●2群: \(4.5(x-1.5)^2\)+\(6(x-1.5)(y-1.25)\)+\(6(y-1.25)^2\)=\(D\)
となります。
グラフ表示
楕円を図示します。
1群、2群の違いがあるのかが、ちょっとわかりにくいですね。
➄線形判別関数とマハラビノス距離の分析結果を比較
関連記事で求めた線形判別関数とマハラビノス距離の結果を1つのグラフに表示します。
どうでしょうか?
線形判別関数で作った直線の方がデータを2つにわけることがはっきりわかりますね。
このようにして、数量化Ⅱ類を分析しますが、
説明変数が質的か量的かが、違うだけで
本質は同じです。
まとめ
「数量化2類ができる(その2)」を解説しました。
- ①数量化2類は判別分析である(その1)
- ➁データ事例(その1)
- ➂線形判別関数で数量化2類(判別分析) (その1)
- ➃マハラビノス距離で数量化2類(判別分析)(その2)
- ➄線形判別関数とマハラビノス距離の分析結果を比較(その2)
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119