マハラビノス距離から判別できる
「マハラビノス距離からデータをどうやって判別するかがわからない」などと困っていませんか?
こういう疑問に答えます。
本記事のテーマ
おさえておきたいポイント
- ①データ事例
- ➁各群のマハラノビス距離を算出
- ➂各点がどちらの群に属するか?
Excelや公式は暗記不要!
自力で導出できるぜ!
①データ事例
マハラノビス距離について
マハラノビス距離については、関連記事で解説していますので、先に確認してください。本記事では、マハラノビス距離の導出や具体的な計算ができる前提で話を進めていきます。
マハラノビス距離の導出
マハラビノス距離が導出できる マハラビノス距離が導出できますか? 本記事では、マハラビノス距離を主成分分析から導出し、距離の式をわかりやすくを解説します。公式暗記せず、導出過程をきちんと理解しましょう。多変量解析を学ぶ人は必読です。 |
マハラノビス距離の計算
マハラビノス距離が計算できる マハラノビス距離は計算できますか?本記事では、データ事例をもとに、マハラノビス距離を計算し、ユークリッド距離との比較やマハラノビス距離の楕円分布がわかるように丁寧に解説しています。多変量解析を学ぶ人は必読です。 |
データ事例
下表のように、2つの群に分かれている7個のデータを用意します。
群 | No | \(x_1\) | \(x_2\) | 平均\(\bar{x_1}\) | 平均\(\bar{x_2}\) |
1 | 1 | 4 | 8 | 4 | 10 |
2 | 6 | 10 | |||
3 | 2 | 12 | |||
2 | 4 | 10 | 16 | 7.5 | 13.5 |
5 | 5 | 10 | |||
6 | 8 | 12 | |||
7 | 7 | 16 | |||
合計 | 42 | 84 | 全平均 | 6 | 12 |
グラフは下図のとおりです。
標本分散を計算
マハラビノス距離の計算に必要な標本分散を計算します。結果は下表のとおりです。
群 | N0 | \(x_1\) | \(x_2\) | 標本平均 \(S_{11}\) |
標本平均 \(S_{22}\) |
標本平均 \(S_{12}\) |
1 | 1 | 4 | 8 | 4 | 4 | -2 |
2 | 6 | 10 | ||||
3 | 2 | 12 | ||||
2 | 4 | 10 | 16 | 4.33 | 9 | 4.33 |
5 | 5 | 10 | ||||
6 | 8 | 12 | ||||
7 | 7 | 16 |
➁各群のマハラノビス距離を算出
マハラビノス距離を相関係数で表現
関連記事「マハラビノス距離が計算できる」では、2次元のマハラノビス距離を
S_{11} & S_{12} \\
S_{12} & S_{22}
\end{array}
\right)^{-1}
\)\(\left(
\begin{array}{c}
X_1\\
X_2
\end{array}
\right)
\)
と表現できますね。
上の式を使って、マハラビノス距離を計算します。
各群のマハラノビス距離を計算
1群のマハラノビス距離
1群では、
\(D_M^2\)=\((X_1, X_2)\)\(\left(\begin{array}{cccc}
S_{11} & S_{12} \\
S_{12} & S_{22}
\end{array}
\right)^{-1}
\)\(\left(
\begin{array}{c}
X_1\\
X_2
\end{array}
\right)
\)
=\((X_1, X_2)\)\(\left(\begin{array}{cccc}
4 & -2 \\
-2 & 4
\end{array}
\right)^{-1}
\)\(\left(
\begin{array}{c}
X_1\\
X_2
\end{array}
\right)
\)
=\((x_1-\bar{x_1}, x_2-\bar{x_2})\)\(\left(\begin{array}{cccc}
0.333 & 0.167 \\
0.167 & 0.333
\end{array}
\right)
\)\(\left(
\begin{array}{c}
x_1-\bar{x_1}\\
x_2-\bar{x_2}
\end{array}
\right)
\)
より、結果をまとめると
\(D_M^2\)=\(\frac{1}{3}(x_1-4)^2\)+\(\frac{1}{3}(x_1-4) (x_2-10)\)+ \(\frac{1}{3}(x_2-10)^2\)
となります。
2群のマハラノビス距離
次に、2群では、
\(D_M^2\)=\((X_1, X_2)\)\(\left(\begin{array}{cccc}
S_{11} & S_{12} \\
S_{12} & S_{22}
\end{array}
\right)^{-1}
\)\(\left(
\begin{array}{c}
X_1\\
X_2
\end{array}
\right)
\)
=\((X_1, X_2)\)\(\left(\begin{array}{cccc}
4.33 & 4.33 \\
4.33 & 9
\end{array}
\right)^{-1}
\)\(\left(
\begin{array}{c}
X_1\\
X_2
\end{array}
\right)
\)
=\((x_1-\bar{x_1}, x_2-\bar{x_2})\)\(\left(\begin{array}{cccc}
0.445 & -0.214 \\
-0.214 & 0.214
\end{array}
\right)
\)\(\left(
\begin{array}{c}
x_1-\bar{x_1}\\
x_2-\bar{x_2}
\end{array}
\right)
\)
より、結果をまとめると
\(D_M^2\)=0.445\((x_1-7.5)^2\)-0.214\((x_1-7.5) (x_2-13.5)\)+ 0.214\((x_2-13.5)^2\)
となります。
結果をまとめると、
●1群:\(D_M^2\)=\(\frac{1}{3}(x_1-4)^2\)+\(\frac{1}{3}(x_1-4) (x_2-10)\)+ \(\frac{1}{3}(x_2-10)^2\)
●2群:\(D_M^2\)=0.445\((x_1-7.5)^2\)-0.214\((x_1-7.5) (x_2-13.5)\)+ 0.214\((x_2-13.5)^2\)
となります。
マハラノビス距離が短い群に属することを確認しましょう。
マハラビノス距離を図示
その前に、マハラノビス距離を図示しましょう。傾いた楕円形になりますね。グラフに描く式は、
●1群:\(\frac{1}{3}(x_1-4)^2\)+\(\frac{1}{3}(x_1-4) (x_2-10)\)+ \(\frac{1}{3}(x_2-10)^2\)=\(D_M^2\)
●2群:0.445\((x_1-7.5)^2\)-0.214\((x_1-7.5) (x_2-13.5)\)+ 0.214\((x_2-13.5)^2\)=\(D_M^2\)
として、\(D_M^2\)=\(1^2\),\(2^2\)について図示します。
上図の等高線を見ると、
●マハラノビス距離がどの程度あるか、
●どちらの群に属しているか、
がはっきりしますね。
➂各点がどちらの群に属するか?
3点を例に、マハラビノス距離から判別
下図のように3つの赤い点(座標)を用意して、1群、2群どちらに属するかをみましょう。
- (\(x_1,x_2\))=(3,13)
- (\(x_1,x_2\))=(9,12)
- (\(x_1,x_2\))=(5,12)
では、実際に計算すると下表のような結果になります。
データ | 座標 | DM1 | DM2 | 属する群 |
① | (3,13) | 1.53 | 2.85 | 2群 |
➁ | (9,12) | 3.61 | 1.56 | 1群 |
➂ | (5,12) | 1.53 | 1.28 | 2群 |
①➁はあきらかにすぐわかりますが、
➂のような、7つのデータからみると
1群の3つの黒点に近い座標なので、1群に属しやすいかと思いきや、
マハラノビス距離から評価すると2群に属することが分かりました。
マハラビノス距離で判別するときの注意点
マハラノビス距離では、標準偏差で割ったり、相関関係を配慮した値になるので、座標から見て直観的に判別した結果と異なる場合があります。
その一方、線形判別関数は直線で引くので、座標からすぐ判別がつきますが、マハラノビス距離からの評価は座標を見ただけでは完璧に判別できない難しさがありますね。
まとめ
「マハラビノス距離から判別できる」を解説しました。
- ①データ事例
- ➁各群のマハラノビス距離を算出
- ➂各点がどちらの群に属するか?
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119