マハラビノス距離が計算できる
「マハラビノス距離が計算できない、何で傾いた楕円形で考えるの?」などと困っていませんか?
こういう疑問に答えます。
本記事のテーマ
おさえておきたいポイント
- ①(復習)マハラビノス距離とは
- ➁傾いた楕円形でマハラビノス距離を表現する理由
- ➂マハラビノス距離を計算する
Excelや公式は暗記不要!
自力で導出できるぜ!
①(復習)マハラビノス距離とは
- マハラビノス距離とは何か?
- マハラビノス距離はなぜ主成分分析から考えるのか?
- マハラビノス距離の導出方法
がわからない人は、関連記事で解説していますので、ご確認ください。
マハラビノス距離が導出できる マハラビノス距離が導出できますか? 本記事では、マハラビノス距離を主成分分析から導出し、距離の式をわかりやすくを解説します。公式暗記せず、導出過程をきちんと理解しましょう。多変量解析を学ぶ人は必読です。 |
➁傾いた楕円形でマハラビノス距離を表現する理由
傾いた楕円形の方程式
よく、マハラビノス距離は傾いた楕円形で表現されますが、その理由を解説しますね。
まず、高校数学にも出て来る、傾いていない楕円の方程式は、
●\(\frac{x^2}{a^2}+\frac{y^2}{b^2}\)=1
ですね。
この楕円上の点(\(x,y\))を原点中心に角度θ回転させた
座標を(\(X,Y\))とします。
ここで、
複素数平面!
ド・モアブルの定理から、
●\(X+Yi\)=\((x+yi)(cosθ+isinθ)\)
が成り立つので、実部、虚部に分けると
●\(X\)=\(xcosθ-ysinθ\)
●\(Y\)=\(xsinθ+ycosθ\)
となるので、
(\(x,y\))を(\(X,Y\))で表現すると
●\(x\)=\(Xcosθ+Ysinθ\)
●\(y\)=\(-Xsinθ+Ycosθ\)
となります。
先ほどの楕円の式に代入すると
●\(\frac{x^2}{a^2}+\frac{y^2}{b^2}\)=1
\(\frac{( Xcosθ+Ysinθ)^2}{a^2}+\frac{(-Xsinθ+Ycosθ)^2}{b^2}\)=1
\((\frac{cos^2θ}{a^2}+\frac{sin^2θ}{b^2})X^2\)+2\(sinθcosθ(\frac{1}{a^2}-\frac{1}{b^2})XY\)+\((\frac{sin^2θ}{a^2}+\frac{cos^2θ}{b^2})Y^2\)=1
となり、簡略して書くと
\(AX^2+2BXY+CY^2\)=1
で表現できる
傾いた楕円を図で描きます。
マハラビノス距離を展開する
マハラビノス距離(2次元)の場合、関連記事から
\(D_M^2\)=\((x_1 -\bar{x_1}, x_2 -\bar{x_2})\)\(\left(\begin{array}{cccc}
S_{11} & S_{12} \\
S_{21} & S_{22}
\end{array}
\right)^{-1}
\)\(\left(
\begin{array}{c}
x_1 -\bar{x_1}\\
x_2 -\bar{x_2}
\end{array}
\right)
\)
と書けます。
簡略化のため
●\( x-\bar{x}\)=\(X\)
●\(y-\bar{y}\)=\(Y\)
●\(\left(\begin{array}{cccc}
S_{11} & S_{12} \\
S_{12} & S_{22}
\end{array}
\right)^{-1}
\)=\(\left(\begin{array}{cccc}
T_{11} & T_{12} \\
T_{21} & T_{22}
\end{array}
\right)
\)
と書き直します。
書き直したマハラビノス距離は
\(D_M^2\)=\((X, Y)\)\(\left(\begin{array}{cccc}
T_{11} & T_{12} \\
T_{21} & T_{22}
\end{array}
\right)
\)\(\left(
\begin{array}{c}
X\\
Y
\end{array}
\right)
\)
となり、展開すると
\(D_M^2\)=\(T_{11} X^2\)+\(2T_{12} XY\)+\(T_{22} Y^2\)
となります。
マハラビノス距離は傾いた楕円の式と同じ
比較すると
●マハラビノス距離: \(T_{11} X^2\)+\(2T_{12} XY\)+\(T_{22} Y^2\)=\(D_M^2\)
と同じ式ですね。
また、楕円の式の(右辺)は1ですが、
マハラビノス距離はいろいろ変わるため、距離の値によって楕円の大きさが変化します。
マハラビノス距離は楕円で表現ではなく
数式を使って、楕円で表現する理由を理解しましょう。
➂マハラビノス距離を計算する
実際計算しましょう。理解を増すために、ユークリッド距離(\(x^2+y^2\))と比較します。
データ事例
N0 | x | y | A= \(x-\bar{x}\) |
B= \(y-\bar{y}\) |
A2 | B2 | AB |
1 | 4 | 8 | -2 | -4 | 4 | 16 | 8 |
2 | 6 | 10 | 0 | -2 | 0 | 4 | 0 |
3 | 2 | 12 | -4 | 0 | 16 | 0 | 0 |
4 | 10 | 16 | 4 | 4 | 16 | 16 | 16 |
5 | 5 | 10 | -1 | -2 | 1 | 4 | 2 |
6 | 8 | 12 | 2 | 0 | 4 | 0 | 0 |
7 | 7 | 16 | 1 | 4 | 1 | 16 | 4 |
合計 | 42 | 84 | – | 合計(平方和) | 42 | 56 | 30 |
平均 | 6 | 12 | – | (標本分散) | \(S_{11}\) =7 |
\(S_{12}\) =9.33 |
\(S_{22}\) =5 |
ここで、
●\(S_{ij}\)は標本分散=(平方和)/(n-1)である点に注意しましょう。
マハラビノス距離とユークリッド距離の比較
マハラノビス距離は、
\(T_{11} X^2\)+\(2T_{12} XY\)+\(T_{22} Y^2\)=\(D_M^2\)
の形をしています。実際に係数を計算すると
●\(\left(\begin{array}{cccc}
S_{11} & S_{12} \\
S_{21} & S_{22}
\end{array}
\right)^{-1}
\)=\(\left(\begin{array}{cccc}
7 & 5 \\
5 & 9.33
\end{array}
\right)^{-1}
\)
=\(\left(\begin{array}{cccc}
0.231 & -0.124 \\
-0.124 & 0.174
\end{array}
\right)
\)=\(\left(\begin{array}{cccc}
T_{11} & T_{12} \\
T_{21} & T_{22}
\end{array}
\right)
\)
となります。
つまり、マハラノビス距離は、
\(D_M^2\)=0.231\( X^2\)-0.248\( XY\)+0.174\( Y^2\)
で表現できます。
いろいろな点について、マハラノビス距離とユークリッド距離を計算した結果を下表で比較しましょう。
No | x | y | マハラビノス 距離 |
ユークリッド 距離 |
1 | 6 | 12 | 0 | 0 |
2 | 8 | 11.855 | 1.00 | 0.757 |
3 | 5 | 6.57 | 2.00 | 1.82 |
4 | 0 | 3 | 3.00 | 3.72 |
ここで、ユークリッド距離はx,y方向をそれぞれの標本分散で割った値として、表にいれました。
Y=\(\frac{X^2}{S_{11}}+\frac{Y^2}{S_{22}}\)
です。
標本分散で割った理由は、マハラビノス距離において、相関係数が0の場合、
●マハラビノス距離=●ユークリッド距離
とするためです。
結果を図にしましょう。
マハラノビス距離とユークリッド距離は若干値が異なるし、
マハラノビス距離は傾いた楕円分布になっていることがわかりますね。
データの平均からマハラノビス距離を取ると、ユークリッド距離と同様に距離は0です。当然ですよね。
なお、上表はマハラノビス距離が1,2,3となる1点を探しました。
マハラノビス距離Dmが
●\(D_M^2\)=0.231\( X^2\)-0.248\( XY\)+0.174\( Y^2\)=0
●\(D_M^2\)=0.231\( X^2\)-0.248\( XY\)+0.174\( Y^2\)=1
●\(D_M^2\)=0.231\( X^2\)-0.248\( XY\)+0.174\( Y^2\)=2
●\(D_M^2\)=0.231\( X^2\)-0.248\( XY\)+0.174\( Y^2\)=3
とそれぞれ満たす点の集合を線で引くと、傾いた楕円形になります。
一方ユークリッド距離は、
●Y=\(\frac{X^2}{S_{11}}+\frac{Y^2}{S_{22}}\)=0
●Y=\(\frac{X^2}{S_{11}}+\frac{Y^2}{S_{22}}\)=1
●Y=\(\frac{X^2}{S_{11}}+\frac{Y^2}{S_{22}}\)=2
●Y=\(\frac{X^2}{S_{11}}+\frac{Y^2}{S_{22}}\)=3
とそれぞれ満たす点の集合を線で引くと、円になりますね。
まとめ
「マハラビノス距離が計算できる」を解説しました。
- ①(復習)マハラビノス距離とは
- ➁傾いた楕円形でマハラビノス距離を表現する理由
- ➂マハラビノス距離を計算する
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119