QCプラネッツ 品質のプロフェッショナルを育成するサイト

マハラビノス距離と相関係数の関係がわかる

多変量解析

「マハラビノス距離と相関係数の関係がどうなっているのか、わからない」などと困っていませんか?

こういう疑問に答えます。

本記事のテーマ

マハラビノス距離と相関係数の関係がわかる

おさえておきたいポイント

  • ①マハラビノス距離を相関係数で表現する
  • ➁マハラビノス距離とユークリッド距離の関係
  • ➂相関係数とマハラビノス距離の関係
マハラビノス距離を実際に計算してみよう
判別分析は自分で解けます!
Excelや公式は暗記不要!
自力で導出できるぜ!
2次元でしっかり導出過程を理解しましょう。

①マハラビノス距離を相関係数で表現する

マハラノビス距離について

マハラノビス距離については、関連記事で解説していますので、先に確認してください。本記事では、マハラノビス距離の導出や具体的な計算ができる前提で話を進めていきます。

マハラノビス距離の導出

マハラビノス距離が導出できる
マハラビノス距離が導出できますか? 本記事では、マハラビノス距離を主成分分析から導出し、距離の式をわかりやすくを解説します。公式暗記せず、導出過程をきちんと理解しましょう。多変量解析を学ぶ人は必読です。

マハラノビス距離の計算

マハラビノス距離が計算できる
マハラノビス距離は計算できますか?本記事では、データ事例をもとに、マハラノビス距離を計算し、ユークリッド距離との比較やマハラノビス距離の楕円分布がわかるように丁寧に解説しています。多変量解析を学ぶ人は必読です。

相関係数

相関係数は、定義通り、2変数\(x_1,x_2\)と平方和\(S\)を使うと

●相関係数\(r\)=\(\frac{S_{12}}{\sqrt{S_{11} S_{22}}}\)

で表現できますね。

マハラビノス距離を相関係数で表現

関連記事「」では、2次元のマハラノビス距離を

\(D_M^2\)=\((X_1, X_2)\)\(\left(\begin{array}{cccc}
S_{11} & S_{12} \\
S_{12} & S_{22}
\end{array}
\right)^{-1}
\)\(\left(
\begin{array}{c}
X_1\\
X_2
\end{array}
\right)
\)

と表現できますね。
行列表記を実際に展開しましょう。

\(D_M^2\)=\((X_1, X_2)\)\(\left(\begin{array}{cccc}
S_{11} & S_{12} \\
S_{12} & S_{22}
\end{array}
\right)^{-1}
\)\(\left(
\begin{array}{c}
X_1\\
X_2
\end{array}
\right)
\)
=\(\frac{1}{S_{xx} S_{yy}-S_{xy}^2}\)\(( X_1, X_2)\)\(\left(\begin{array}{cccc}
S_{22} & -S_{12} \\
-S_{12} & S_{11}
\end{array}
\right)^{-1}
\)\(\left(
\begin{array}{c}
X_1\\
X_2
\end{array}
\right)
\)
=\(\frac{1}{S_{11} S_{22}-S_{12}^2}\)(\(S_{22}X_1^2\)-\(2S_{12}X_1 X_2\)+\(S_{11}X_2^2\))
=(式1)

ここで、相関係数\(r\)を代入しましょう。
\(r\)=\(\frac{S_{12}}{\sqrt{S_{11} S_{22}}}\)から
\(r^2\)=\(\frac{S_{12}^2}{S_{11} S_{22}}\)
\(r^2 S_{11} S_{22}\)=\( S_{12}^2\)
として、マハラノビス距離に代入します。

(式1)
=\(\frac{1}{S_{11} S_{22} (1-r^2)} X_1^2\)-\(\frac{2r^2}{S_{12}(1-r^2)}X_1 X_2\)+\(\frac{1}{S_{11} S_{22} (1-r^2)} X_2^2\)
=(式2)

(式2)
=\(\frac{ X_1^2}{S_{11} (1-r^2)}\)-\(\frac{2r^2}{S_{12}(1-r^2)}X_1 X_2\)+\(\frac{ X_2^2}{S_{22} (1-r^2)}\)
=(式3)

よって

マハラノビス距離\(D_M^2\)は
\(D_M^2\)=\(\frac{ X_1^2}{S_{11} (1-r^2)}\)-\(\frac{2r^2}{S_{12}(1-r^2)}X_1 X_2\)+\(\frac{ X_2^2}{S_{22} (1-r^2)}\)
と表現できる

➁マハラビノス距離とユークリッド距離の関係

ユークリッド距離

ユークリッド距離って難しい書き方ですが、単純に、
距離\(D^2\)=\(X_1^2+X_2^2\)
です。

ただし、マハラノビス距離と比較するために、
ここでは、あえて標準化した距離をユークリッド距離として定義します。

つまり、各方向の長さの2乗を、その方向の標本分散で割ります。
距離\(D^2\)=\(\frac{ X_1^2}{S_{11}}\)+\(\frac{ X_2^2}{S_{22}}\)

マハラビノス距離とユークリッド距離が等しい相関係数は0

マハラビノス距離とユークリッド距離の式を比較しましょう。
●マハラビノス距離:\(D_M^2\)=\(\frac{ X_1^2}{S_{11} (1-r^2)}\)-\(\frac{2r^2}{S_{12}(1-r^2)}X_1 X_2\)+\(\frac{ X_2^2}{S_{22} (1-r^2)}\)
●ユークリッド距離:\(D^2\)=\(\frac{ X_1^2}{S_{11}}\)+\(\frac{ X_2^2}{S_{22}}\)

ここで、相関係数\(r\)=0をマハラビノス距離へ代入すると

●マハラビノス距離:\(D_M^2\)=\(\frac{ X_1^2}{S_{11} (1-0^2)}\)-\(\frac{2・0^2}{S_{12}(1-0^2)}X_1 X_2\)+\(\frac{ X_2^2}{S_{22} (1-0^2)}\)
=\(\frac{ X_1^2}{S_{11}}\)+\(\frac{ X_2^2}{S_{22}}\)
=\(D^2\)
と、

相関係数\(r\)=0のときは
マハラビノス距離とユークリッド距離が等しくなります。

つまり、

変数間が無相関と仮定した距離がユークリッド距離
ともいえますね。

➂相関係数とマハラビノス距離の関係

相関係数が0の場合

先ほど解説したとおり、

相関係数\(r\)=0のときは
マハラビノス距離とユークリッド距離が等しくなります。

相関係数が1に近づく場合

マハラビノス距離において、相関係数が1になると、

●マハラビノス距離:\(D_M^2\)=\(\frac{ X_1^2}{S_{11} (1-r^2)}\)-\(\frac{2r^2}{S_{12}(1-r^2)}X_1 X_2\)+\(\frac{ X_2^2}{S_{22} (1-r^2)}\)
の、
分母が0に近づくので、マハラビノス距離⇒無限大に発散します。

相関係数\(r\)=1のようなほぼ直線関係のデータでは
マハラビノス距離は精度が悪いといえます。

相関係数とマハラビノス距離の関係

実際に、いろいろな相関係数における、マハラビノス距離とユークリッド距離の関係を調べてみると、次の結果になりました。

マハラビノス距離

図における、数値はデータによって変わりますが、伝えたいことは、

相関係数\(r\)が0に近いと、
マハラビノス距離とユークリッド距離はほぼ等しいが
相関係数が増えると、マハラビノス距離がだんだん長くなり
相関係数が1に近づくと発散する

面白い性質ですね。

距離といっても
いろいろな距離が定義できます。
その定義した距離の特性をよく知った上で
活用しましょう。

まとめ

「マハラビノス距離が計算できる」を解説しました。

  • ①マハラビノス距離を相関係数で表現する
  • ➁マハラビノス距離とユークリッド距離の関係
  • ➂相関係数とマハラビノス距離の関係


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!