主成分分析が計算できる
「主成分負荷量、主成分得点、主成分平方和、主成分の寄与率とかいろいろあるけど、何かわからない」などと困っていませんか?
こういう疑問に答えます。
本記事のテーマ
おさえておきたいポイント
- ①例題
- ➁固有値、固有ベクトルの計算
- ➂主成分負荷量
- ➃主成分得点
- ➄主成分平方和
- ⑥主成分の寄与率
Excelや固有値、因子負荷量とか暗記不要!
自力で導出できるぜ!
①例題
主成分分析の本質
主成分分析はいろいろな値が計算できますが、本質をおさえることが最重要です。関連記事で解説していますので、まずは確認してください。
【重要】主成分分析が導出できる 主成分分析で自力で主成分方向が導出できますか?「主成分分析=固有値解」とインプットしていませんか? 本記事では主成分分析の本質が理解できるために導出過程をわかりやすく解説します。2次元の例で基礎をしっかり理解しましょう。多変量解析を学ぶ人は必読です。 |
例題
では、主成分負荷量、主成分得点、主成分平方和、主成分の寄与率を理解するための例題を用意します。
2次元の場合で主成分分析を考えます。下表を用意します。
No | x | y | \(A\)= \(x_i-\bar{x}\) |
\(B\)= \(y_i-\bar{y}\) |
\(A^2\) | \(B^2\) | \(AB\) |
1 | 4 | 3 | -1 | -1 | 1 | 1 | 1 |
2 | 3 | 4 | -2 | 0 | 4 | 0 | 0 |
3 | 6 | 5 | 1 | 1 | 1 | 1 | 1 |
4 | 5 | 3 | 0 | -1 | 0 | 1 | 0 |
5 | 7 | 5 | 2 | 1 | 4 | 1 | 2 |
合計 | 25 | 20 | 0 | 0 | 10 | 4 | 4 |
平均 | 5 | 4 | – | – | ↑\(S_{xx}\) | ↑\(S_{yy}\) | ↑\(S_{xy}\) |
➁固有値、固有ベクトルの計算
本記事のテーマではありませんが、主成分分析は必ず固有方程式を解きます。
固有方程式
\(\left(
\begin{array}{cccc}
S_{xx} & S_{xy} \\
S_{xy} & S_{yy}
\end{array}
\right)
\)\(\left(
\begin{array}{cccc}
a_j\\
b_j
\end{array}
\right)
\)=\(λ_j\)\(\left(
\begin{array}{cccc}
a_j \\
b_j
\end{array}
\right)
\)
固有値を計算
\(\begin{vmatrix}
S_{xx}-λ & S_{xy} \\
S_{xy} & S_{yy}-λ
\end{vmatrix}\)=\(\begin{vmatrix}
10-λ & 4 \\
4 & 4-λ
\end{vmatrix}\)
=\((10-λ)(4-λ)-16\)=0
=\((λ-12)(λ-2)\)=0
よって、固有値\(λ\)は
●\(λ\)=12,2
固有ベクトルを計算
●\(λ\)=12の場合
\(\left(
\begin{array}{cccc}
-2 & 4 \\
4 & -8
\end{array}
\right)
\)\(\left(
\begin{array}{cccc}
a_j\\
b_j
\end{array}
\right)
\)=12\(\left(
\begin{array}{cccc}
a_j \\
b_j
\end{array}
\right)
\)
より、
\(\left(
\begin{array}{cccc}
a \\
b
\end{array}
\right)
\)=\(\left(
\begin{array}{cccc}
\frac{2}{\sqrt{5}} \\
\frac{1}{\sqrt{5}}
\end{array}
\right)
\)
単位ベクトルになる点に注意して計算しました。
●\(λ\)=2の場合
\(\left(
\begin{array}{cccc}
8 & 4 \\
4 & 2
\end{array}
\right)
\)\(\left(
\begin{array}{cccc}
a_j\\
b_j
\end{array}
\right)
\)=2\(\left(
\begin{array}{cccc}
a_j \\
b_j
\end{array}
\right)
\)
より、
\(\left(
\begin{array}{cccc}
a \\
b
\end{array}
\right)
\)=\(\left(
\begin{array}{cccc}
-\frac{1}{\sqrt{5}} \\
\frac{2}{\sqrt{5}}
\end{array}
\right)
\)
単位ベクトルになる点に注意して計算しました。
➂主成分負荷量
主成分負荷量とは
主成分負荷量の計算
となると、固有方程式から固有値・固有ベクトルを計算したので、
実はすでに主成分負荷量は出ています!
下表にまとめましょう。
– | z_1 | z_2 |
固有値\(λ\) | 12 | 2 |
固有ベクトル | \(\left( \begin{array}{cccc} \frac{2}{\sqrt{5}} \\ \frac{1}{\sqrt{5}} \end{array} \right) \) |
\(\left( \begin{array}{cccc} -\frac{1}{\sqrt{5}} \\ \frac{2}{\sqrt{5}} \end{array} \right) \) |
主成分負荷量x | \(\frac{2}{\sqrt{5}} \) | \(-\frac{1}{\sqrt{5}}\) |
主成分負荷量y | \(\frac{1}{\sqrt{5}} \) | \(\frac{2}{\sqrt{5}} \) |
主成分負荷量が求まりました。
➃主成分得点
主成分得点とは
簡単に言えば、
まず、そもそも\(z_j\)は
\(z_j\)=\(a(x_i-\bar{x})+b(y_i -\bar{y})\)
で係数\(a,b\)がさっきの主成分負荷量でした。
固有値が2つあるので、\(z_j\)も2つあります。
●\(z_1\)=\(\frac{2}{\sqrt{5}} (x_i -5)\)+ \(\frac{1}{\sqrt{5}} (y_i -4)\)
=\(\frac{1}{\sqrt{5}}(2x_i + y_i -14)\)
●\(z_2\)=\(\frac{-1}{\sqrt{5}} (x_i -5)\)+ \(\frac{2}{\sqrt{5}} (y_i -4)\)
=\(\frac{1}{\sqrt{5}}(-x_i + 2y_i -3)\)
主成分得点の計算
上の\(z_1\),\(z_2\)を計算します。計算結果は下表になり、各\(x,y\)に対する\(z_1\),\(z_2\)が主成分得点となります。
No | x | y | \(z_{1i}\)= \(\frac{2x_i + y_i -14}{\sqrt{5}}\) |
\(z_{2i}\)= \(\frac{-x_i + 2y_i -3}{\sqrt{5}}\) |
1 | 4 | 3 | -\(\frac{3}{\sqrt{5}}\) | -\(\frac{1}{\sqrt{5}}\) |
2 | 3 | 4 | -\(\frac{4}{\sqrt{5}}\) | \(\frac{2}{\sqrt{5}}\) |
3 | 6 | 5 | \(\frac{3}{\sqrt{5}}\) | \(\frac{1}{\sqrt{5}}\) |
4 | 5 | 3 | -\(\frac{1}{\sqrt{5}}\) | -\(\frac{2}{\sqrt{5}}\) |
5 | 7 | 5 | \(\frac{5}{\sqrt{5}}\) | \(\frac{0}{\sqrt{5}}\) |
➄主成分平方和
主成分平方和とは
簡単にいうと、
主成分得点の2乗和
式で書くと、
\(S_j\)=\(\sum_{i=1}^{n} z_{ji}^2\)
主成分平方和を計算
実際に計算すると、
●\(S_1\)=\(\sum_{i=1}^{n} z_{1i}^2\)
=\(\frac{(-3)^2+(-4)^2+3^2+(-1)^2+5^2}{(\sqrt{5})^2}\)
=12=\(λ_1\)
●\(S_2\)=\(\sum_{i=1}^{n} z_{2i}^2\)
=\(\frac{(-1)^2+2^2+1^2+(-2)^2+0^2}{(\sqrt{5})^2}\)
=2=\(λ_2\)
なお、主成分平方和と固有値が一致する理由は関連記事に書いていますので、ご確認ください。固有方程式からあっさり証明できます。
主成分方向の平方和と固有値が一致する理由がわかる 主成分の平方和と固有値が一致する理由が説明できますか?本記事では主成分分析を導出する過程で主成分方向の平方和と固有値が一致する理由をわかりやすく解説します。シンプルに証明できるので、た |
⑥主成分の寄与率
簡単にいうと、
●第1主成分の寄与率= \(\frac{12}{12+2}\)=\(\frac{6}{7}\)
●第2主成分の寄与率= \(\frac{2}{12+2}\)=\(\frac{1}{7}\)
となります。
以上、いろいろな値を導出しました。ただ、試験対策に近い要素であり、主成分分析の本質ではありません。主成分分析の本質は点在する情報を1つの方向に集約することでしたね。
主成分分析の本質を先に習得してから、各値の計算を見ていきましょう。
まとめ
「主成分分析が計算できる」を解説しました。
- ①例題
- ➁固有値、固有ベクトルの計算
- ➂主成分負荷量
- ➃主成分得点
- ➄主成分平方和
- ⑥主成分の寄与率
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119