QCプラネッツ 品質のプロフェッショナルを育成するサイト

コレスポンデンス分析ができる

多変量解析

「コレスポンデンス分析がわからない」などと困っていませんか?

こういう疑問に答えます。

本記事のテーマ

コレスポンデンス分析ができる

おさえておきたいポイント

  • ①コレスポンデンス分析とは
  • ➁コレスポンデンス分析の解き方
  • ➂解法1.データ表を用意
  • ➃解法2. 相関係数が最大になる条件を求める
  • ➄解法3.ラグランジュの未定乗数法を使う
  • ⑥解法4.結果的に固有方程式になる
  • ⑦解法5.固有値解からデータの関係性を求める
コレスポンデンス分析は
各欄の値が0以上の整数において
相関係数の最大化する条件を求めるもの
コレスポンデンス分析は
数量化3類と数量化4類の解法を合体させたものと
理解しよう!

①コレスポンデンス分析とは

コレスポンデンス分析とは

簡単にいうと

数量化3類の拡張版で
カテゴリーを数量化と重みづけしたもの。
重みづけは数量化4類の解法をベースに理解しよう!
数量化3類と数量化4類の解法を応用したもの

なので、数量化3類と数量化4類の解法がベースとなります。関連記事で事前に確認しましょう。まったく同じ解法で本記事を解説します。

数量化3類の分析ができる
数量化3類が説明できますか?分析できますか? 本記事では、数量化3類の本質や解法をデータ事例を使いながらわかりやすく解説します。多変量解析を学ぶ人は必読です。

数量化4類の分析ができる
数量化4類の分析ができますか? 本記事では主成分分析、数量化3類の解法をベースに数量化4類の解法をわかりやすく解説します。ツールに頼らず、手計算でできる内容でまとめていますので、早く理解できます。多変量解析を学ぶ人は必読です。

➁コレスポンデンス分析の解き方

解法手順

では、コレスポンデンス分析の解法を解説します! 次のステップで解いていきます。

  1. データ表を用意
  2. 相関係数が最大になる条件を求める
  3. ラグランジュの未定乗数法を使う
  4. 結果的に固有方程式になる
  5. 最大の固有値解からデータの関係性を求める

よく見ると、

主成分分析と同じ解法!
数量化3類と同じ解法!
重みづけデータがあるのは数量化4類と同じ解法!

なので、注意したいのは、

固有値を計算することより、
条件式がラグランジュの未定乗数法を用いた結果
固有方程式になるという意識が大事でしたね!

主成分分析でも同じことを解説しています。関連記事で紹介します。

【まとめ】主成分分析を究める
主成分分析は解けますか?主成分分析は何をやる手法か説明できますか? 本記事では、主成分分析を究めれられるポイントをわかりやすく解説しています。関連記事を読み進めると主成分分析はマスターできます。多変量解析を学ぶ人は必読です。

では、実データを使いながら解説します。

➂解法1.データ表を用意

データ表を用意

あるアンケートを取ったら、下表のようになったとしましょう。これをコレスポンデンス分析で分析しましょう。

データ \(b_1\) \(b_2\) \(b_3\)
\(a_1\) 0 1 1 2
\(a_2\) 1 0 2 3
\(a_3\) 3 0 0 3
4 1 3 8

ここで、表の意味を説明します。

(\(a_i\),\(b_j\))においては、その点数が指定されています。
数量化3類は点数はなく、すべての(\(a_i\),\(b_j\))が1または0(空欄)でしたね。
1以上の整数が入るのが、コレスポンデンス分析と数量化3類との違いです。

その中で、表全体の相関係数が最大にとなる条件を考えます。

データの平均と分散を0,1と標準化する

解析しやすくするために、
●平均0
●分散1
とします。

平均

●\(\bar{a}\)=\(\frac{2a_1+3a_2+3a_3}{8}\)=0
●\(\bar{b}\)=\(\frac{4b_1+b_2+3b_3}{8}\)=0

分散V

●\(V_a\)=\(\sum_{i=1}^{8}\frac{(a_i-\bar{a})^2}{8}\)=\(\sum_{i=1}^{8}\frac{a_i}{8}\)
=\(\frac{1}{8}(2a_1^2+3a_2^2+3a_3^2)\)=1
●\(V_b\)=\(\sum_{i=1}^{8}\frac{(b_i-\bar{b})^2}{8}\)=\(\sum_{i=1}^{8}\frac{b_i}{8}\)
=\(\frac{1}{8}(4b_1^2+b_2^2+3b_3^2)\)=1

まとめると、

\(\frac{1}{8}(2a_1^2+3a_2^2+3a_3^2)\)=1
\(\frac{1}{8}(4b_1^2+b_2^2+3b_3^2)\)=1
後で使う式となります。

➃解法2.相関係数が最大になる条件を求める

解法は数量化3類と全く同じです。

相関係数を計算

相関係数\(r\)は
\(r\)=\(\frac{S_{ab}}{S_{a} S_{b}}\)
ですね。

分母はすでに分散のところで計算済なので、
●\(S_a\)=\((2a_1^2+3a_2^2+3a_3^2)\)=8
●\(S_b\)=\((4b_1^2+b_2^2+3b_3^2)\)=8

分子を計算すると、
●\(S_{ab}\)\(\sum_{i=1}^{8} (a_i-\bar{a})(b_i-\bar{b})\)
=\(a_1 b_2+a_1 b_3 + a_2 b_1 + 2a_2 b_3 + 3a_3 b_1\)

よって、相関係数\(r\)は

\(r\)=\(\frac{1}{8}( a_1 b_2+a_1 b_3 + a_2 b_1 + 2a_2 b_3 + 3a_3 b_1)\)

➄解法3.ラグランジュの未定乗数法を使う

ラグランジュの未定乗数法

\(a,b\)の制約条件は、分散の式から
●\(\frac{1}{8}(2a_1^2+3a_2^2+3a_3^2)\)-1=0
●\(\frac{1}{8}(4b_1^2+b_2^2+3b_3^2)\)-1=0

関数Fを下式で定義します。今回変数が\(a,b\)の2種類があるので\(λ_1,λ_2\)を使います。

F=\(\frac{1}{8}( a_1 b_2+a_1 b_3 + a_2 b_1 + 2a_2 b_3 + 3a_3 b_1)\)
-\(\frac{λ_1}{2}(\frac{1}{8}(2a_1^2+3a_2^2+3a_3^2)-1)\)
-\(\frac{λ_2}{2}(\frac{1}{8}(4b_1^2+b_2^2+3b_3^2)-1)\)

相関係数\(r\)が最大になる条件は、
●\(\displaystyle \frac{\partial F}{\partial a_1}\)=\(\frac{1}{8}(b_2+b_3)-\frac{λ_1}{2} \frac{4a_1}{8}\)=0 …①
●\(\displaystyle \frac{\partial F}{\partial a_2}\)=\(\frac{1}{8}(b_1+2b_3)- \frac{λ_1}{2} \frac{6a_2}{8}\)=0 …➁
●\(\displaystyle \frac{\partial F}{\partial a_3}\)=\(\frac{1}{8}(3b_1)- \frac{λ_1}{2} \frac{6a_3}{8}\)=0 …➂
●\(\displaystyle \frac{\partial F}{\partial b_1}\)=\(\frac{1}{8}(a_2+3a_3)- \frac{λ_2}{2} \frac{8b_1}{8}\)=0 …➃
●\(\displaystyle \frac{\partial F}{\partial b_2}\)=\(\frac{1}{8}(a_1)- \frac{λ_2}{2} \frac{2b_2}{8}\)=0 …➄
●\(\displaystyle \frac{\partial F}{\partial b_3}\)=\(\frac{1}{8}(a_1+2a_2)- \frac{λ_2}{2} \frac{6b_3}{8}\)=0 …⑥

本記事のテーマは
ラグランジュの未定乗数法を使うことです。
ここをよく意識しておいてください。

⑥解法4.結果的に固有方程式になる

①~⑥の式を整理していきます。

相関係数\(r\)と\(λ_1,λ_2\)の関係式を作る

①×\(a_1\)+➁×\(a_2\)+➂×\(a_3\)
(\(a_1 b_2 + a_1 b_3 – 2λ_1 a_1^2\))+(\(a_2 b_1 + 2a_2 b_3 – 3λ_1 a_2^2\))+(\(3a_3 b_1 – 3λ_1 a_3^2\))=0
\((a_1 b_2 + a_1 b_3+ a_2 b_1 + 2a_2 b_3+3a_3 b_1)\)-\(λ_1(2a_1^2+3 a_2^2+3 a_3^2)\)=0
\(8r -8λ_1\)=0
より、
\(r\)=\(λ_1\)
とシンプルになります。

同様に
➃×\(b_1\)+⑤×\(b_2\)+⑥×\(b_3\)
(\(a_2 b_1 +3 a_3 b_1 – 4λ_2 b_1^2\))+(\(a_1 b_2 – λ_2 b_2^2\))+(\(a_1 b_3 +2a_2 b_3 – 3λ_2 b_3^2\))=0
\((a_2 b_1 +3 a_3 b_1+ a_1 b_2 + a_1 b_3 +2a_2 b_3)\)-\(λ_2(4b_1^2+b_2^2+3 b_3^2)\)=0
\(8r -8λ_2\)=0
より、
\(r\)=\(λ_2\)
とシンプルになります。

まとめると、

\(r\)=\(λ_1\)=\(λ_2\)
の関係式を使っていきます。

固有方程式が結果的にできる

\(λ_1\)=\(λ_2\)=\(λ\)として、①➁➂式から
●\(a_1\)=\(\frac{b_2 +b_3}{2λ}\) …①
●\(a_2\)=\(\frac{b_1 +2b_3}{3λ}\) …➁
●\(a_3\)=\(\frac{b_1}{λ}\) …➂

➃➄⑥式に代入すると
●\(\frac{b_1 + 2b_3}{3λ}+\frac{3b_1}{λ}\)-\(4λb_1\)=0 …➃
●\(\frac{b_2 + b_3}{2λ}-λb_2\)=0 …➄
●\(\frac{b_2 + b_3}{2λ}+\frac{2b_1+4b_2}{3λ}\)-\(3λb_3\)=0 …⑥

この式を行列表記すると、結果的、固有方程式ができます。

\(\left(
\begin{array}{cccc}
10-12λ^2 & 0 & 2 \\
0 & 1-2λ^2 & 1 \\
4 & 11 & 3-18λ^2
\end{array}
\right)
\)\(
\left(
\begin{array}{c}
b_1 \\
b_2 \\
b_3
\end{array}
\right)
\)=
\(
\left(
\begin{array}{c}
0 \\
0 \\
0
\end{array}
\right)
\)

固有値解を解く

上の固有方程式から、下の行列式=0となる条件を解けばOKです。3次方程式になりますが、頑張って解きます!

\(\begin{vmatrix}
10-12λ^2 & 0 & 2 \\
0 & 1-2λ^2 & 1 \\
4 & 11 & 3-18λ^2
\end{vmatrix}\)=0

\(λ^2=t\)(\(t\) ≥ 0)とおいて、行列式を解くと、
\(λ^2=t\)(\(t\) ≥ 0)
\((10-12t)(1-2t)(3-18t)\)+0・1・4+2・0・11-2・\((1-2t)\)・4-0・0・\((3-18t)\)-\((10-12t)\)・1・11=0

\(54t^3-81t^2+16t+11\)=0
\((t-1)(54t^2-27t-11)\)=0
より、
\(t\)=1,-0.2659,0.766

\(t\) ≥ 0より、
\(t\)=1,0.766

数量化3類でありましたように、
\(t\)=1は相関係数が1となるので、特例として扱わないとします。

よって、
\(t\)=0.766
\(λ\)=0.875
の1つだけとなります。

ここまでで、固有値解が計算できました。次は固有ベクトルを計算してデータの関係性を確認します。

⑦解法5.最大の固有値解からデータの関係性を求める

固有値が1つ(\(λ\)=0.875)求まりましたので、それぞれの固有ベクトルを計算しましょう。

固有値\(λ\)=0.875のとき

固有方程式は

\(\left(
\begin{array}{cccc}
0.808 & 0 & 2 \\
0 & -0.532 & 1 \\
4 & 11 & -10.788
\end{array}
\right)
\)\(
\left(
\begin{array}{c}
b_1 \\
b_2 \\
b_3
\end{array}
\right)
\)=
\(
\left(
\begin{array}{c}
0 \\
0 \\
0
\end{array}
\right)
\)

計算すると
\(
\left(
\begin{array}{c}
b_1 \\
b_2 \\
b_3
\end{array}
\right)
\)=\(
\left(
\begin{array}{c}
-0.758 \\
0.575\\
0.306
\end{array}
\right)
\)

\(a_1\),\(a_2\),\(a_3\)は
\(a_1\)=\(\frac{b_2+b_3}{2λ}\)=0.504
\(a_2\)=\(\frac{b_1+2b_3}{3λ}\)=0.150
\(a_3\)=\(\frac{b_1}{λ}\)=-0.866
\(r\)=\(λ\)=0.875

固有値\(λ\)=0.809からわかること

\(a_1\),\(a_2\),\(a_3\)と
\(b_1\),\(b_2\),\(b_3\)の
大きい順に並べると

●\(b_2\)=0.575, \(b_3\)=0.306, \(b_1\)=-0.758
●\(a_1\)=0.504, \(a_2\)=0.150, \(a_3\)=-0.866
の順になります。これを最初の表に適用すると、相関性の高い順に並び変わります。

元の表は、

データ \(b_1\) \(b_2\) \(b_3\)
\(a_1\) 0 1 1 2
\(a_2\) 1 0 2 3
\(a_3\) 3 0 0 3
4 1 3 8

から下表に変化します。

データ \(b_2\) \(b_3\) \(b_1\)
\(a_1\) 1 1 0 2
\(a_2\) 0 2 1 3
\(a_3\) 0 0 3 3
1 3 4 8

どうでしょうか?
左上から右下への対角線上にデータが乗るように、入れ替わりましたね!
これがコレスポンデンス分析で実施したいことです。

コレスポンデンス分析は
相関係数が最大になる条件を
ラグランジュの未定乗数法から求めます。
その結果、固有方程式につながります。
数量化3類と数量化4類の応用した解法ですね!

コレスポンデンス分析の分析ができましたね!

まとめ

「コレスポンデンス分析ができる」を解説しました。

  • ①コレスポンデンス分析とは
  • ➁コレスポンデンス分析の解き方
  • ➂解法1.データ表を用意
  • ➃解法2. 相関係数が最大になる条件を求める
  • ➄解法3.ラグランジュの未定乗数法を使う
  • ⑥解法4.結果的に固有方程式になる
  • ⑦解法5.固有値解からデータの関係性を求める


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!