数量化4類の分析ができる
「数量化4類の分析がわからない」などと困っていませんか?
こういう疑問に答えます。
本記事のテーマ
おさえておきたいポイント
- ①数量化4類とは
- ➁数量化4類の解き方
- ➂解法1.データ表を用意
- ➃解法2. 距離の平方和が最大になる条件を求める
- ➄解法3.ラグランジュの未定乗数法を使う
- ⑥解法4.結果的に固有方程式になる
- ⑦解法5.固有値解からデータの関係性を求める
解法を理解しよう!
①数量化4類とは
数量化4類とは
簡単にいうと
数量化3類に親近度の重みづけをしたもの
なので、数量化3類の解法がベースとなります。関連記事で事前に確認しましょう。まったく同じ解法で本記事を解説します。
数量化3類の分析ができる 数量化3類が説明できますか?分析できますか? 本記事では、数量化3類の本質や解法をデータ事例を使いながらわかりやすく解説します。多変量解析を学ぶ人は必読です。 |
「数量化○○」と無理にカテゴライズしなくていい
正直、数量化○○で分類するとかえって理解しにくいです。
手法を分類するとわかりやすいですが、QCプラネッツは気にしなくていいと考えます。
量的データと質的データの違い
無理に区別する必要はない!
なぜなら、解法・目的は同じだから
変数を0,1などのダミー変数を使ったり、整数値にする場合もあるし、実数を使う場合もありますが、それは解析者の自由でよいでしょうね。そうなると、数量化1類は重回帰分析でいいんですよ!
もっとシンプルに分類できないか?
シンプルだが、解法・目的が一発でわかる分類方法はないのか?
どの、教科書も同じことを書くので、
「皆が同じことを書くと正しいと思いがち」ですが、
自分に合わない、気に入らない考えがあれば、自分に合う定義で分類してもOKですよ!
➁数量化4類の解き方
解法手順
では、数量化4類の解法を解説します! 次のステップで解いていきます。
- データ表を用意
- 距離の平方和が最大になる条件を求める
- ラグランジュの未定乗数法を使う
- 結果的に固有方程式になる
- 最大の固有値解からデータの関係性を求める
よく見ると、
なので、注意したいのは、
条件式がラグランジュの未定乗数法を用いた結果
固有方程式になるという意識が大事でしたね!
親近度の重みづけが
数量化3類の解法から
追加されます。
主成分分析でも同じことを解説しています。関連記事で紹介します。
【まとめ】主成分分析を究める 主成分分析は解けますか?主成分分析は何をやる手法か説明できますか? 本記事では、主成分分析を究めれられるポイントをわかりやすく解説しています。関連記事を読み進めると主成分分析はマスターできます。多変量解析を学ぶ人は必読です。 |
では、実データを使いながら解説します。
➂解法1.データ表を用意
データ表を用意
あるアンケートを取ったら、下表のようになったとしましょう。これを数量化4類で分析しましょう。
親近度 | \(S_1\) | \(S_2\) | \(S_3\) |
\(S_1\) | – | 1 | 2 |
\(S_2\) | 0 | – | 1 |
\(S_3\) | 3 | 0 | – |
ここで、表の意味を説明します。
\(S_i\)と\(S_j\)の親近度は
●\(S_i\)にとっての\(S_j\)の親近度\(T_{ij}\)と
●\(S_j\)にとっての\(S_i\)の親近度\(T_{ji}\)が
それぞれあるので、
\(T_{ij}\)≠\(T_{ji}\)
も十分起こりえます。この点に注意しましょう。
その中で、\(S_i\)と\(S_j\)の距離を
\(x_i\)と\(x_j\)を使って表現し、その距離の平方和Qを考えます。
数量化3類の解法と違って
数量化4類の解法なのです。
データの平均と分散を0,1と標準化する
解析しやすくするために、
●平均0
●分散1
とします。
平均
●\(\bar{x}\)=\(\frac{x_1+x_2+x_3}{3}\)=0
分散V
●\(V\)=\(\sum_{i=1}^{3}\frac{(x_i-\bar{a})^2}{3}\)=\(\sum_{i=1}^{3}\frac{x_i}{3}\)
=\(\frac{1}{3}(x_1^2+x_2^2+x_3^2)\)=1
まとめると、
後で使う式となります。
➃解法2. 距離の平方和が最大になる条件を求める
距離の平方和Qを計算
距離の平方和Qは
Q=1×\((x_1 -x_2)^2\)+2×\((x_1 -x_3)^2\)+0×\((x_2 -x_1)^2\)
+1×\((x_2 -x_3)^2\)+3×\((x_3 -x_1)^2\)+0×\((x_3 -x_2)^2\)
=\((x_1 -x_2)^2\)+2\((x_1 -x_3)^2\)+\((x_2 -x_3)^2\)+3\((x_3 -x_1)^2\)
➄解法3.ラグランジュの未定乗数法を使う
ラグランジュの未定乗数法
\(x\)の制約条件は、分散の式から
●\(\frac{1}{3}(x_1^2+x_2^2+x_3^2)\)-1=0
関数Fを下式で定義します。
F,Qが最大になる条件は、
●\(\displaystyle \frac{\partial F}{\partial x_1}\)=\(2(x_1 – x_2)+4(x_1 -x_3)-6(x_3 – x_1)-\frac{2}{3}λx_1\)=0 …①
●\(\displaystyle \frac{\partial F}{\partial x_2}\)=\(-2(x_1 – x_2)+2(x_2 -x_3)-\frac{2}{3}λx_2\)=0 …➁
●\(\displaystyle \frac{\partial F}{\partial x_3}\)=\(-4(x_1 – x_3)-2(x_2 -x_3)+6(x_3 – x_1)-\frac{2}{3}λx_3\)=0 …➂
ラグランジュの未定乗数法を使うことです。
ここをよく意識しておいてください。
⑥解法4.結果的に固有方程式になる
①~➂の式を整理していきます。
式を整理
①➁➂式を整理すると
●\(6x_1 -6x_2 -5x_3 – \frac{1}{3}λx_1\)=0
●\(-x_1 +2x_2 -x_3 – \frac{1}{3}λx_2\)=0
●\(-5x_1 -x_2 +6x_3 – \frac{1}{3}λx_3\)=0
固有方程式が結果的にできる
この式を行列表記すると、結果的、固有方程式ができます。
\(\frac{1}{3}λ\)=\(a\)と置きます。
\(\left(
\begin{array}{cccc}
6-a & -6 & -5 \\
-1 & 2-a & -1 \\
-5 & -1 & 6-a
\end{array}
\right)
\)\(
\left(
\begin{array}{c}
x_1 \\
x_2 \\
x_3
\end{array}
\right)
\)=
\(
\left(
\begin{array}{c}
0 \\
0 \\
0
\end{array}
\right)
\)
固有値解を解く
上の固有方程式から、下の行列式=0となる条件を解けばOKです。3次方程式になりますが、頑張って解きます!
\(\begin{vmatrix}
6-a & -6 & -5 \\
-1 & 2-a & -1 \\
-5 & -1 & 6-a
\end{vmatrix}\)
行列式を解くと、
\((6-a)(2-a)(6-a)\)+(-6)(-1)(-5)+(-5)(-1)(-1)
-(-5)\((2-a)\)(-5)-(6)(-1)\((6-a)\)-\((6-a)\)(-1)(-1)=0
3次方程式をまとめると
\(a^3-14a^2+28a+55\)=0
実は、因数分解できます!
\((a-11)(a^2-3a-5)\)=0
よって\(a\)は
\(a\)=\(\frac{1}{3}λ\)=11,\(\frac{3±\sqrt{29}}{2}\)
つまり、
\(λ\)=33,12.576,-3.579
が得られます。
ここまでで、固有値解が計算できました。次は固有ベクトルを計算してデータの関係性を確認します。
⑦解法5.最大の固有値解からデータの関係性を求める
固有値が3つ(\(λ\)=33,12.576,-3.579)求まりましたので、それぞれの固有ベクトルを計算しましょう。
固有値\(λ\)=33のとき
固有方程式は
\(\left(
\begin{array}{cccc}
-5 & -6 & -5 \\
-1 & -9 & -1 \\
-5 & -1 & -5
\end{array}
\right)
\)\(
\left(
\begin{array}{c}
x_1 \\
x_2 \\
x_3
\end{array}
\right)
\)=
\(
\left(
\begin{array}{c}
0 \\
0 \\
0
\end{array}
\right)
\)
計算すると
\(
\left(
\begin{array}{c}
x_1 \\
x_2 \\
x_3
\end{array}
\right)
\)=
\(
\left(
\begin{array}{c}
0.707 \\
0 \\
-0.707
\end{array}
\right)
\)
となります。
固有値\(λ\)=12.576のとき
固有方程式は
\(\left(
\begin{array}{cccc}
1.808 & -6 & -5 \\
-1 & -2.192 & -1 \\
-5 & -1 & 1.808
\end{array}
\right)
\)\(
\left(
\begin{array}{c}
x_1 \\
x_2 \\
x_3
\end{array}
\right)
\)=
\(
\left(
\begin{array}{c}
0 \\
0 \\
0
\end{array}
\right)
\)
計算すると
\(
\left(
\begin{array}{c}
x_1 \\
x_2 \\
x_3
\end{array}
\right)
\)=\(
\left(
\begin{array}{c}
0.380 \\
-0.521 \\
0.764
\end{array}
\right)
\)
固有値\(λ\)=-3.579のとき
固有方程式は
\(\left(
\begin{array}{cccc}
7.193 & -6 & -5 \\
-1 & 3.193 & -1 \\
-5 & -1 & 7.193
\end{array}
\right)
\)\(
\left(
\begin{array}{c}
x_1 \\
x_2 \\
x_3
\end{array}
\right)
\)=
\(
\left(
\begin{array}{c}
0 \\
0 \\
0
\end{array}
\right)
\)
計算すると
\(
\left(
\begin{array}{c}
x_1 \\
x_2 \\
x_3
\end{array}
\right)
\)=
\(
\left(
\begin{array}{c}
0.725 \\
0.402 \\
0.559
\end{array}
\right)
\)
となります。
固有ベクトルからわかること
解析結果をまとめると下表になり、その関係性を数直線に描いてみましょう。
– | \(λ\)=33 | \(λ\)=12.576 | \(λ\)=-3.579 |
\(x_1\) | 0.707 | 0.38 | 0.725 |
\(x_2\) | 0 | -0.521 | 0.402 |
\(x_3\) | -0.707 | 0.764 | 0.559 |
どうでしょうか?
数量化4類で分析すると、親近度の関係性が見えてきます。あとは、これをどう分析に使うかを考えていけばよいのです。
数量化3類と同じ解法で重みづけを加えて
距離の平方和が最大になる条件を
ラグランジュの未定乗数法から求めます。
その結果、固有方程式につながります。
主成分分析、数量化3類と同じ解法の流れになりますね!
数量化4類の分析ができましたね!
まとめ
「数量化4類の分析ができる」を解説しました。
- ①数量化4類とは
- ➁数量化4類の解き方
- ➂解法1.データ表を用意
- ➃解法2. 距離の平方和が最大になる条件を求める
- ➄解法3.ラグランジュの未定乗数法を使う
- ⑥解法4.結果的に固有方程式になる
- ⑦解法5.固有値解からデータの関係性を求める
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119