QCプラネッツ 品質のプロフェッショナルを育成するサイト

数量化3類の分析ができる

多変量解析

「数量化3類の分析がわからない」などと困っていませんか?

こういう疑問に答えます。

本記事のテーマ

数量化3類の分析ができる

おさえておきたいポイント

  • ①数量化3類とは
  • ➁数量化3類の解き方
  • ➂解法1.データ表を用意
  • ➃解法2.相関係数が最大になる条件を求める
  • ➄解法3.ラグランジュの未定乗数法を使う
  • ⑥解法4.結果的に固有方程式になる
  • ⑦解法5.固有値解からデータの関係性を求める
数量化3類のネーミングより
解法を理解しよう!

①数量化3類とは

数量化3類とは

簡単にいうと

縦と横の表項目を
相関性の高い順に並び替える

下右図のように相関性が高い順に並び替えると、ある一定の並び方が見えやすくするのが、数量化3類の解析目的です。

数量化3類

「数量化○○」と無理にカテゴライズしなくていい

正直、数量化○○で分類するとかえって理解しにくいです。

手法を分類するとわかりやすいですが、QCプラネッツは気にしなくていいと考えます。

●重回帰分析と数量化1類は
量的データと質的データの違い
無理に区別する必要はない!
なぜなら、解法・目的は同じだから

変数を0,1などのダミー変数を使ったり、整数値にする場合もあるし、実数を使う場合もありますが、それは解析者の自由でよいでしょうね。そうなると、数量化1類は重回帰分析でいいんですよ!

●判別分析と数量化2類も同じでいい

数量化3類

●多変量解析分類すると細かすぎる
もっとシンプルに分類できないか?
シンプルだが、解法・目的が一発でわかる分類方法はないのか?

どの、教科書も同じことを書くので、
「皆が同じことを書くと正しいと思いがち」ですが、
自分に合わない、気に入らない考えがあれば、自分に合う定義で分類してもOKですよ!

➁数量化3類の解き方

解法手順

では、数量化3類の解法を解説します! 次のステップで解いていきます。

  1. データ表を用意
  2. 相関係数が最大になる条件を求める
  3. ラグランジュの未定乗数法を使う
  4. 結果的に固有方程式になる
  5. 最大の固有値解からデータの関係性を求める

よく見ると、

主成分分析と同じ解法!

なので、注意したいのは、

固有値を計算することより、
条件式がラグランジュの未定乗数法を用いた結果
固有方程式になるという意識が大事でしたね!

主成分分析でも同じことを解説しています。関連記事で紹介します。

【まとめ】主成分分析を究める
主成分分析は解けますか?主成分分析は何をやる手法か説明できますか? 本記事では、主成分分析を究めれられるポイントをわかりやすく解説しています。関連記事を読み進めると主成分分析はマスターできます。多変量解析を学ぶ人は必読です。

では、実データを使いながら解説します。

➂解法1.データ表を用意

データ表を用意

あるアンケートを取ったら、下表のようになったとしましょう。これを数量化3類で分析しましょう。

カテゴリー 1 2 3
サンプル \(b_1\) \(b_2\) \(b_3\)
1 \(a_1\) (\(a_1,b_2\)) (\(a_1,b_3\)) 2
2 \(a_2\) (\(a_2,b_1\)) (\(a_2,b_3\)) 2
3 \(a_3\) (\(a_3,b_1\)) 1
2 1 2 5

データの平均と分散を0,1と標準化する

解析しやすくするために、
●平均0
●分散1
とします。

平均

●\(\bar{a}\)=\(\frac{2a_1+2a_2+a_3}{5}\)=0
●\(\bar{b}\)=\(\frac{2b_1+b_2+2b_3}{5}\)=0

分散V

●\(V_a\)=\(\sum_{i=1}^{5}\frac{(a_i-\bar{a})^2}{5}\)=\(\sum_{i=1}^{5}\frac{a_i}{5}\)
=\(\frac{1}{5}(2a_1^2+2a_2^2+a_3^2)\)=1
●\(V_b\)=\(\sum_{i=1}^{5}\frac{(b_i-\bar{b})^2}{5}\)=\(\sum_{i=1}^{5}\frac{b_i}{5}\)
=\(\frac{1}{5}(2b_1^2+b_2^2+2b_3^2)\)=1

まとめると、

\(\frac{1}{5}(2a_1^2+2a_2^2+a_3^2)\)=1
\(\frac{1}{5}(2b_1^2+b_2^2+2b_3^2)\)=1
後で使う式となります。

➃解法2.相関係数が最大になる条件を求める

相関係数を計算

相関係数\(r\)は
\(r\)=\(\frac{S_{ab}}{S_{a} S_{b}}\)
ですね。

分母はすでに分散のところで計算済なので、
●\(S_a\)=\((2a_1^2+2a_2^2+a_3^2)\)=5
●\(S_b\)=\((2b_1^2+b_2^2+2b_3^2)\)=5

分子を計算すると、
●\(S_{ab}\)\(\sum_{i=1}^{5} \sum_{j=1}^{5}(a_i-\bar{a})(b_j-\bar{b})\)
=\(a_1 b_2+a_1 b_3 + a_2 b_1 + a_2 b_3 + a_3 b_1\)

よって、相関係数\(r\)は

\(r\)=\(\frac{1}{5}( a_1 b_2+a_1 b_3 + a_2 b_1 + a_2 b_3 + a_3 b_1)\)

➄解法3.ラグランジュの未定乗数法を使う

ラグランジュの未定乗数法

\(a,b\)の制約条件は、分散の式から
●\(\frac{1}{5}(2a_1^2+2a_2^2+a_3^2)\)-1=0
●\(\frac{1}{5}(2b_1^2+b_2^2+2b_3^2)\)-1=0

関数Fを下式で定義します。今回変数が\(a,b\)の2種類があるので\(λ_1,λ_2\)を使います。

F=\(\frac{1}{5}( a_1 b_2+a_1 b_3 + a_2 b_1 + a_2 b_3 + a_3 b_1)\)
-\(\frac{λ_1}{2}(\frac{1}{5}(2a_1^2+2a_2^2+a_3^2)-1)\)
-\(\frac{λ_2}{2}(\frac{1}{5}(2b_1^2+b_2^2+2b_3^2)-1)\)

相関係数\(r\)が最大になる条件は、
●\(\displaystyle \frac{\partial F}{\partial a_1}\)=\(\frac{1}{5}(b_2+b_3)-\frac{2λ_1}{5}a_1\)=0 …①
●\(\displaystyle \frac{\partial F}{\partial a_2}\)=\(\frac{1}{5}(b_1+b_3)-\frac{2λ_1}{5}a_2\)=0 …➁
●\(\displaystyle \frac{\partial F}{\partial a_3}\)=\(\frac{1}{5}(b_1)-\frac{λ_1}{5}a_3\)=0 …➂
●\(\displaystyle \frac{\partial F}{\partial b_1}\)=\(\frac{1}{5}(a_2+a_3)-\frac{2λ_2}{5}b_1\)=0 …➃
●\(\displaystyle \frac{\partial F}{\partial b_2}\)=\(\frac{1}{5}(a_1)-\frac{λ_2}{5}b_2\)=0 …➄
●\(\displaystyle \frac{\partial F}{\partial b_3}\)=\(\frac{1}{5}(a_1+a_2)-\frac{2λ_2}{5}b_3\)=0 …⑥

本記事のテーマは
ラグランジュの未定乗数法を使うことです。
ここをよく意識しておいてください。

⑥解法4.結果的に固有方程式になる

①~⑥の式を整理していきます。

相関係数\(r\)と\(λ_1,λ_2\)の関係式を作る

①×\(a_1\)+➁×\(a_2\)+➂×\(a_3\)
\(\frac{1}{5}(a_1 b_2+a_1 b_3 -2λ_1 a_1^2)\)+\(\frac{1}{5}(a_2 b_1+a_2 b_3 -2λ_1 a_2^2)\)+\(\frac{1}{5}(a_2 b_1 -λ_1 a_3^2)\)=0
\(\frac{1}{5}( a_1 b_2+a_1 b_3+ a_2 b_1+a_2 b_3+ a_2 b_1)\)-\(\frac{λ_1}{5}(2a_1^2+2a_2^2+a_3^2)\)=0 (式1)
ここで、
●\(r\)=\(\frac{1}{5}( a_1 b_2+a_1 b_3+ a_2 b_1+a_2 b_3+ a_2 b_1)\)
●\(\frac{λ_1}{5}(2a_1^2+2a_2^2+a_3^2)\)=1
より、(式1)は
\(r\)=\(λ_1\)
とシンプルになります。

同様に
➃×\(b_1\)+⑤×\(b_2\)+⑥×\(b_3\)
\(\frac{1}{5}( a_1 b_2+a_1 b_3+ a_2 b_1+a_2 b_3+ a_2 b_1)\)-\(\frac{λ_2}{5}(2b_1^2+b_2^2+2b_3^2)\)=0 (式1)
ここで、
●\(r\)=\(\frac{1}{5}( a_1 b_2+a_1 b_3+ a_2 b_1+a_2 b_3+ a_2 b_1)\)
●\(\frac{λ_1}{5}(2b_1^2+b_2^2+2b_3^2)\)=1
より、(式1)は
\(r\)=\(λ_2\)
とシンプルになります。

まとめると、

\(r\)=\(λ_1\)=\(λ_2\)
の関係式を使っていきます。

固有方程式が結果的にできる

\(λ_1\)=\(λ_2\)=\(λ\)として、①➁➂式から
●\(a_1\)=\(\frac{b_2 +b_3}{2λ}\) …①
●\(a_2\)=\(\frac{b_1 +b_3}{2λ}\) …➁
●\(a_3\)=\(\frac{b_1}{λ}\) …➂

➃➄⑥式に代入すると
●\(\frac{b_1 + b_3}{2λ}-2λb_1\)=0 …➃
●\(\frac{b_2 + b_3}{2λ}-λb_2\)=0 …➄
●\((\frac{b_2 + b_3}{2λ}+\frac{b_1 + b_3}{2λ})-2λb_3\)= …⑥

この式を行列表記すると、結果的、固有方程式ができます。

\(\left(
\begin{array}{cccc}
\frac{3}{2}-2λ^2 & 0 & \frac{1}{2} \\
0 & \frac{1}{2}-λ^2 & \frac{1}{2} \\
\frac{1}{2} & \frac{1}{2} & 1-2λ^2
\end{array}
\right)
\)\(
\left(
\begin{array}{c}
b_1 \\
b_2 \\
b_3
\end{array}
\right)
\)=
\(
\left(
\begin{array}{c}
0 \\
0 \\
0
\end{array}
\right)
\)

固有値解を解く

上の固有方程式から、下の行列式=0となる条件を解けばOKです。3次方程式になりますが、頑張って解きます!

\(\begin{vmatrix}
\frac{3}{2}-2λ^2 & 0 & \frac{1}{2} \\
0 & \frac{1}{2}-λ^2 & \frac{1}{2} \\
\frac{1}{2} & \frac{1}{2} & 1-2λ^2
\end{vmatrix}\)=0

行列式を解くと、
\((\frac{3}{2}-2λ^2)(\frac{1}{2}-λ^2)(1-2λ^2)\)-\(\frac{1}{4}(\frac{1}{2}-λ^2)\)-\(\frac{1}{4}(\frac{3}{2}-2λ^2)\)=0

\(λ^2=t\)(\(t\) ≥ 0)とおくと、
\(16t^3-28t^2+13t-1\)=0
\((t-1)(t-\frac{3-\sqrt{5}}{8})( t-\frac{3+\sqrt{5}}{8})\)=0
\(t\)=1,0.6545,0.0955
\(λ\)=1,0.809,0.309 (\(λ\)も正についてのみ考えます。)

ここまでで、固有値解が計算できました。次は固有ベクトルを計算してデータの関係性を確認します。

⑦解法5.最大の固有値解からデータの関係性を求める

固有値が3つ(\(λ\)=1,0.809,0.309)求まりましたので、それぞれの固有ベクトルを計算しましょう。

固有値\(λ\)=1のとき

固有方程式は

\(\left(
\begin{array}{cccc}
-0.5 & 0 & 0.5 \\
0 & -0.5 & 0.5 \\
0.5 & 0.5 & -1
\end{array}
\right)
\)\(
\left(
\begin{array}{c}
b_1 \\
b_2 \\
b_3
\end{array}
\right)
\)=
\(
\left(
\begin{array}{c}
0 \\
0 \\
0
\end{array}
\right)
\)

計算すると
\(b_1\)=\(b_2\)=\(b_3\)
\(a_1\)=\(\frac{b_2+b_3}{2λ}\)=\(b_1\)
\(a_2\)=\(\frac{b_1+b_3}{2λ}\)=\(b_1\)
\(a_3\)=\(\frac{b_1}{λ}\)=\(b_1\)
より、
\(a_1\)=\(a_2\)=\(a_3\)=\(b_1\)=\(b_2\)=\(b_3\)
\(r\)=1

たしかに、全部値が同じなら相関係数1ですよね。
ただ、これは異例なので、相関係数1以下を調べてみましょう。

固有値\(λ\)=0.809のとき

固有方程式は

\(\left(
\begin{array}{cccc}
0.191 & 0 & 0.5 \\
0 & -0.154 & 0.5 \\
0.5 & 0.5 & -0.309
\end{array}
\right)
\)\(
\left(
\begin{array}{c}
b_1 \\
b_2 \\
b_3
\end{array}
\right)
\)=
\(
\left(
\begin{array}{c}
0 \\
0 \\
0
\end{array}
\right)
\)

計算すると
\(
\left(
\begin{array}{c}
b_1 \\
b_2 \\
b_3
\end{array}
\right)
\)=\(
\left(
\begin{array}{c}
-2.617 \\
3.236 \\
1
\end{array}
\right)
\)
(\(b_3\)=1とします。)

\(a_1\),\(a_2\),\(a_3\)は
\(a_1\)=\(\frac{b_2+b_3}{2λ}\)=2.618
\(a_2\)=\(\frac{b_1+b_3}{2λ}\)=-0.999
\(a_3\)=\(\frac{b_1}{λ}\)=-3.234
\(r\)=\(λ\)=0.809

固有値\(λ\)=0.309のとき

固有方程式は

\(\left(
\begin{array}{cccc}
1.31 & 0 & 0.5 \\
0 & 0.405 & 0.5 \\
0.5 & 0.5 & 0.809
\end{array}
\right)
\)\(
\left(
\begin{array}{c}
b_1 \\
b_2 \\
b_3
\end{array}
\right)
\)=
\(
\left(
\begin{array}{c}
0 \\
0 \\
0
\end{array}
\right)
\)

計算すると
\(
\left(
\begin{array}{c}
b_1 \\
b_2 \\
b_3
\end{array}
\right)
\)=\(
\left(
\begin{array}{c}
-0.382\\
-1.237\\
1
\end{array}
\right)
\)
(\(b_3\)=1とします。)

\(a_1\),\(a_2\),\(a_3\)は
\(a_1\)=\(\frac{b_2+b_3}{2λ}\)=-0.385
\(a_2\)=\(\frac{b_1+b_3}{2λ}\)=1.000
\(a_3\)=\(\frac{b_1}{λ}\)=-1.236
\(r\)=\(λ\)=0.309

固有値\(λ\)=0.809からわかること

\(a_1\),\(a_2\),\(a_3\)と
\(b_1\),\(b_2\),\(b_3\)の
大きい順に並べると

●\(b_2\)=3.236, \(b_3\)=1, \(b_1\)=-2.617
●\(a_1\)=2.618, \(a_2\)=-0.999, \(a_3\)=-3.234
の順になります。これを最初の表に適用すると、相関性の高い順に並び変わります。

元の表は、

カテゴリー 1 2 3
サンプル \(b_1\) \(b_2\) \(b_3\)
1 \(a_1\) (\(a_1,b_2\)) (\(a_1,b_3\)) 2
2 \(a_2\) (\(a_2,b_1\)) (\(a_2,b_3\)) 2
3 \(a_3\) (\(a_3,b_1\)) 1
2 1 2 5

から下表に変化します。

カテゴリー 1 2 3
サンプル \(b_2\) \(b_3\) \(b_1\)
1 \(a_1\) (\(a_1,b_2\)) (\(a_1,b_3\)) 2
2 \(a_2\) (\(a_2,b_3\)) (\(a_2,b_1\)) 2
3 \(a_3\) (\(a_3,b_1\)) 1
1 2 2 5

どうでしょうか?
左上から右下への対角線上にデータが乗るように、入れ替わりましたね!
これが数量化3類で実施したいことです。

数量化3類は
相関係数が最大になる条件を
ラグランジュの未定乗数法から求めます。
その結果、固有方程式につながります。
主成分分析と同じ解法の流れになりますね!

数量化3類の分析ができましたね!

まとめ

「数量化3類の分析ができる」を解説しました。

  • ①数量化3類とは
  • ➁数量化3類の解き方
  • ➂解法1.データ表を用意
  • ➃解法2.相関係数が最大になる条件を求める
  • ➄解法3.ラグランジュの未定乗数法を使う
  • ⑥解法4.結果的に固有方程式になる
  • ⑦解法5.固有値解からデータの関係性を求める


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!