線形判別関数が計算できる(2次元、その1)
「線形判別関数Zが作れない」などと困っていませんか?
こういう疑問に答えます。
本記事のテーマ
おさえておきたいポイント
- ①データ事例
- ➁平方和(全変動、群間変動)、相関比を計算
- ➂線形判別関数の係数導出方法1
- ➃線形判別関数の係数導出方法2(その2)
- ➄線形判別関数を図示する(その2)
- ⑥線形判別関数とデータの値の比較(その2)
Excelや公式は暗記不要!
自力で導出できるぜ!
①データ事例
2次元データで線形判別関数を作る
以下のデータを用意しましょう。このデータの線形判別関数を作っていきます。
群 | \(x_1\) | \(x_2\) |
1群 | 4 | 8 |
6 | 10 | |
2 | 12 | |
2群 | 10 | 16 |
5 | 10 | |
8 | 12 | |
7 | 16 |
なお、グラフで図示すると下図になります。 2つの群に分けたので、線を引いて区別してみましょう。この線の直線式を求めます。
➁平方和(全変動、群間変動)、相関比を計算
線形判別関数\(Z\)を定義
関連記事のとおり、2次元における線形判別関数\(Z\)を定義します。
線形判別関数Zの導出がわかる(2次元、平方和の分解) 線形判別関数は自分で導出できますか? 本記事は線形判別関数を導出するための平方和の計算、平方和の分解を解説します。平方和の分解はQCすべての単元に必須なテクニックです。多変量解析を学ぶ人は必読です。 |
●線形判別関数\(Z\)
\(Z\)=\(a_1 x_1 +a_2 x_2\)
各値に代入しましょう。下の結果になります。
群 | x1 | x2 | Z | 群平均 |
1群 | 4 | 8 | 4\(a_1\)+8\(a_2\) | 4\(a_1\)+10\(a_2\) |
6 | 10 | 6\(a_1\)+10\(a_2\) | ||
2 | 12 | 2\(a_1\)+12\(a_2\) | ||
2群 | 10 | 16 | 10\(a_1\)+16\(a_2\) | 7.5\(a_1\)+13.5\(a_2\) |
5 | 10 | 5\(a_1\)+10\(a_2\) | ||
8 | 12 | 8\(a_1\)+12\(a_2\) | ||
7 | 16 | 7\(a_1\)+16\(a_2\) | ||
– | – | – | 全体の平均 | 6\(a_1\)+12\(a_2\) |
平方和(全変動、群間変動)を計算
上表と関連記事を使って、平方和を計算します。
全変動を計算
全変動\(S_T\)は
\(S\)=\(\sum_{i=1}^{7}(Z-\bar{Z})^2\)
=\(((4a_1+8a_2)-(6a_1+12a_2))^2\)
+\(((6a_1+10a_2)-(6a_1+12a_2))^2\)
+\(((2a_1+12a_2)-(6a_1+12a_2))^2\)
+\(((10a_1+16a_2)-(6a_1+12a_2))^2\)
+\(((5a_1+10a_2)-(6a_1+12a_2))^2\)
+\(((8a_1+12a_2)-(6a_1+12a_2))^2\)
+\(((7a_1+16a_2)-(6a_1+12a_2))^2\)
=\(42a_1^2 + 60a_1 a_2 +56 a_2^2\)
=(式1)
群間変動を計算
群間変動\(S_B\)は
\(S_B\)=\(\sum_{i=1}^{3}(\bar{Z_1}-\bar{Z})^2\)+\(\sum_{i=1}^{4}(\bar{Z_2}-\bar{Z})^2\)
=3\((\bar{Z_1}-\bar{Z})^2\)+4\((\bar{Z_2}-\bar{Z})^2\)
=3\(((4a_1+10a_2)-(6a_1+12a_2))^2\)+4\(((7.5a_1+13.5a_2)-(6a_1+12a_2))^2\)
=21\((a_1 + a_2)^2\)
=(式2)
相関比を導出
線形判別関数は相関比を最大にする(最も区別できる条件)として計算します。
相関比\(F\)=\(\frac{S_B}{S_T}\)
と定義します。
相関比\(F\)=\(\frac{S_B}{S_T}\)
=\(\frac{21(a_1 + a_2)^2}{42a_1^2 + 60a_1 a_2 +56 a_2^2}\)
ここから、線形判別関数を導出する方法が2つあります。結果は同じになりますが紹介します。
- 相関比が最大になる条件を計算
- ラグランジュの未定乗数を使って計算
➂線形判別関数の係数導出方法1
単純に\(F\)が最大,最小になる条件を計算します。これは2変数限定の解法です。
\(\frac{a_1}{a_2}\)=\(k\)とおき、相関比\(F(k)\)を再定義します。
\(F\)= \(\frac{21((\frac{a_1}{a_2}) + 1)^2}{42(\frac{a_1}{a_2})^2 + 60(\frac{a_1}{a_2}) +56}\)
\(F(k)\)= \(\frac{21(k + 1)^2}{42k^2 + 60k +56}\)
これを微分します。高3数学レベルですね。
\(F’(k)\)=\(\frac{42(k+1)(分母)-(分子)(84k+60))}{分母^2}\)
で、\(F’(k)\)=0となる\(k\)が欲しいので、\(F’(k)\)の分子のみ取り出します。
\(F’(k)\)の分子
=\(42(k+1)(42k^2+60k+56)-21(k+1)^2(84k+60)\)=0
\(2(k+1)(2(42k^2+60k+56)-(k+1)(84k+60))\)=0
\((k+1)(24k-52)\)=0
よって、
\(k\)=-1,\(\frac{13}{6}\)
\(F(k\)のグラフを描くと、確かに\(k\)=―1,\(\frac{13}{6}\)の時がそれぞれ最小、最大になります。
次は、ラグランジュの未定乗数法を使った解法を解説しますが、
関連記事「線形判別関数が計算できる(2次元、その2)」で解説します。
まとめ
「線形判別関数が計算できる(2次元、その1)」を解説しました。
- ①データ事例
- ➁平方和(全変動、群間変動)、相関比を計算
- ➂線形判別関数の係数導出方法1
- ➃線形判別関数の係数導出方法2(その2)
- ➄線形判別関数を図示する(その2)
- ⑥線形判別関数とデータの値の比較(その2)
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119