QCプラネッツ 品質のプロフェッショナルを育成するサイト

線形判別関数Zの導出がわかる(2次元、平方和の分解)

多変量解析

「線形判別関数Zの導出がわからない」などと困っていませんか?

こういう疑問に答えます。

本記事のテーマ

線形判別関数Zの導出がわかる(2次元、平方和の分解)

おさえておきたいポイント

  • ①線形判別関数\(Z\)を定義
  • ➁線形判別関数\(Z\)の平方和を定義
  • ➂線形判別関数\(Z\)の平方和を分解
  • ➃線形判別関数の求め方
判別分析は自分で解けます!
Excelや公式は暗記不要!
自力で導出できるぜ!
2次元でしっかり導出過程を理解しましょう。
QCの数学はどの単元でも
●データの構造式
●平方和の分解
が出て来ます。今回も出ます!

線形判別関数の第1歩ですが、丁寧に解説します! ここ大事なので!

①線形判別関数\(Z\)を定義

判別分析とは

簡単にいうと

データ群をある基準(直線)でスパッと切って、どちらの領域か?を判別する方法

なので、スパッと切る線が必要なため、線形判別関数を使ったり、
分散を考慮したマハラビノス距離を使った判別をします。

今回は線形判別関数を扱います。

線形判別関数とは

データ群をスパッと切る線です。

関連記事で、解説しているので、ご確認ください。

線形判別関数の正負がわかる
判別分析に使う、線形判別関数の正負、0のイメージができますか? 本記事では、最も基本ベースとなる線形判別関数の値とそのイメージを高2数学で十分わかるように丁寧に解説します。簡単だからと思わず、丁寧に理解することが大事です。多変量解析を学ぶ人は必読です。

直線の式
\(y=ax+b\)が出発点で、
\(0=ax-y+b\)として

\(Z=ax-y+b\)と置いて、ちょっと変形すると
\(Z\)=\(ax+by+c\)
になります。

線形判別関数
\(Z\)=\(ax+by+c\)は直線の式でイメージして
●\(Z\)=0なら直線上
●\(Z\) ≠0(正負両方)なら領域
を表現しますね!

高2の数学「領域」がベースでしたね。

➁線形判別関数\(Z\)の平方和を定義

\(x,y\)軸の2次元平面ですが、\(Z\)を定義したので\(Z\)軸を用意します。

線形判別関数

上図のように、直線と交わる点が\(Z\)=0でその両側はそれぞれ正負をとります。
あるデータ(\(x_i,y_i\))から\(Z\)軸に垂線を下した足を\(Z_i\)と定義します。

この\(Z_i\)を使って平方和を考えます。

次に下図のようにデータの平均値を定義します。
●\(\bar{Z}\) : データ全体の平均
●\(\bar{Z_1}\) : データ1群の平均
●\(\bar{Z_2}\) : データ2群の平均
データ1群とデータ2群は赤線の線形判別式で区切られているとします。

線形判別関数

➂線形判別関数\(Z\)の平方和を分解

平方和を定義

まず\(Z_i\)の平方和を定義すると、機械的に
●\(S\)=\(\sum_{i=1}^{n}(Z_i-\bar{Z})^2\)
となりますね。

ここで、1群のデータ数を(m\)個、2群のデータ数を\(n-m\)
(\(n\) > \(m\))
と置くと、平方和\(S\)は

●\(S\)=\(\sum_{i=1}^{n}(Z_i-\bar{Z})^2\)
=\(\sum_{i=1}^{m}(Z_i-\bar{Z})^2\)+\(\sum_{i=m+1}^{n}(Z_i-\bar{Z})^2\)
と分けることができますね。

平方和を分解

群内変動と群間変動に平方和を分解は
●管理図
●抜取検査
●実験計画法
●多変量解析

とたくさん出てきます。
QCの数学では、平方和の分解は一番重要なところなんです!

各群の平均を
●\(\bar{Z_1}\) : データ1群の平均
●\(\bar{Z_2}\) : データ2群の平均
と定義しましたから、平方和の式を
\(Z_i-\bar{Z}\)=\((Z_i-\bar{Z_1})+(\bar{Z_1}-\bar{Z})\)
\(Z_i-\bar{Z}\)=\((Z_i-\bar{Z_2})+(\bar{Z_2}-\bar{Z})\)
と変形して、2乗和を展開します。

2乗和を展開

平方和Sは
\(S\)=\(\sum_{i=1}^{n}(Z_i-\bar{Z})^2\)
=\(\sum_{i=1}^{m}((Z_i-\bar{Z_1})+(\bar{Z_1}-\bar{Z}))^2\)
+\(\sum_{i=m+1}^{m}((Z_i-\bar{Z_2})+(\bar{Z_2}-\bar{Z}))^2\)
=(式1)

2乗和を展開します。
(式1)
=\(\sum_{i=1}^{m}(Z_i-\bar{Z_1})^2\) ⇒(1-1項)
+\(\sum_{i=1}^{m}(Z_i-\bar{Z_1})(\bar{Z_1}-\bar{Z})\)⇒ (1-2項)
+\(\sum_{i=1}^{m}(\bar{Z_1}-\bar{Z})^2\)⇒(1-3項)

+\(\sum_{i=m+1}^{n}(Z_i-\bar{Z_2})^2\)⇒(2-1項)
+\(\sum_{i=m+1}^{n}(Z_i-\bar{Z_2})(\bar{Z_2}-\bar{Z})\)⇒(2-2項)
+\(\sum_{i=m+1}^{n}(\bar{Z_2}-\bar{Z})^2\)(2-3項)
=(式2)

6つの項に分かれますが、タイプが3つあり、
●(1-1項)と(2-1項)は同じタイプ
●(1-2項)と(2-2項)は同じタイプ
●(1-3項)と(2-3項)は同じタイプ
です。

平方和を整理

(式2)は3つのタイプに分かれるので、それぞれ整理しましょう。

(1-1項)と(2-1項)のタイプ

実はこのタイプはこれ以上、式はいじりません。

(1-2項)と(2-2項)のタイプ

実はこのタイプは計算すると、0になります。

(1-2項)=\(\sum_{i=1}^{m}(Z_i-\bar{Z_1})(\bar{Z_1}-\bar{Z})\)
=\(((Z_1-\bar{Z_1})+(Z_2-\bar{Z_1})+…+(Z_m-\bar{Z_1})(\bar{Z_1}-\bar{Z}))\)
=\(((Z_1+Z_2+…+Z_m-m\bar{Z_1})(\bar{Z_1}-\bar{Z})\)
で、
\(Z_1+Z_2+…+Z_m\)=\(m\bar{Z_1}\)なので、
=0×\((\bar{Z_1}-\bar{Z})\)
=0

同様に、
(2-2項) =\(\sum_{i=m+1}^{n}(Z_i-\bar{Z_2})(\bar{Z_2}-\bar{Z})\)
=\(((Z_{m+1}-\bar{Z_2})+(Z_{m+2}-\bar{Z_2})+…+(Z_n-\bar{Z_2})(\bar{Z_2}-\bar{Z}))\)
=\(((Z_{m+1}+Z_{m+2}+…+Z_n-(n-m)\bar{Z_2})(\bar{Z_2}-\bar{Z})\)
で、
\(Z_{m+1}+Z_{m+2}+…+Z_n\)=\((n-m)\bar{Z_2}\)なので、
=0×\((\bar{Z_2}-\bar{Z})\)
=0

(1-3項)と(2-3項)のタイプ

整理しましょう。

(1-3項)= \(\sum_{i=1}^{m}(\bar{Z_1}-\bar{Z})^2\)
\((\bar{Z_1}-\bar{Z})\)は\(i\)に関係ない定数なので∑の外に出せます。
= \((\bar{Z_1}-\bar{Z})^2 \sum_{i=1}^{m}1\)
=\(m(\bar{Z_1}-\bar{Z})^2\)

同様に
(2-3項)= \(\sum_{i=m+1}^{n}(\bar{Z_2}-\bar{Z})^2\)
\((\bar{Z_2}-\bar{Z})\)は\(i\)に関係ない定数なので∑の外に出せます。
= \((\bar{Z_2}-\bar{Z})^2 \sum_{i=m+1}^{n}1\)
=\((n-m)(\bar{Z_2}-\bar{Z})^2\)

よって、平方和\(S\)をまとめると、
\(S\)=
(式1)
=\(\sum_{i=1}^{m}(Z_i-\bar{Z_1})^2\) ⇒(1-1項)
+\(m(\bar{Z_1}-\bar{Z})^2\)⇒(1-3)項

+\(\sum_{i=m+1}^{n}(Z_i-\bar{Z_2})^2\)⇒(2-1項)
+\((n-m)(\bar{Z_2}-\bar{Z})^2\)⇒(2-3項)
=(式3)
まで整理できます。

群内変動と群間変動に平方和を分解

(式3)をよく見ると、
(1-1項)=\(\sum_{i=1}^{m}(Z_i-\bar{Z_1})^2\)と
(2-1項)=\(\sum_{i=m+1}^{n}(Z_i-\bar{Z_2})^2\)は
グループ内の変動でまとめられるので、
群内変動の平方和\(S_W\)と定義します。
\(S_W\)=\(\sum_{i=1}^{m}(Z_i-\bar{Z_1})^2\)+\(\sum_{i=m+1}^{n}(Z_i-\bar{Z_2})^2\)

さらに、
(1-3)項=\(m(\bar{Z_1}-\bar{Z})^2\)と
(2-3)項=\((n-m)(\bar{Z_2}-\bar{Z})^2\)は
グループ間の変動でまとめられるので、
群間変動の平方和\(S_B\)と定義します。
\(S_B\)=\(m(\bar{Z_1}-\bar{Z})^2\)+\((n-m)(\bar{Z_2}-\bar{Z})^2\)

つまり全平方和\(S\)は
\(S\)=\(S_W\)+\(S_B\)
と分解できます。

➃線形判別関数の求め方

判別関数を求める条件

下図を再掲しますが、2つに区分したい場合、どこに線引きするのがもっともらしいか?気になりますよね。

線形判別関数

2つの解法がある

よくあるのが、とにかく微分=0ですね。
主に2つの方法があります。

  1. 相関比が最大になる条件を計算
  2. ラグランジュの未定乗数を使って計算

ここからの導出方法は実際にデータを扱いながら解説しますので、次の記事に進みましょう。

本記事では、線形判別関数を導出するベースとなる
平方和の分解を主に解説しました。

まとめ

「線形判別関数Zの導出がわかる(2次元、平方和の分解)」を解説しました。

  • ①線形判別関数\(Z\)を定義
  • ➁線形判別関数\(Z\)の平方和を定義
  • ➂線形判別関数\(Z\)の平方和を分解
  • ➃線形判別関数の求め方


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!