投稿者: QCプラネッツ

  • 【まとめ】因子分析がわかる

    【まとめ】因子分析がわかる

    「因子分析がわからない」などと困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    【まとめ】因子分析がわかる

    おさえておきたいポイント

    • ①因子分析は難しい
    • ➁因子分析とは/li>
    • ➂関連記事の紹介
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】多変量解析問題集を販売します!

    QC検定®1級合格したい方、多変量解析をしっかり学びたい方におススメです。
    【QC検定®合格】「多変量解析」問題集を販売します! 内容は、①回帰分析 単回帰分析・重回帰分析 の復習、➁ 主成分分析、➂判別分析、➃因子分析、➄数量化分析の5章全42題を演習できる問題集です。

    因子分析は自分で解けます!
    Excelや公式は暗記不要!
    自力で導出できるぜ!

    ①因子分析は難しい

    ブログ記事化するのに一番時間がかかった

    QCプラネッツは、正直困りました。
    「因子分析を記事にするまでとても時間がかかりました」
    数週間記事化できなかったですね。

    苦労話を少し紹介します。

    因子分析の難しさ

    一番困ったのは

    因子分析の意図が見えない。。。

    そりゃ、解き方くらいはさっとわかりますが、
    何で、こう解くのか? 何を求めたいのか?
    いくつか定義する仮定の意味がわからない
    共通因子を見つけても意味がわからない
    などなど

    その中で、
    手計算で解きながら、解法の意味を理解できる解説ブログにしたい!
    その思いでQCプラネッツをずっとやってきた!
    そのために、どこから攻めたらいいか?

    因子分析が理解しやすい本

    まず、シンプルなモデルで手計算ができるところから解説したい思いがあり、その思いに合う教科書から入りました。いくつか紹介します。

    その次は、データを使って実際に解析したい思いがあり、次の本を参考にしています。

    などの、本を集めて、QCプラネッツが1つの解法ですべてわかるように交通整理して記事を書き始めました。

    本がいくつかあると、著者のくせがそれぞれちがいので
    味付けを1つに統一してブログ化しています。

    ➁因子分析とは

    因子分析とは

    簡単に言うと

    因子分析はデータを構成する元を見つけるもの

    因子分析

    データを

    (データ)=(係数)×(データの元)+(誤差)

    に分ける分析で、
    ●(係数)⇒因子負荷量
    ●(データの元)⇒共通因子
    と呼んでいます。

    (データ)自身の分散を使って、
    ●(係数)
    ●(データの元)
    ●(誤差)
    に分解します。

    因子分析の注意点

    因子分析を実施する際、いくつか注意点があります。

    1. データは必ず標準化(平均0,標準偏差1)にする
    2. 変数間は独立(共分散はすべて0)とする
    3. 因子負荷量、誤差成分を求める方程式には自由度が余るため解の精度が粗い
    4. 解くためにSMC法などのいくつかモデルを仮定している
    5. 共通因子を抽出しても何を意味するかは人間が考える必要がある
    因子分析は注意して解かないと、
    トンチンカンな結果を招くだけ
    因子分析より主成分分析の方がわかりやすい

    因子分析に関する関連記事を次に紹介します。

    ➂関連記事の紹介

    因子分析手法で説明をいくつか省いた

    因子分析には、
    主因子法
    バリマックス回転
    などの代表的な手法がありますが、
    QCプラネッツではあえて、解説しないことにしました。

    因子分析の解き方を一番理解していただきたいので
    因子分析の原理が理解できる所のみ解説しています。

    因子分析を解説した教科書等を研究して、
    難しい因子分析を手計算で理解できるにはどうしたらよいか?
    他の多変量解析と比較しやくして、理解しやすくするにはどうしたらよいか?
    を最優先にブログを構築しました。

    因子分析の解き方が知りたいより
    因子分析から何がわかるのか?の目的を手に入れたい!

    以下、関連記事を紹介します。順を追って読んでいけば、
    手計算で因子分析ができるようになり、意味が理解できるようになります。

    関連記事を紹介

    1因子モデルで解き方をマスターしよう!

    2記事にわたり、因子分析の解法の根幹を理解しましょう。1記事目は数式で理解し、2記事目は実データを使って計算します。

    因子分析の1因子モデルが導出できる
    因子分析が説明できますか?主成分分析との違いが明確に数式を使って説明できますか?本記事では、因子分析の最も基本的な1因子モデルにおける分析方法をわかりやすく解説します。多変量解析を学ぶ人は必読です。

    因子分析の1因子モデルが計算できる
    因子分析が計算できますか? 本記事では、因子分析の最も基本的な1因子モデルにおける計算方法をわかりやすく解説します。多変量解析を学ぶ人は必読です。

    2因子モデルで解き方をマスターしよう!

    2記事にわたり、2因子モデルにおける因子分析の解法の根幹を理解しましょう。1記事目は数式で理解し、2記事目は実データを使って計算します。

    2因子モデルが理解できたら多因子モデルも同様に解けます。ただし、数値解析的な解しか出せない因子分析の限界なところも理解できますね。

    因子分析の2因子モデルが導出できる
    因子分析が計算できますか? 本記事では、因子分析の2因子モデルにおける計算方法を解説します。2因子の解析過程の注意点が理解できれば、多因子でも適用できます。計算ツールに頼らず、手計算で理解できるようにわかりやすく解説しています。多変量解析を学ぶ人は必読です。

    因子分析の2因子モデルが計算できる
    因子分析が計算できますか? 本記事では、因子分析で重要な2因子モデルにおける計算方法をわかりやすく解説します。多変量解析を学ぶ人は必読です。

    主成分分析と因子分析の違いを解法モデルからマスターしよう!

    主成分分析と因子分析はよく、比較されますが、一般的な説明では理解できません。そこで、上の関連記事とQCプラネッツオリジナルの主成分分析記事から、両者の違いをわかりやすく解説します。

    主成分分析と因子分析の違いがわかる
    主成分分析と因子分析の違いが説明できますか? 本記事では、理解しにくい教科書的な説明より、分析手法がイメージできるように、わかりやすく2つの分析手法の違いを解説します。多変量解析を学ぶ人は必読です。

    5つの関連記事を読めば、
    因子分析の解法はよく理解できますが、
    因子分析の難しさも理解できるはずです。

    QCプラネッツ個人は、データの元を調べたいなら
    わかりやすいし、解の精度の高い
    主成分分析の方で行くでしょう。

    まとめ

    「【まとめ】因子分析がわかる」を解説しました。

    • ①因子分析は難しい
    • ➁因子分析とは/li>
    • ➂関連記事の紹介

  • 主成分分析と因子分析の違いがわかる

    主成分分析と因子分析の違いがわかる

    「主成分分析と因子分析の違いがわからない」などと困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    主成分分析と因子分析の違いがわかる

    おさえておきたいポイント

    • ①一般的な説明
    • ➁QCプラネッツの説明
    • ➂主成分分析とは
    • ➃因子分析とは
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】多変量解析問題集を販売します!

    QC検定®1級合格したい方、多変量解析をしっかり学びたい方におススメです。
    【QC検定®合格】「多変量解析」問題集を販売します! 内容は、①回帰分析 単回帰分析・重回帰分析 の復習、➁ 主成分分析、➂判別分析、➃因子分析、➄数量化分析の5章全42題を演習できる問題集です。

    主成分分析も因子分析は自分で解けます!
    Excelや公式は暗記不要!
    自力で導出できるぜ!

    ①一般的な説明

    教科書の説明

    よく教科書で次のように違いを説明していますよね。

    主成分分析と因子分析

    この表の良い所は、

    1. 主成分分析と因子分析が同じ図で矢印の向きの違いで説明できる
    2. 主成分、共通因子と係数で2つの分析ができる

    なんですが、実際に両方の分析を解けるようになると、
    違和感があります。

    教科書の説明では理解できない

    主成分分析の説明図はOKですが、
    因子分析側の説明図では違和感があります。

    主成分分析と因子分析

    この図では、

    1. 「主成分分析はデータ群から主成分を抽出し、
      主成分はデータ群が決める!」⇒理解できる!
    2. 「因子分析は、私たちが勝手に共通因子を決めて、データ群を構成する」⇒と見えてしまい、違和感がある

    因子分析は、共通因子fからデータに矢印があるので、
    主成分分析との違いを意識すると
    主成分分析はデータが主成分(方向)を決める
    対して、因子分析は、共通因子がデータを決める
    の違いがあるように見えてしまいます。

    実際に分析すると、
    因子分析もデータが共通因子を決める分析です。

    ➁QCプラネッツの説明

    分析方法が理解しやすい比較図を作る

    実際に2つの分析方法を解いてみると、

    主成分分析はデータが主成分(方向)を決める
    ⇒主成分方向である新たな座標軸を作るのが主成分分析!

    因子分析はデータが共通因子を決める
    ⇒共通因子は(データを誤差で割り、因子負荷量で割るので)
    \(\frac{データ-誤差}{因子負荷量}\)の式から見ると、
    データをある意味標準化したもの
    データの元(元こそ共通因子)を見つけるのが因子分析!

    まとめると、

    1. 主成分分析は軸方向を抽出するもの
    2. 因子分析はデータを構成する元を見つけるもの

    QCプラネッツが考える両手法のイメージ図は下図となります。

    主成分分析と因子分析

    結論は、

    主成分分析と因子分析は
    全く別物で比較して意味が無い

    ➂主成分分析とは

    主成分分析とは

    データ群は群がっていますが、ある方向に情報量が集まっていることが分かっています。
    ●各データと平均間のベクトルと
    ●主成分方向
    の内積を使って、その2乗和の最大となる条件式を作ります。

    その条件式を解くと、
    固有方程式ができるため、
    主成分分析=固有方程式
    とよく認識されています。

    この固有方程式を解くと、
    変数の個数だけ、主成分方向と、寄与率が出て来ますね。

    寄与率や固有値が大きい順に並べて分析するのが主成分分析です。

    詳細は関連記事で

    ざっと主成分分析の概要を説明しましたが、詳細は関連記事にあります。

    【まとめ】主成分分析を究める
    主成分分析は解けますか?主成分分析は何をやる手法か説明できますか? 本記事では、主成分分析を究めれられるポイントをわかりやすく解説しています。関連記事を読み進めると主成分分析はマスターできます。多変量解析を学ぶ人は必読です。

    ➃因子分析とは

    因子分析とは

    因子分析は、データ群から、そのデータを構成する元(共通因子)をみつけるものです。

    簡単なモデル式を書くと
    (共通因子)=\(\frac{データ-誤差}{因子負荷量}\)
    から、誤差と、因子負荷量を見つけて、計算できます。
    \(z=\frac{x-\bar{x}}{σ}\)のイメージですね。

    誤差と因子負荷量は、変数の分散、共分散から、計算して求めます。
    データ群が作る分散・共分散から共通因子が計算できるため、
    ●共通因子⇒データ
    ではなく、
    ●データ⇒共通因子
    と考えるべきです。

    詳細は関連記事で

    ざっと因子分析の概要を説明しましたが、詳細は関連記事にあります。

    因子分析の2因子モデルが導出できる
    因子分析が計算できますか? 本記事では、因子分析の2因子モデルにおける計算方法を解説します。2因子の解析過程の注意点が理解できれば、多因子でも適用できます。計算ツールに頼らず、手計算で理解できるようにわかりやすく解説しています。多変量解析を学ぶ人は必読です。

    まとめ

    「主成分分析と因子分析の違いがわかる」を解説しました。

    • ①一般的な説明
    • ➁QCプラネッツの説明
    • ➂主成分分析とは
    • ➃因子分析とは

  • 因子分析の2因子モデルが計算できる

    因子分析の2因子モデルが計算できる

    「因子分析ってどうやって解くのかがわからない」などと困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    因子分析の2因子モデルが計算できる

    おさえておきたいポイント

    • ①2因子モデルを式で表現
    • ➁モデル式から分散・共分散を導出
    • ➂因子負荷量を計算
    • ➃共通因子と誤差を計算
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】多変量解析問題集を販売します!

    QC検定®1級合格したい方、多変量解析をしっかり学びたい方におススメです。
    【QC検定®合格】「多変量解析」問題集を販売します! 内容は、①回帰分析 単回帰分析・重回帰分析 の復習、➁ 主成分分析、➂判別分析、➃因子分析、➄数量化分析の5章全42題を演習できる問題集です。

    因子分析は自分で解けます!
    Excelや公式は暗記不要!
    自力で導出できるぜ!

    この記事では、導出過程はすでに関連記事で解説しています。先に確認ください。導出過程を見ながら本記事では実際に計算して解いていきます。

    因子分析の2因子モデルが導出できる
    因子分析が計算できますか? 本記事では、因子分析の2因子モデルにおける計算方法を解説します。2因子の解析過程の注意点が理解できれば、多因子でも適用できます。計算ツールに頼らず、手計算で理解できるようにわかりやすく解説しています。多変量解析を学ぶ人は必読です。

    ①2因子モデルを式で表現

    下表のように、例えば、あるデータがあり、変数x,y,zがあるとしましょう。

    No A B C
    1 30 58 54
    2 60 50 60
    3 40 60 55
    4 80 32 68
    5 56 70 71
    6 65 54 76
    7 22 28 30
    8 100 72 96
    9 65 80 88
    10 32 46 52
    550 550 650
    平均 55 55 65
    標準偏差 23.12 15.93 18.15

    このデータを、
    主成分分析のように、2つの共通変数F、Gに集約できなか?
    を考えます。

    つまり式と図で表現すると、
    \(
    \left(
    \begin{array}{c}
    x_i \\
    y_i \\
    z_i
    \end{array}
    \right)
    \)=\(F_i\)\(
    \left(
    \begin{array}{c}
    a_{x}\\
    a_{y}\\
    a_{z}
    \end{array}
    \right)
    \)+\(G_i\)\(
    \left(
    \begin{array}{c}
    b_{x}\\
    b_{y}\\
    b_{z}
    \end{array}
    \right)
    \)+\(
    \left(
    \begin{array}{c}
    e_{xi}\\
    e_{yi}\\
    e_{zi}
    \end{array}
    \right)
    \)

    各値を共通因子と誤差に相当する独自因子に分割します。

    因子分析

    式と図から、

    因子分析

    ●定数である因子負荷量\(a,b\)
    ●変数である共通因子F,G
    ●変数である誤差でもある独自因子e
    にわけて、
    ●変数である共通因子F,Gに意味を持たせる
    をやるのが因子分析です。

    データを標準化

    因子分析はモデル式から分散・共分散を導出するときに、データの標準化が必須です。先にデータを標準化しましょう。

    標準化は\(z\)=\(\frac{x-\bar{x}}{σ}\)です。

    No A B C
    1 -1.08 0.19 -0.61
    2 0.22 -0.31 -0.28
    3 -0.65 0.31 -0.55
    4 1.08 -1.44 0.17
    5 0.04 0.94 0.33
    6 0.43 -0.06 0.61
    7 -1.43 -1.69 -1.93
    8 1.95 1.07 1.71
    9 0.43 1.57 1.27
    10 -0.99 -0.56 -0.72
    0 0 0
    平均 0 0 0
    標準偏差 1 1 1

    また、分散・共分散も計算すると以下のとおりです。

    \(s_x\) \(s_y\) \(s_z\)
    分散 1 1 1
    \(s_{xy}\) \(s_{yz}\) \(s_{xz}\)
    共分散 0.371 0.732 0.874

    ➁モデル式から分散・共分散を導出

    詳細な導出は関連記事で

    分散・共分散の導出過程も関連記事で解説しています。先にご確認ください。

    因子分析の2因子モデルが導出できる
    因子分析が計算できますか? 本記事では、因子分析の2因子モデルにおける計算方法を解説します。2因子の解析過程の注意点が理解できれば、多因子でも適用できます。計算ツールに頼らず、手計算で理解できるようにわかりやすく解説しています。多変量解析を学ぶ人は必読です。

    結果まとめ

    分散と共分散の結果は以下のとおりになります。

    \(a_x^2\)+\(b_x^2\)+\(V(e_x)\)=1
    \(a_y^2\)+\(b_y^2\)+\(V(e_y)\)=1
    \(a_z^2\)+\(b_z^2\)+\(V(e_z)\)=1

    \(r_{xy}\)=\(a_x a_y\)+\(b_x b_y\)
    \(r_{yz}\)=\(a_y a_z\)+\(b_y b_z\)
    \(r_{xz}\)=\(a_x a_z\)+\(b_x b_z\)

    から、\(a_○\),\(b_○\)を計算すればOKですが、

    1因子モデルと違って
    手計算はかなりキツイ。。。

    なので、最小二乗法を活用してExcelで計算します。

    ➂因子負荷量を計算

    SMC法から因子負荷量の2乗和を計算

    相関係数行列\(R\)の逆行列の\(ii\)要素を\(r^{ii}\)として、
    \(h_i^2\)=1-\(\frac{1}{r^{ii}}\)
    \(h_i^2\)=\(a_i^2\)+\(b_i^2\)
    \(V(e_i)\)=1-\(h_i^2\)
    の関係式を使って計算する方法です。この理論の背景は現在調査中です。分かり次第報告します。

    因子負荷量を最小二乗法から計算

    SMC法を使って
    ●\(h_x^2\)=\(a_x^2\)+\(b_x^2\)
    ●\(h_y^2\)=\(a_y^2\)+\(b_y^2\)
    ●\(h_z^2\)=\(a_z^2\)+\(b_z^2\)
    から、求めます。

    \(h_x^2\)=\(a_x^2\)+\(b_x^2\)
    \(h_y^2\)=\(a_y^2\)+\(b_y^2\)
    \(h_z^2\)=\(a_z^2\)+\(b_z^2\)

    \(r_{xy}\)=\(a_x a_y\)+\(b_x b_y\)
    \(r_{yz}\)=\(a_y a_z\)+\(b_y b_z\)
    \(r_{xz}\)=\(a_x a_z\)+\(b_x b_z\)

    ここで、\(Q\)を
    \(Q\)=\(((a_x^2+b_x^2)-h_x^2)^2\)
    +\(((a_y^2+b_y^2)-h_y^2)^2\)
    +\(((a_z^2+b_z^2)-h_z^2)^2\)
    +2\((( a_x a_y+ b_x b_y)- r_{xy}^2)^2\)
    +2\((( a_y a_z+ b_y b_z)- r_{yz}^2)^2\)
    +2\((( a_x a_z+ b_x b_z)- r_{xz}^2)^2\)
    と定義して、この\(Q\)が最小値(なるべく0)となる場合を
    Excelで計算してもらいます。

    最小二乗法の計算をExcelに託す

    \(Q\)の式を行列表記します。

    \(Q\)=\((\left(
    \begin{array}{cccc}
    h_x^2 & r_{xy} & r_{xz} \\
    r_{xy} & h_y^2 & r_{xy} \\
    r_{xz} & r_{xy} & h_z^2
    \end{array}
    \right)\)
    -\(\left(
    \begin{array}{cccc}
    a_x^2+b_x^2 & a_x a_y+ b_x b_y & a_x a_z+ b_x b_z \\
    a_x a_y+ b_x b_y & a_y^2+b_y^2 & a_y a_z+ b_y b_z \\
    a_x a_z+ b_x b_z & a_y a_z+ b_y b_z & h_z^2
    \end{array}
    \right))^2
    \)

    上の式を満たすように、
    \(a_○\),\(b_○\)の値を数値計算から求めます。

    因子分析

    Excelを使った計算方法

    上の式で行列表記したものを下図のように
    ●➂因子決定行列R*
    ●➃因子負荷行列
    ●➄最小値計算Q
    に代入します。

    因子分析

    Excelの「データ」⇒「ソルバー」で、
    Qの最小値となる因子負荷量の各値に制約条件を入れて求めます。

    因子分析

    注意なのは、

    ●因子負荷量の値が1つに決まらないこと
    ●数値計算がうまく収束しないこと
    ●Qの最小値が0.01程度まで下がるまで制約条件を変えて解析する必要がある
    Excelでの計算は一瞬ですが、
    解の妥当性はよく確認することが必要です。

    今回は、Excelがはじき出した値を使って、残りの値を計算します。

    ●\(a_x\)=0.854、\(a_y\)=0.737、\(a_z\)=0.991
    ●\(b_x\)=-0.45、\(b_y\)=0.552、\(b_z\)=-0.023

    ➃共通因子と誤差を計算

    あとは、誤差と共通因子を計算すれば、因子分析の一連の流れが計算できます。

    誤差を計算

    誤差\(V(e_x)\), \(V(e_y)\), \(V(e_z)\)は関係式から計算できます。

    誤差はSMC法から求められます。
    ●\(V(e_x)\)=1-\(h_x^2\)
    ●\(V(e_y)\)=1-\(h_y^2\)
    ●\(V(e_z)\)=1-\(h_z^2\)

    計算はできるのですが、1つ問題があります。

    誤差の分散は計算できるが、個別の誤差の値は別の方法で計算が必要。

    実は共通因子Fの各値を計算してから、個別の誤差の値を計算します。

    共通因子Fを計算

    実は、推定方法から計算します。この推定方法の導出はQCプラネッツで調査中です。

    共通因子Fの計算方法

    共通因子\(F\)=\(ZR^{-1} A\)
    ただし、
    ●\(Z\):標準化データ行列(\(x_i,y_i,z_i\)は標準化対応済が前提)
    ●\(R\):相関係数行列
    ●\(A\):因子負荷量ベクトル
    (1因子モデルはベクトル、2因子以上なら行列)

    3変数、2因子モデルの場合、具体的に記述すると

    \(
    \left(
    \begin{array}{c}
    F_1 & G_1\\
    F_2 & G_2\\
    \vdots \\
    F_n & G_2
    \end{array}
    \right)
    \)
    =\(\left(
    \begin{array}{cccc}
    x_{1} & y_{1} & z_{1} \\
    x_{2} & y_{2} & z_{2} \\
    \vdots & \vdots & \vdots \\
    x_{n} & y_{n} & z_{n}
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{cccc}
    h_x^2 & r_{xy} & r_{xz} \\
    r_{xy} & h_y^2 & r_{yz} \\
    r_{xz} & r_{xy} & h_z^2
    \end{array}
    \right)^{-1}
    \)\(
    \left(
    \begin{array}{c}
    a_x & b_x \\
    a_y & b_y \\
    a_z & b_z
    \end{array}
    \right)
    \)
    で計算できます。

    実際に計算してみると

    \(
    \left(
    \begin{array}{c}
    F_1 & G_1\\
    F_2 & G_2\\
    \vdots \\
    F_n & G_2
    \end{array}
    \right)
    \)
    =\(\left(
    \begin{array}{cccc}
    -1.08 & 0.19 & -0.61 \\
    0.22 & -0.31 & -0.28 \\
    \vdots & \vdots & \vdots \\
    -0.99 & -0.56 & -0.72
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{cccc}
    12.433 & 7.177 & -16.123 \\
    7.177 & 6.295 & -10.882 \\
    -16.123 & -10.882 & 23.060
    \end{array}
    \right)
    \)\(
    \left(
    \begin{array}{c}
    0.854 & -0.45 \\
    0.737 & 0.552 \\
    0.991 & -0.023
    \end{array}
    \right)
    \)
    =\(
    \left(
    \begin{array}{c}
    -0.571 & 1.023\\
    -0.303 & -0.626\\
    -0.545 & 0.579\\
    0.121 & -1.961\\
    0.334 & 0.649\\
    0.615 & -0.142\\
    -1.924 & -0.423\\
    1.663 & -0.702\\
    1.294 & 1.141\\
    -0.683 & 0.462
    \end{array}
    \right)
    \)
    で計算できます。

    誤差Eを計算

    誤差Eは残りなので、上の式を使うと、

    \(\left(
    \begin{array}{cccc}
    x_1 & y_1 & z_1 \\
    x_2 & y_2 & z_2 \\
    \vdots & \vdots & \vdots \\
    x_n & y_n & z_n
    \end{array}
    \right)
    \)
    =\(
    \left(
    \begin{array}{c}
    F_1 \\
    F_2 \\
    \vdots \\
    F_n
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{cccc}
    a_x & a_y & a_z
    \end{array}
    \right)
    \)
    +\(
    \left(
    \begin{array}{c}
    G_1 \\
    G_2 \\
    \vdots \\
    G_n
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{cccc}
    b_x & b_y & b_z
    \end{array}
    \right)
    \)
    +\(\left(
    \begin{array}{cccc}
    e_{x1} & e_{y1} & e_{z1} \\
    e_{x2} & e_{y2} & e_{z2} \\
    \vdots & \vdots & \vdots \\
    e_{xn} & e_{yn} & e_{zn}
    \end{array}
    \right)
    \)

    から、誤差行列
    \(\left(
    \begin{array}{cccc}
    e_{x1} & e_{y1} & e_{z1} \\
    e_{x2} & e_{y2} & e_{z2} \\
    \vdots & \vdots & \vdots \\
    e_{xn} & e_{yn} & e_{zn}
    \end{array}
    \right)
    \)
    の個々の値が計算できます。

    実際に誤差行列を計算すると
    \(\left(
    \begin{array}{cccc}
    -0.134 & 0.044 & -0.017 \\
    0.194 & 0.255 & 0.011 \\
    0.077 & 0.396 & 0.002 \\
    0.095 & -0.45 & 0 \\
    0.05 & 0.337 & 0.014 \\
    -0.156 & -0.438 & -0.007 \\
    0.026 & -0.043 & -0.03 \\
    0.211 & 0.229 & 0.043 \\
    -0.159 & -0.014 & 0.011 \\
    -0.204 & -0.316 & -0.029
    \end{array}
    \right)
    \)

    ここまで、各値を計算した上で、共通因子F,Gの意味を考えて、因子分析ができたといえます。

    因子分析の解析フローを理解して
    データ事例を使って計算できました。

    まとめ

    「因子分析の2因子モデルが計算できる」を解説しました。

    • ①2因子モデルを式で表現
    • ➁モデル式から分散・共分散を導出
    • ➂因子負荷量を計算
    • ➃共通因子と誤差を計算

  • 因子分析の2因子モデルが導出できる

    因子分析の2因子モデルが導出できる

    「因子分析ってどうやって解くのかがわからない」などと困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    因子分析の2因子モデルが導出できる

    おさえておきたいポイント

    • ①1因子モデルを式で表現
    • ➁モデル式から分散・共分散を導出
    • ➂仮定を入れて式を簡略化
    • ➃因子負荷量を計算
    • ➄共通因子と誤差を計算
    • ⑥因子分析を解析する際の注意点
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】多変量解析問題集を販売します!

    QC検定®1級合格したい方、多変量解析をしっかり学びたい方におススメです。
    【QC検定®合格】「多変量解析」問題集を販売します! 内容は、①回帰分析 単回帰分析・重回帰分析 の復習、➁ 主成分分析、➂判別分析、➃因子分析、➄数量化分析の5章全42題を演習できる問題集です。

    因子分析は自分で解けます!
    Excelや公式は暗記不要!
    自力で導出できるぜ!

    1因子モデル導出過程をベースに本記事を解説します。1因子モデルの導出過程は関連記事で解説しています。先に確認ください。

    因子分析の1因子モデルが導出できる
    因子分析が説明できますか?主成分分析との違いが明確に数式を使って説明できますか?本記事では、因子分析の最も基本的な1因子モデルにおける分析方法をわかりやすく解説します。多変量解析を学ぶ人は必読です。

    ①2因子モデルを式で表現

    下表のように、例えば、あるデータがあり、変数x,y,zがあるとしましょう。

    No \(x\) \(y\) \(z\)
    1 \(x_{1}\) \(y_{1}\) \(z_{1}\)
    2 \(x_{2}\) \(y_{2}\) \(z_{2}\)
    n \(x_{n}\) \(y_{n}\) \(z_{n}\)

    このデータを、
    主成分分析のように、2つの共通変数F、Gに集約できなか?
    を考えます。

    つまり式と図で表現すると、
    \(
    \left(
    \begin{array}{c}
    x_i \\
    y_i \\
    z_i
    \end{array}
    \right)
    \)=\(F_i\)\(
    \left(
    \begin{array}{c}
    a_{x}\\
    a_{y}\\
    a_{z}
    \end{array}
    \right)
    \)+\(G_i\)\(
    \left(
    \begin{array}{c}
    b_{x}\\
    b_{y}\\
    b_{z}
    \end{array}
    \right)
    \)+\(
    \left(
    \begin{array}{c}
    e_{xi}\\
    e_{yi}\\
    e_{zi}
    \end{array}
    \right)
    \)

    各値を共通因子と誤差に相当する独自因子に分割します。

    因子分析

    式と図から、

    因子分析

    ●定数である因子負荷量\(a,b\)
    ●変数である共通因子F,G
    ●変数である誤差でもある独自因子e
    にわけて、
    ●変数である共通因子F,Gに意味を持たせる
    をやるのが因子分析です。

    数式を使って、わかりやすく因子分析を導出していきます。

    ➁モデル式から分散・共分散を導出

    モデル式から分散・共分散を導出

    3変数\(x,y,z\)で、次の分散
    \(s_x^2\),\(s_y^2\),\(s_z^2\)
    と共分散
    \(s_{xy}\),\(s_{xz}\),\(s_{yz}\)
    を考えます。

    分散\(s_x^2\)

    \(s_x^2\),\(s_y^2\),\(s_z^2\)のうち、\(s_x^2\)を代表として計算します。
    \(s_x^2\)=\(V(a_x F+b_x G+ e_x)\)
    分散の加法性から
    =\(a_x^2 V(F)+b_x^2 V(G)+V(e_x)\)
    +2\(a_x b_x Cov(F,G)\)+ 2\(a_x Cov(F,e_x)\)+ 2\(b_x Cov(G,e_x)\)
    と計算できます。

    \(s_y^2\),\(s_z^2\)は同様に計算すると、
    \(s_y^2\)=\(a_y^2 V(F)+b_y^2 V(G)+V(e_y)\)
    +2\(a_y b_y Cov(F,G)\)+ 2\(a_y Cov(F,e_y)\)+ 2\(b_y Cov(G,e_y)\)
    \(s_z^2\)=\(a_z^2 V(F)+b_z^2 V(G)+V(e_z)\)
    +2\(a_z b_z Cov(F,G)\)+ 2\(a_z Cov(F,e_z)\)+ 2\(b_z Cov(G,e_z)\)
    ですね。式は1因子モデルより長くなりましたが、機械的に計算できます。

    共分散\(s_{xy}\)

    \(s_{xy}\),\(s_{yz}\),\(s_{xz}\)のうち、\(s_{xy}\)を代表として計算します。
    \(s_{xy}\)=\(Cov(a_x F+b_x G+e_x, a_y F+b_y G+e_y)\)
    分散の加法性から
    =\(a_x a_y V(F)+a_x b_y Cov(F,G)+a_x Cov(F,e_y)\)
    +\(a_y b_x Cov(G,F)+b_x b_y V(G)+b_x Cov(G,e_y)\)
    +\(a_y Cov(e_x,F)+b_y Cov(e_x,G)+Cov(e_x,e_y)\)
    と計算できます。

    \(s_{yz}\),\(s_{xz}\)も同様に計算すると、
    \(s_{yz}\)=\(Cov(a_y F+b_y G+e_y, a_z F+b_z G+e_z)\)
    =\(a_y a_z V(F)+a_y b_z Cov(F,G)+a_y Cov(F,e_z)\)
    +\(a_z b_y Cov(G,F)+b_y b_z V(G)+b_y Cov(G,e_z)\)
    +\(a_z Cov(e_y,F)+b_z Cov(e_y,G)+Cov(e_y,e_z)\)

    \(s_{xz}\)=\(Cov(a_x F+b_x G+e_x, a_z F+b_z G+e_z)\)
    =\(a_x a_z V(F)+a_x b_z Cov(F,G)+a_x Cov(F,e_z)\)
    +\(a_z b_x Cov(G,F)+b_x b_z V(G)+b_x Cov(G,e_z)\)
    +\(a_z Cov(e_x,F)+b_z Cov(e_x,G)+Cov(e_x,e_z)\)
    と計算できます。

    ➂仮定を入れて式を簡略化

    式を簡略化するため仮定を入れる

    分散の式と共分散の式
    が長い式なので、仮定を入れて式を簡略化
    します。

    1. 因子間は独立とする
    2. 変数を標準化(平均0,標準偏差1)とする

    つまり、

    1. 独立⇒\(Cov(●,□\))=0
    2. 標準化⇒\(S_x^2\)、\(S_y^2\)、\(S_z^2\)、\(V(F)\), \(V(G)\)はすべて1

    では簡略化してみます。

    分散を簡略化

    ●分散の式
    \(s_x^2\)=1
    =\(a_x^2\)\(V(F)\)(1)+\(b_x^2\)\(V(G) \)(1)+\(V(e_x)\)
    +2\(a_x b_x Cov(F,G)\)+ 2\(a_x Cov(F,e_x)\)+ 2\(b_x Cov(G,e_x)\)
    \(a_x^2\)+\(b_x^2\)+\(V(e_x)\)=1
    と簡略化できます。

    \(s_y^2\),\(s_z^2\)は同様に計算すると、
    ●\(s_y^2\)⇒
    \(a_y^2\)+\(b_y^2\)+\(V(e_y)\)=1
    ●\(s_z^2\)⇒
    \(a_z^2\)+\(b_z^2\)+\(V(e_z)\)=1
    と簡略化できます。

    \(a_x^2\)+\(b_x^2\)+\(V(e_x)\)=1
    \(a_y^2\)+\(b_y^2\)+\(V(e_y)\)=1
    \(a_z^2\)+\(b_z^2\)+\(V(e_z)\)=1

    共分散を簡略化

    ●共分散の式

    \(s_{xy}\)=\(\frac{s_{xy}}{1×1}\)=
    \(\frac{s_{xy}}{ s_x^2 s_y^2}\)=\(r_{xy}\)(相関係数)として、
    \(s_{xy}\)=\(r_{xy}\)
    =\(a_x a_y\)\(V(F)\)(1)+\(a_x b_y Cov(F,G)+a_x Cov(F,e_y)\)
    +\(a_y b_x Cov(G,F)\)+\(b_x b_y\)\(V(G)\)(1)+\(b_x Cov(G,e_y)\)
    +\(a_y Cov(e_x,F)+b_y Cov(e_x,G)+Cov(e_x,e_y)\)
    \(r_{xy}\)=\(a_x a_y\)+\(b_x b_y\)
    と計算できます。

    \(s_{yz}\),\(s_{xz}\)も同様に計算すると、
    ●\(s_{yz}\)⇒
    \(r_{yz}\)=\(a_y a_z\)+\(b_y b_z\)
    ●\(s_{xz}\)⇒
    \(r_{xz}\)=\(a_x a_z\)+\(b_x b_z\)
    と計算できます。

    \(r_{xy}\)=\(a_x a_y\)+\(b_x b_y\)
    \(r_{yz}\)=\(a_y a_z\)+\(b_y b_z\)
    \(r_{xz}\)=\(a_x a_z\)+\(b_x b_z\)

    ➃因子負荷量を計算

    因子負荷量を求める方程式

    先の結果をまとめると、

    \(a_x^2\)+\(b_x^2\)+\(V(e_x)\)=1
    \(a_y^2\)+\(b_y^2\)+\(V(e_y)\)=1
    \(a_z^2\)+\(b_z^2\)+\(V(e_z)\)=1

    \(r_{xy}\)=\(a_x a_y\)+\(b_x b_y\)
    \(r_{yz}\)=\(a_y a_z\)+\(b_y b_z\)
    \(r_{xz}\)=\(a_x a_z\)+\(b_x b_z\)

    から、\(a_○\),\(b_○\)を計算すればOKですが、

    1因子モデルと違って
    手計算はかなりキツイ。。。

    なので、最小二乗法を活用してExcelで計算します。

    SMC法から因子負荷量の2乗和を計算

    相関係数行列\(R\)の逆行列の\(ii\)要素を\(r^{ii}\)として、
    \(h_i^2\)=1-\(\frac{1}{r^{ii}}\)
    \(h_i^2\)=\(a_i^2\)+\(b_i^2\)
    \(V(e_i)\)=1-\(h_i^2\)
    の関係式を使って計算する方法です。この理論の背景は現在調査中です。分かり次第報告します。

    因子負荷量を最小二乗法から計算

    SMC法を使って
    ●\(h_x^2\)=\(a_x^2\)+\(b_x^2\)
    ●\(h_y^2\)=\(a_y^2\)+\(b_y^2\)
    ●\(h_z^2\)=\(a_z^2\)+\(b_z^2\)
    から、求めます。

    \(h_x^2\)=\(a_x^2\)+\(b_x^2\)
    \(h_y^2\)=\(a_y^2\)+\(b_y^2\)
    \(h_z^2\)=\(a_z^2\)+\(b_z^2\)

    \(r_{xy}\)=\(a_x a_y\)+\(b_x b_y\)
    \(r_{yz}\)=\(a_y a_z\)+\(b_y b_z\)
    \(r_{xz}\)=\(a_x a_z\)+\(b_x b_z\)

    ここで、\(Q\)を
    \(Q\)=\(((a_x^2+b_x^2)-h_x^2)^2\)
    +\(((a_y^2+b_y^2)-h_y^2)^2\)
    +\(((a_z^2+b_z^2)-h_z^2)^2\)
    +2\((( a_x a_y+ b_x b_y)- r_{xy}^2)^2\)
    +2\((( a_y a_z+ b_y b_z)- r_{yz}^2)^2\)
    +2\((( a_x a_z+ b_x b_z)- r_{xz}^2)^2\)
    と定義して、この\(Q\)が最小値(なるべく0)となる場合を
    Excelで計算してもらいます。

    最小二乗法の計算をExcelに託す

    \(Q\)の式を行列表記します。

    \(Q\)=\((\left(
    \begin{array}{cccc}
    h_x^2 & r_{xy} & r_{xz} \\
    r_{xy} & h_y^2 & r_{xy} \\
    r_{xz} & r_{xy} & h_z^2
    \end{array}
    \right)\)
    -\(\left(
    \begin{array}{cccc}
    a_x^2+b_x^2 & a_x a_y+ b_x b_y & a_x a_z+ b_x b_z \\
    a_x a_y+ b_x b_y & a_y^2+b_y^2 & a_y a_z+ b_y b_z \\
    a_x a_z+ b_x b_z & a_y a_z+ b_y b_z & h_z^2
    \end{array}
    \right))^2
    \)

    上の式を満たすように、
    \(a_○\),\(b_○\)の値を数値計算から求めます。

    因子分析

    具体的な計算は、関連記事の計算編で解説します。

    因子負荷量
    \(a_○\),\(b_□\)が求まります。
    ただし、注意してほしいのは、
    因子負荷量\(a_○\),\(b_□\)
    求める方程式は自由度が残るので、
    因子負荷量は1組ではありませんし、
    数値解析の誤差が残ります。

    ➄共通因子と誤差を計算

    あとは、誤差と共通因子を計算すれば、因子分析の一連の流れが計算できます。

    誤差を計算

    誤差\(V(e_x)\), \(V(e_y)\), \(V(e_z)\)は関係式から計算できます。

    誤差はSMC法から求められます。
    ●\(V(e_x)\)=1-\(h_x^2\)
    ●\(V(e_y)\)=1-\(h_y^2\)
    ●\(V(e_z)\)=1-\(h_z^2\)

    計算はできるのですが、1つ問題があります。

    誤差の分散は計算できるが、個別の誤差の値は別の方法で計算が必要。

    実は共通因子Fの各値を計算してから、個別の誤差の値を計算します。

    共通因子Fを計算

    実は、推定方法から計算します。この推定方法の導出はQCプラネッツで調査中です。

    共通因子Fの計算方法

    共通因子\(F\)=\(ZR^{-1} A\)
    ただし、
    ●\(Z\):標準化データ行列(\(x_i,y_i,z_i\)は標準化対応済が前提)
    ●\(R\):相関係数行列
    ●\(A\):因子負荷量ベクトル
    (1因子モデルはベクトル、2因子以上なら行列)

    3変数、2因子モデルの場合、具体的に記述すると

    \(
    \left(
    \begin{array}{c}
    F_1 & G_1\\
    F_2 & G_2\\
    \vdots \\
    F_n & G_2
    \end{array}
    \right)
    \)
    =\(\left(
    \begin{array}{cccc}
    x_{1} & y_{1} & z_{1} \\
    x_{2} & y_{2} & z_{2} \\
    \vdots & \vdots & \vdots \\
    x_{n} & y_{n} & z_{n}
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{cccc}
    h_x^2 & r_{xy} & r_{xz} \\
    r_{xy} & h_y^2 & r_{yz} \\
    r_{xz} & r_{xy} & h_z^2
    \end{array}
    \right)^{-1}
    \)\(
    \left(
    \begin{array}{c}
    a_x & b_x \\
    a_y & b_y \\
    a_z & b_z
    \end{array}
    \right)
    \)
    で計算できます。

    誤差Eを計算

    誤差Eは残りなので、上の式を使うと、

    \(\left(
    \begin{array}{cccc}
    x_1 & y_1 & z_1 \\
    x_2 & y_2 & z_2 \\
    \vdots & \vdots & \vdots \\
    x_n & y_n & z_n
    \end{array}
    \right)
    \)
    =\(
    \left(
    \begin{array}{c}
    F_1 \\
    F_2 \\
    \vdots \\
    F_n
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{cccc}
    a_x & a_y & a_z
    \end{array}
    \right)
    \)
    +\(
    \left(
    \begin{array}{c}
    G_1 \\
    G_2 \\
    \vdots \\
    G_n
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{cccc}
    b_x & b_y & b_z
    \end{array}
    \right)
    \)
    +\(\left(
    \begin{array}{cccc}
    e_{x1} & e_{y1} & e_{z1} \\
    e_{x2} & e_{y2} & e_{z2} \\
    \vdots & \vdots & \vdots \\
    e_{xn} & e_{yn} & e_{zn}
    \end{array}
    \right)
    \)

    から、誤差行列
    \(\left(
    \begin{array}{cccc}
    e_{x1} & e_{y1} & e_{z1} \\
    e_{x2} & e_{y2} & e_{z2} \\
    \vdots & \vdots & \vdots \\
    e_{xn} & e_{yn} & e_{zn}
    \end{array}
    \right)
    \)
    の個々の値が計算できます。

    ここまで、各値を計算した上で、共通因子F,Gの意味を考えて、因子分析ができたといえます。

    ⑥因子分析を解析する際の注意点

    注意点

    一連の流れを解説してきましたが、どうでしょうか?

    おそらく、以下の点が因子分析するとき注意が必要です。

    1. 因子分析という割に、自分で因子が設定できない(ならば主成分分析でいいじゃん!)
    2. 因子負荷量を求める方程式は自由度が残るため、解は1つではない
    3. SMC法などの手法を借りて解くので、精度は低下する
    4. 数値解析解から因子F,Gの意味を考えても、結果の精度は低い
    5. 2因子モデルで精度が高くないので、多因子になると何を解析しているかがわからなくなる
    因子分析は何をやっているのか?よくわからない
    難しい手法の割に得るものが少ないと
    QCプラネッツは思います。
    因子分析の解析フローを理解して
    分析から何を得たいのかはよく考えて使う必要があります。

    まとめ

    「因子分析の2因子モデルが導出できる」を解説しました。

    • ①1因子モデルを式で表現
    • ➁モデル式から分散・共分散を導出
    • ➂仮定を入れて式を簡略化
    • ➃因子負荷量を計算
    • ➄共通因子と誤差を計算
    • ⑥因子分析を解析する際の注意点

  • 因子分析の1因子モデルが計算できる

    因子分析の1因子モデルが計算できる

    「因子分析ってどうやって解くのかがわからない」などと困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    因子分析の1因子モデルが計算できる

    おさえておきたいポイント

    • ①データ事例
    • ➁モデル式から分散・共分散を導出
    • ➂因子負荷量を計算
    • ➃共通因子と誤差を計算
    [themoneytizer id=”105233-2″]
    因子分析は自分で解けます!
    Excelや公式は暗記不要!
    自力で導出できるぜ!

    この記事では、導出過程はすでに関連記事で解説しています。先に確認ください。導出過程を見ながら本記事では実際に計算して解いていきます。

    因子分析の1因子モデルが導出できる
    因子分析が説明できますか?主成分分析との違いが明確に数式を使って説明できますか?本記事では、因子分析の最も基本的な1因子モデルにおける分析方法をわかりやすく解説します。多変量解析を学ぶ人は必読です。

    ①データ事例

    データ事例

    下表のように、例えば、あるデータがあり、変数x,y,zがあるとしましょう。

    No A B C
    1 30 48 54
    2 60 50 60
    3 40 42 55
    4 80 70 68
    5 56 54 71
    6 65 70 76
    7 22 28 30
    8 100 72 96
    9 65 70 88
    10 32 46 52
    合計 550 550 650
    平均 55 55 65
    標準偏差 23.11 14.21 18.15

    このデータを、
    主成分分析のように、ある共通変数Fに集約できなか?
    を考えます。

    1因子モデルを式で表現

    つまり式と図で表現すると、
    \(
    \left(
    \begin{array}{c}
    x_i \\
    y_i \\
    z_i
    \end{array}
    \right)
    \)=\(
    \left(
    \begin{array}{c}
    a F_i\\
    b F_i\\
    z F_i
    \end{array}
    \right)
    \)+\(
    \left(
    \begin{array}{c}
    e_{xi}\\
    e_{yi}\\
    e_{zi}
    \end{array}
    \right)
    \)

    各値を共通因子と誤差に相当する独自因子に分割します。

    因子分析

    式と図から、

    ●定数である因子負荷量
    ●変数である共通因子F
    ●変数である誤差でもある独自因子e
    にわけて、
    ●変数である共通因子Fに意味を持たせる
    をやるのが因子分析です。

    数式を使って、わかりやすく因子分析を導出していきます。

    データを標準化

    因子分析はモデル式から分散・共分散を導出するときに、データの標準化が必須です。先にデータを標準化しましょう。

    標準化は\(z\)=\(\frac{x-\bar{x}}{σ}\)です。

    No A B C
    1 -1.08 -0.49 -0.61
    2 0.22 -0.35 -0.28
    3 -0.65 -0.92 -0.55
    4 1.08 1.06 0.17
    5 0.04 -0.07 0.33
    6 0.43 1.06 0.61
    7 -1.43 -1.9 -1.93
    8 1.95 1.2 1.71
    9 0.43 1.06 1.27
    10 -0.99 -0.63 -0.72
    sum 0 0 0
    ave 0 0 0
    sig 1 1 1

    また、分散・共分散も計算すると以下のとおりです。

    \(s_x\) \(s_y\) \(s_z\)
    分散 1 1 1
    \(s_{xy}\) \(s_{yz}\) \(s_{xz}\)
    共分散 0.878 0.874 0.919

    ➁モデル式から分散・共分散を導出

    詳細な導出は関連記事で

    分散・共分散の導出過程も関連記事で解説しています。先にご確認ください。

    因子分析の1因子モデルが導出できる
    因子分析が説明できますか?主成分分析との違いが明確に数式を使って説明できますか?本記事では、因子分析の最も基本的な1因子モデルにおける分析方法をわかりやすく解説します。多変量解析を学ぶ人は必読です。

    結果まとめ

    分散と共分散の結果は以下のとおりになります。

    ●1=\(a^2+V(e_x)\)
    ●1=\(b^2+V(e_y)\)
    ●1=\(c^2+V(e_z)\)
    ●\(s_{xy}\)=\(ab\)
    ●\(s_{yz}\)=\(bc\)
    ●\(s_{xz}\)=\(ac\)

    ➃因子負荷量を計算

    因子負荷量を計算

    しかも、共分散\(s_{xy}\),\(s_{yz}\),\(s_{xz}\)は
    実データから計算できるので、
    \(a,b,c\)が計算できますね。

    実データから
    \(s_{xy}\)×\(s_{yz}\)×\(s_{xz}\)=\(a^2 b^2 c^2\)
    この平方根は\(abc\)ですから、
    \(abc\)と\(s_{xy}\),\(s_{yz}\),\(s_{xz}\)の比が
    \(a,b,c\)となり、因子負荷量を計算することができます。

    実際に、

    ●\(s_{xy}\)=\(ab\)=0.878
    ●\(s_{yz}\)=\(bc\)=0.874
    ●\(s_{xz}\)=\(ac\)=0.919

    全部掛けると
    \(a^2 b^2 c^2\)=0.878×0.874×0.919=0.840
    \(abc\)=0.840

    ●\(a\)=\(abc/s_{yz}\)=0.840/0.919=0.914
    ●\(b\)=\(abc/s_{xz}\)=0.840/0.875=0.960
    ●\(c\)=\(abc/s_{xy}\)=0.840/0.878=0.957
    となります。

    ➄共通因子と誤差を計算

    あとは、誤差と共通因子を計算すれば、因子分析の一連の流れが計算できます。

    誤差を計算

    誤差\(V(e_x)\), \(V(e_y)\), \(V(e_z)\)は関係式から計算できます。

    ●\(V(e_x)\)=1-\(a^2\)=1-0.9142=0.165
    ●\(V(e_y)\)=1-\(b^2\)=1-0.9602=0.078
    ●\(V(e_z)\)=1-\(c^2\)=1-0.9572=0.084

    計算はできるのですが、1つ問題があります。

    誤差の分散は計算できるが、個別の誤差の値は別の方法で計算が必要。

    実は共通因子Fの各値を計算してから、個別の誤差の値を計算します。

    ここから

    共通因子Fを計算

    実は、推定方法から計算します。この推定方法の導出はQCプラネッツで調査中です。

    共通因子Fの計算方法

    共通因子\(F\)=\(ZR^{-1} A\)
    ただし、
    ●\(Z\):標準化データ行列
    ●\(R\):相関係数行列
    ●\(A\):因子負荷量ベクトル
    (1因子モデルはベクトル、2因子以上なら行列)

    3変数、1因子モデルの場合、具体的に記述すると

    \(
    \left(
    \begin{array}{c}
    F_1 \\
    F_2 \\
    \vdots \\
    F_n
    \end{array}
    \right)
    \)=\(\left(
    \begin{array}{cccc}
    x_{1} & y_{1} & z_{1} \\
    x_{2} & y_{2} & z_{2} \\
    \vdots & \vdots & \vdots \\
    x_{n} & y_{n} & z_{n}
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{cccc}
    1 & r_{xy} & r_{xz} \\
    r_{xy} & 1 & r_{yz} \\
    r_{xz} & r_{xy} & 1
    \end{array}
    \right)^{-1}
    \)\(
    \left(
    \begin{array}{c}
    a \\
    b \\
    c
    \end{array}
    \right)
    \)
    で計算できます。

    実際に計算してみましょう。

    \(\left(
    \begin{array}{c}
    F_1 \\
    F_2 \\
    F_3 \\
    F_4 \\
    F_5 \\
    F_6 \\
    F_7 \\
    F_8 \\
    F_9 \\
    F_{10} \\
    \end{array}
    \right)
    \)=\(\left(
    \begin{array}{cccc}
    -1.08 &-0.49 &-0.61 \\
    0.22 &-0.35 &-0.28 \\
    -0.65 &-0.92 &-0.55 \\
    1.08 &1.06 &0.17 \\
    0.04 &-0.07 &0.33 \\
    0.43 &1.06 &0.61 \\
    -1.43 &-1.9 &-1.93 \\
    1.95 &1.2 &1.71 \\
    0.43 &1.06 &1.27 \\
    -0.99 &-0.63 &-0.72 \\
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{cccc}
    1 & 0.3715 & 0.8745 \\
    0.3715 & 1 & 0.7316 \\
    0.8745 & 0.7316 & 1
    \end{array}
    \right)^{-1}
    \)\(
    \left(
    \begin{array}{c}
    0.914 \\
    0.960 \\
    0.957\end{array}
    \right)
    \)

    ここで、相関係数行列の逆行列は、
    \(\left(
    \begin{array}{cccc}
    12.44 & 7.18 & -16.13 \\
    7.18 & 6.29 & -10.89 \\
    -16.13 & -10.89 & 23.07
    \end{array}
    \right)^{-1}
    \)
    を使います。

    計算結果は、
    \(\left(
    \begin{array}{c}
    F_1 \\
    F_2 \\
    F_3 \\
    F_4 \\
    F_5 \\
    F_6 \\
    F_7 \\
    F_8 \\
    F_9 \\
    F_10 \\
    \end{array}
    \right)
    \)=\(\left(
    \begin{array}{c}
    -2.248 \\
    0.699 \\
    -2.123 \\
    4.857 \\
    -1.063 \\
    1.648 \\
    -2.189 \\
    2.801 \\
    -0.414 \\
    -1.968 \\
    \end{array}
    \right)
    \)

    誤差Eを計算

    誤差Eは残りなので、上の式を使うと、

    \(\left(
    \begin{array}{cccc}
    x_1 & y_1 & z_1 \\
    x_2 & y_2 & z_2 \\
    \vdots & \vdots & \vdots \\
    x_n & y_n & z_n
    \end{array}
    \right)
    \)=\(
    \left(
    \begin{array}{c}
    F_1 \\
    F_2 \\
    \vdots \\
    F_n
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{cccc}
    a & b & c
    \end{array}
    \right)
    \)+
    \(\left(
    \begin{array}{cccc}
    e_{x1} & e_{y1} & e_{z1} \\
    e_{x2} & e_{y2} & e_{z2} \\
    \vdots & \vdots & \vdots \\
    e_{xn} & e_{yn} & e_{zn}
    \end{array}
    \right)
    \)

    から、誤差行列
    \(\left(
    \begin{array}{cccc}
    e_{x1} & e_{y1} & e_{z1} \\
    e_{x2} & e_{y2} & e_{z2} \\
    \vdots & \vdots & \vdots \\
    e_{xn} & e_{yn} & e_{zn}
    \end{array}
    \right)
    \)
    の個々の値が計算できます。

    実際に計算すると、下表になります。

    ei A B C
    1 0.973 1.666 1.545
    2 -0.423 -1.023 -0.944
    3 1.291 1.123 1.48
    4 -3.357 -3.609 -4.483
    5 1.015 0.95 1.348
    6 -1.073 -0.527 -0.971
    7 0.573 0.201 0.167
    8 -0.613 -1.493 -0.972
    9 0.811 1.454 1.663
    10 0.804 1.257 1.167

    因子分析結果をまとめると、下図になります。

    因子分析

    ここまで、各値を計算した上で、共通因子Fの意味を考えて、因子分析ができたといえます。

    まとめ

    「因子分析の1因子モデルが計算できる」を解説しました。

    • ①データ事例
    • ➁モデル式から分散・共分散を導出
    • ➂因子負荷量を計算
    • ➃共通因子と誤差を計算

  • 因子分析の1因子モデルが導出できる

    因子分析の1因子モデルが導出できる

    「因子分析ってどうやって解くのかがわからない」などと困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    因子分析の1因子モデルが導出できる

    おさえておきたいポイント

    • ①1因子モデルを式で表現
    • ➁モデル式から分散・共分散を導出
    • ➂仮定を入れて式を簡略化
    • ➃因子負荷量を計算
    • ➄共通因子と誤差を計算
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】多変量解析問題集を販売します!

    QC検定®1級合格したい方、多変量解析をしっかり学びたい方におススメです。
    【QC検定®合格】「多変量解析」問題集を販売します! 内容は、①回帰分析 単回帰分析・重回帰分析 の復習、➁ 主成分分析、➂判別分析、➃因子分析、➄数量化分析の5章全42題を演習できる問題集です。

    因子分析は自分で解けます!
    Excelや公式は暗記不要!
    自力で導出できるぜ!

    ①1因子モデルを式で表現

    下表のように、例えば、あるデータがあり、変数x,y,zがあるとしましょう。

    No \(x\) \(y\) \(z\)
    1 \(x_{1}\) \(y_{1}\) \(z_{1}\)
    2 \(x_{2}\) \(y_{2}\) \(z_{2}\)
    n \(x_{n}\) \(y_{n}\) \(z_{n}\)

    このデータを、
    主成分分析のように、ある共通変数Fに集約できなか?
    を考えます。

    つまり式と図で表現すると、
    \(
    \left(
    \begin{array}{c}
    x_i \\
    y_i \\
    z_i
    \end{array}
    \right)
    \)=\(
    \left(
    \begin{array}{c}
    a F_i\\
    b F_i\\
    c F_i
    \end{array}
    \right)
    \)+\(
    \left(
    \begin{array}{c}
    e_{xi}\\
    e_{yi}\\
    e_{zi}
    \end{array}
    \right)
    \)

    因子分析

    各値を共通因子と誤差に相当する独自因子に分割します。

    因子分析

    式と図から、

    ●定数である因子負荷量
    ●変数である共通因子F
    ●変数である誤差でもある独自因子e
    にわけて、
    ●変数である共通因子Fに意味を持たせる
    をやるのが因子分析です。

    数式を使って、わかりやすく因子分析を導出していきます。

    ➁モデル式から分散・共分散を導出

    モデル式から分散・共分散を導出

    3変数\(x,y,z\)で、次の分散
    \(s_x^2\),\(s_y^2\),\(s_z^2\)
    と共分散
    \(s_{xy}\),\(s_{xz}\),\(s_{yz}\)
    を考えます。

    分散\(s_x^2\)

    \(s_x^2\),\(s_y^2\),\(s_z^2\)のうち、\(s_x^2\)を代表として計算します。
    \(s_x^2\)=\(V(aF+e_x)\)
    分散の加法性から
    =\(a^2V(F)+2aCov(F,e_x)+V(e_x)\)
    と計算できます。

    \(s_y^2\),\(s_z^2\)は同様に計算すると、
    \(s_y^2\)=\(a^2V(F)+2aCov(F,e_y)+V(e_y)\)
    \(s_z^2\)=\(a^2V(F)+2aCov(F,e_z)+V(e_z)\)
    ですね。

    共分散\(s_{xy}\)

    \(s_{xy}\),\(s_{yz}\),\(s_{xz}\)のうち、\(s_{xy}\)を代表として計算します。
    \(s_{xy}\)=\(Cov(aF+e_x,bF+e_y)\)
    分散の加法性から
    =\(ab Cov(F,F)+aCov(F,e_y)+bCov(e_x,)+Cov(e_x,e_y)\)
    =\(ab V(F)+aCov(F,e_y)+bCov(e_x,F)+Cov(e_x,e_y)\)
    と計算できます。

    \(s_{yz}\),\(s_{xz}\)も同様に計算すると、
    \(s_{yz}\)=\(bc V(F)+bCov(F,e_z)+cCov(e_y,F)+Cov(e_y,e_z)\)
    \(s_{xz}\)=\(ac V(F)+aCov(F,e_z)+cCov(e_x,F)+Cov(e_x,e_z)\)
    となります。

    ➂仮定を入れて式を簡略化

    式を簡略化するため仮定を入れる

    ●分散の式
    \(s_x^2\)=\(a^2V(F)+2aCov(F,e_x)+V(e_x)\)
    ●共分散の式
    \(s_{xy}\)=\(ab V(F)+aCov(F,e_y)+bCov(e_x,F)+Cov(e_x,e_y)\)
    が長い式なので、仮定を入れて式を簡略化します。

    1. 因子間は独立とする
    2. 変数を標準化(平均0,標準偏差1)とする

    つまり、

    1. 独立⇒\(Cov(●,□\))=0
    2. 標準化⇒\(S_x^2\)、\(S_y^2\)、\(S_z^2\)、\(V(F)\)はすべて1

    では簡略化してみます。

    分散を簡略化

    ●分散の式
    \(s_x^2\)=\(a^2V(F)+2aCov(F,e_x)+V(e_x)\)
    1=\(a^2+V(e_x)\)
    となり、同様に計算して結果をまとめると、

    ●1=\(a^2+V(e_x)\)
    ●1=\(b^2+V(e_y)\)
    ●1=\(c^2+V(e_z)\)
    と簡単になりましたね。

    共分散を簡略化

    ●共分散の式
    \(s_{xy}\)=\(ab\)
    となり、同様に計算して結果をまとめると、

    ●\(s_{xy}\)=\(ab\)
    ●\(s_{yz}\)=\(bc\)
    ●\(s_{xz}\)=\(ac\)
    と簡単になりましたね。

    ➃因子負荷量を計算

    因子負荷量を計算

    しかも、共分散\(s_{xy}\),\(s_{yz}\),\(s_{xz}\)は
    実データから計算できるので、
    \(a,b,c\)が計算できますね。

    実データから
    \(s_{xy}\)×\(s_{yz}\)×\(s_{xz}\)=\(a^2 b^2 c^2\)
    この平方根は\(abc\)ですから、
    \(abc\)と\(s_{xy}\),\(s_{yz}\),\(s_{xz}\)の比が
    \(a,b,c\)となり、因子負荷量を計算することができます。

    ➄共通因子と誤差を計算

    あとは、誤差と共通因子を計算すれば、因子分析の一連の流れが計算できます。

    誤差を計算

    誤差\(V(e_x)\), \(V(e_y)\), \(V(e_z)\)は関係式から計算できます。

    ●\(V(e_x)\)=1-\(a^2\)
    ●\(V(e_y)\)=1-\(b^2\)
    ●\(V(e_z)\)=1-\(c^2\)

    計算はできるのですが、1つ問題があります。

    誤差の分散は計算できるが、個別の誤差の値は別の方法で計算が必要。

    実は共通因子Fの各値を計算してから、個別の誤差の値を計算します。

    共通因子Fを計算

    実は、推定方法から計算します。この推定方法の導出はQCプラネッツで調査中です。

    共通因子Fの計算方法

    共通因子\(F\)=\(ZR^{-1} A\)
    ただし、
    ●\(Z\):標準化データ行列
    ●\(R\):相関係数行列
    ●\(A\):因子負荷量ベクトル
    (1因子モデルはベクトル、2因子以上なら行列)

    3変数、1因子モデルの場合、具体的に記述すると

    \(
    \left(
    \begin{array}{c}
    F_1 \\
    F_2 \\
    \vdots \\
    F_n
    \end{array}
    \right)
    \)=\(\left(
    \begin{array}{cccc}
    x_{1} & y_{1} & z_{1} \\
    x_{2} & y_{2} & z_{2} \\
    \vdots & \vdots & \vdots \\
    x_{n} & y_{n} & z_{n}
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{cccc}
    1 & r_{xy} & r_{xz} \\
    r_{xy} & 1 & r_{yz} \\
    r_{xz} & r_{xy} & 1
    \end{array}
    \right)^{-1}
    \)\(
    \left(
    \begin{array}{c}
    a \\
    b \\
    c
    \end{array}
    \right)
    \)
    で計算できます。

    誤差Eを計算

    誤差Eは残りなので、上の式を使うと、

    \(\left(
    \begin{array}{cccc}
    x_1 & y_1 & z_1 \\
    x_2 & y_2 & z_2 \\
    \vdots & \vdots & \vdots \\
    x_n & y_n & z_n
    \end{array}
    \right)
    \)=\(
    \left(
    \begin{array}{c}
    F_1 \\
    F_2 \\
    \vdots \\
    F_n
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{cccc}
    a & b & c
    \end{array}
    \right)
    \)+
    \(\left(
    \begin{array}{cccc}
    e_{x1} & e_{y1} & e_{z1} \\
    e_{x2} & e_{y2} & e_{z2} \\
    \vdots & \vdots & \vdots \\
    e_{xn} & e_{yn} & e_{zn}
    \end{array}
    \right)
    \)

    から、誤差行列
    \(\left(
    \begin{array}{cccc}
    e_{x1} & e_{y1} & e_{z1} \\
    e_{x2} & e_{y2} & e_{z2} \\
    \vdots & \vdots & \vdots \\
    e_{xn} & e_{yn} & e_{zn}
    \end{array}
    \right)
    \)
    の個々の値が計算できます。

    ここまで、各値を計算した上で、共通因子Fの意味を考えて、因子分析ができたといえます。

    まとめ

    「因子分析の1因子モデルが導出できる」を解説しました。

    • ①1因子モデルを式で表現
    • ➁モデル式から分散・共分散を導出
    • ➂仮定を入れて式を簡略化
    • ➃因子負荷量を計算
    • ➄共通因子と誤差を計算

  • 背理法がわかる(背理法は高校数学で最高級の証明方法)

    背理法がわかる(背理法は高校数学で最高級の証明方法)

    「背理法がよくわからない」、などと困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    02-06_背理法がわかる
    • ①背理法は高校数学で最高級の証明方法
    • ➁おさえるべき重要問題
    • ➂解法
    • ➃全問題の解説は問題集にあります
    [themoneytizer id=”105233-2″]

    数と式は、基礎は簡単
    でも、発展は最難な領域

    高校数学で一番難しい単元は何?と聞かれて
    「数Ⅲの微積」という人は単に力がないだけ
    数学ができる人は、「数Aの数と式」と答える
    「数Ⅲの微積」は基礎は難しいが、その分応用・発展問題はないから、基礎ができたらすぐに入試問題が解ける!
    逆に「数Aの数と式」は基礎は簡単な分、いくらでも難しくできる!難関大学の論証問題はすべて「数Aの数と式」!
    2章の「数と式」は
    基礎をしっかりおさえつつ
    難関問題の入り口まで解説します。

    ①背理法は高校数学で最高級の証明方法

    背理法は京大レベル以上

    高校数学には、数学的帰納法、背理法、などいろいろな証明方法がありますが、

    圧倒的に背理法が難しい
    京大レベル以上を狙うには、背理法を自由自在に論じる力が必須
    京大以下は、単なる
    \(\sqrt{3}\)を無理数と証明する特殊な証明方法
    という解釈でいい

    背理法が私も受験生時代も使いこなせていなかったですね。
    むしろ機械的に処理できる数学的帰納法の方が圧倒的に簡単でしたね。

    背理法は何が難しいのか?

    では、背理法は何が難しいのか?を解説すると

    手法は1つ反例を示して矛盾を言えばいいが、
    反例の導き方は決まっていない
    自分で考えて論じていくのが高校生にはキツイ

    国語で反論する内容を数式で解いて、相手を説得させる難しさが背理法にはあります。

    背理法は1つ反論を導けばOK

    とはいえ、手法はシンプルで、

    手法は1つ反例を示して矛盾を言えばいい

    反論を論述するアプローチが難しい

    1つは過去問やパターンの問題を集めて、そこ範囲から出題される問いはしっかり回答できるようにしておく必要がありますが、

    単に解き方を覚えるより、矛盾する反例をどう論じるかを考え抜くことが大事です。でも、これが難しいし、予備校でも解き方は教わるけど、習得方法までは身につかない

    このような高級な論証方法が入っているから、
    「高1の数と式が、高校数学の中で一番難しいんですよ」

    そんな難しい背理法の大事な問題を解説します。

    ➁おさえるべき重要問題

    問1

    【問1】
    (1)\(\sqrt{5}\)が無理数であることを示せ。
    (2)\(\frac{1}{\sqrt{2}}-\frac{1}{\sqrt{3}}\)が無理数であることを示せ。
    ただし、\(\sqrt{3}\)が無理数であることは証明せず使ってよい。

    問2

    【問2】
    方程式\(2x^3-x-3\)=0は有理数の解がないことを示せ。

    ➂解法

    本ブログでは、【問1】,【問2】を解説!

    背理法を解くポイント

    ポイントは4つあります。

    1. 無理数を証明するパターンで背理法の流れを理解する
    2. 逆を仮定した場合に1つ矛盾する例を導き出す
    3. 矛盾を導き方は問題によるので、ここは経験しかない
    4. 京大以上の大学を目指さないなら、背理法は捨ててもいい

    上の4つを意識して解いてみましょう。

    問1の解法

    では、解いてみましょう。

    問(1)

    教科書に絶対ある問いですね。流れを理解しましょう。

    ①逆を仮定する

    \(\sqrt{5}\)が有理数と仮定し、
    \(\sqrt{5}\)=\(\frac{m}{n}\)
    (\(m,n\)は整数で互いに素)と置く。

    ➁①の仮定が矛盾する例を見つける
    (両辺)を2乗すると、
    5=\(\frac{m^2}{n^2}\)
    5\(n^2\)=\(m^2\)
    となる。

    \(n\)は整数なので、(左辺)は5の倍数になる。
    (右辺)も5の倍数が必要だから、\(m\)は5の倍数になる必要がある。

    \(m\)=5\(c\) ((\(c\)は整数)と置くと
    5\(n^2\)=\((5c)^2\)
    \(n^2\)=5\((c)^2\)
    となる。これを満たすには、
    \(n\)は5の倍数になる必要がある。

    となると、\(m,n\)が共に5の倍数になる必要があり、互いに素の条件に反する。

    よって、\(\sqrt{5}\)は無理数になる。

    とにかく、成り立たない理由を1つ
    無理矢理もっていっているのがわかりますね。
    これを高1の学生に教えるから、皆ピント来ないよね。
    推理小説にように、
    「こいつが犯人」と決めても、どうも矛盾する条件があるから
    「こいつは犯人じゃない」という流れと同じです。

    問(2)

    解き方は問(1)と同じです。どう反例を導くか? ここが難しい!

    ①逆を仮定する

    \(\frac{1}{\sqrt{2}}-\frac{1}{\sqrt{3}}\)が有理数と仮定し、
    \(\frac{1}{\sqrt{2}}-\frac{1}{\sqrt{3}}\)=\(r\)
    (\(r\)は有理数)と置く。

    ➁①の仮定が矛盾する例を見つける
    \(\frac{1}{\sqrt{2}}\)=\(r\)+\(\frac{1}{\sqrt{3}}\)と変形して

    (両辺)を2乗すると、
    \(\frac{1}{2}\)=\(r^2\)+\(\frac{2}{\sqrt{3}}r\)+\(\frac{1}{3}\)
    \(\frac{2}{\sqrt{3}}r\)=\(\frac{1}{6}\)-\(r^2\)
    \(\sqrt{3}\)=\(\frac{1-6r^2}{4r}\)

    ここで、 (右辺)は有理数であるが、(左辺)は無理数であるため、矛盾する。

    よって、\(\frac{1}{\sqrt{2}}-\frac{1}{\sqrt{3}}\)は無理数である。

    問2の解法

    同様に応用例を解きましょう。

    問(1)

    ①逆を仮定する

    方程式\(2x^3-x-3\)=0は有理数の解\(x\)=\(\frac{m}{n}\)
    (\(m,n\)は互いに素な整数)とおく。

    ここで、

    \(m,n\)互いに素な整数
    と3つ仮定を入れています。力技で矛盾する反例を見つけるためです。

    方程式\(2x^3-x-3\)=0は
    \(2(\frac{m}{n})^3-(\frac{m}{n})-3\)=0
    より、式を整理すると、
    2\(n^3\)=\(m^2(3m+n)\)

    ここで、\(m\)が偶数、\(n\)が奇数として
    ●\(m\)=\(2a+1\)
    ●\(n\)=\(2b\)
    (\(a,b\)とおく)
    とおくと

    (両辺)は
    16\((b)^3\)=\((2a+1)^2(2(3a+b)+1)\)
    となり、(左辺)は16の倍数であるが、(右辺)は奇数になり、
    (両辺)一致に矛盾する。

    よって、方程式\(2x^3-x-3\)=0は有理数の解がない

    いかがだったでしょうか。
    最初は背理法のパターン演習で慣れてから
    応用はとにかく矛盾する例を探す!
    矛盾するような仮定、条件、条件式を作って
    矛盾する反例を1つ見つけましょう。
    この論証が難しいですが、ビジネスにも活かせます!

    ➃全問題の解説は問題集にあります

    「第2章 数と式」で、大学受験も大学以降でも習得すべき、
    数と式の重要問題を解説しています。
    目次を紹介します。

    「第2章 数と式」の目次
    第2章 数と式

    02-01 恒等式
    02-02 因数分解
    02-03 整式の剰余
    02-04 整数の性質
    02-05 方程式の整数解
    02-06 背理法
    02-07 根号を含む計算
    02-08 指数と対数
    02-09 常用対数
    02-10 式の値
    02-11 不等式の証明・相加相乗平均

    問題集はメルカリでご購入いただけます。
    (現在問題集作成中。)

    問題集イメージ図(予定)

    是非、ブログを参考にいただき、ご購入よろしくお願いいたします。

    まとめ

    「02-06_背理法がわかる」を解説しました。

    • ①背理法は高校数学で最高級の証明方法
    • ➁おさえるべき重要問題
    • ➂解法
    • ➃全問題の解説は問題集にあります

  • 【まとめ】判別分析がわかる

    【まとめ】判別分析がわかる

    「判別分析がわからない」などと困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    【まとめ】判別分析がわかる

    おさえておきたいポイント

    • ①判別分析に使う2つの手法
    • ➁線形判別関数で判別分析
    • ➂マハラビノス距離で判別分析
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】多変量解析問題集を販売します!

    QC検定®1級合格したい方、多変量解析をしっかり学びたい方におススメです。
    【QC検定®合格】「多変量解析」問題集を販売します! 内容は、①回帰分析 単回帰分析・重回帰分析 の復習、➁ 主成分分析、➂判別分析、➃因子分析、➄数量化分析の5章全42題を演習できる問題集です。

    判別分析は自分で解けます!
    Excelや公式は暗記不要!
    自力で導出できるぜ!
    線形判別関数と
    マハラビノス距離は
    解き方の思想が異なる点を理解しよう!

    ①判別分析に使う2つの手法

    判別分析には、主に2つの手法があります。

    1. 線形判別関数
    2. マハラビノス距離

    そして、変数はn個を想定して判別分析していきますが、
    変数2個の2次元で、解き方をマスターしましょう。
    そして、ツールではなく手計算で解法を習得しましょう。

    線形判別関数もマハラビノス距離も
    データ群から情報量を最大限抜き取って判別する思想は同じだけど
    ●線形判別関数は平方和で評価
    ●マハラビノス距離は主成分分析から評価
    する点が違う。

    最もおさえておきたいポイント

    線形判別関数、マハラビノス距離の思想を理解することが最も大事!
    データ群から情報量を最大限抜き取って判別する思想は両方とも同じだけど
    ●線形判別関数は平方和で評価し、群間変動が最大となる(しっかり群どうしの差を抜き取る)条件で判別する。
    ●マハラビノス距離は情報量を最大限抜き取る主成分分析から評価
    とそれぞれ異なる手法で解いていきます。

    手法ばかり勉強するな!

    線形判別関数もマハラビノス距離の解き方を暗記して
    判別の結果の正誤判定率まで解けるようにして点数を稼ぐことよりも
    判別する思想をよく理解しましょう。ここが一番大事

    なので、解き方も大事ですが、考え方を意識して解説しております!

    線形判別関数について

    線形判別関数のポイント

    ●全変動STの一部である、群間変動SBが最大になる条件で判別するのが原則。
    ●ただし、SB/STの関数は変数の個数分、極値を持つので、その本数だけ線形判別関数が引ける。

    線形判別関数を解くプロセスでは特に意識しておく必要があります。

    マハラノビス距離について

    マハラノビス距離のポイント

    ●主成分分析方向を座標とした場合の距離がマハラビノス距離。
    ●距離の2乗を標本分散で割るイメージが強いが、それより主成分分析から導出する点が大事

    マハラビノス距離を解くプロセスでは特に意識しておく必要があります。

    ➁線形判別関数で判別分析

    線形判別関数をマスターすべく重要な関連記事を紹介します。
    線形判別関数をマスターするために必要なステップは、

    1. 線形判別関数の正負で判別する
    2. 線形判別関数が導出できる
    3. 線形判別関数が計算できて判別分析ができる

    の3ステップです。それぞれ、重要な関連記事を紹介します。

    線形判別関数の正負で判別する

    まず、線形判別関数を使って判別する基準は正負です。

    線形判別関数の正負がわかる
    判別分析に使う、線形判別関数の正負、0のイメージができますか? 本記事では、最も基本ベースとなる線形判別関数の値とそのイメージを高2数学で十分わかるように丁寧に解説します。簡単だからと思わず、丁寧に理解することが大事です。多変量解析を学ぶ人は必読です。

    線形判別関数が導出できる

    線形判別関数の導出過程を解説します。

    ●全変動STの一部である、群間変動SBが最大になる条件で判別するのが原則。
    ●ただし、SB/STの関数は変数の個数分、極値を持つので、その本数だけ線形判別関数が引ける。

    大事なポイントを意識しながら導出過程を見ましょう。

    線形判別関数Zの導出がわかる(2次元、平方和の分解)
    線形判別関数は自分で導出できますか? 本記事は線形判別関数を導出するための平方和の計算、平方和の分解を解説します。平方和の分解はQCすべての単元に必須なテクニックです。多変量解析を学ぶ人は必読です。

    線形判別関数が計算できて判別分析ができる

    導出過程が理解できたら、実際に計算しながら理解をさらに深めましょう。
    計算しながら、気になるポイントもまとめて関連記事で紹介します。

    線形判別関数が計算できる

    基本的な計算方法を解説します。2つの関連記事で解説します。

    線形判別関数が計算できる(2次元、その1)
    判別分析において、線形判別関数が計算できますか?本記事では2次元データを例に2記事にわたり線形判別関数の求め方をわかりやすく解説します。多変量解析を学ぶ人は必読です。

    線形判別関数が計算できる(2次元、その2)
    判別分析において、線形判別関数が計算できますか?本記事では2次元データを例に2記事にわたり線形判別関数の求め方をわかりやすく解説します。線形判別関数の結果と判別正誤率も解説します。多変量解析を学ぶ人は必読です。

    線形判別関数の傾きの数

    線形判別関数で判別できるようになると、

    何本、線形判別関数の直線が引けるか?

    が疑問になります。調べた結果、

    1. 傾きの数は、データの変数の種類の数が上限
    2. y切片の数は、自分で判別したい分だけ調整できる

    とわかりました。

    傾きの数は、データの変数の種類の数が上限である理由を解説します。

    2次元の線形判別関数の傾きは最大2種類である理由がわかる
    2次元の線形判別直線の傾きを相関比の微分から求める時、相関比は分母分子ともに2次式なので、微分すると分子が3次式にあり、傾きを満たす解が最大3つになるのではないか?と思い、実際計算すると確かに解は最大2個になります。ちょっと疑問に思ったこともブログで解説していきます。

    線形判別関数で多く分割する場合

    y切片の数は自分で調整できますが、数学的に導出・証明されているわけではない点は、やや面白味がたりませんが、多分割する場合の関連記事を紹介します。

    線形判別関数が計算できる(2次元で3群以上分割する場合)
    判別分析において、線形判別関数が計算できますか?本記事では2次元データを例に3分割する線形判別関数の求め方をわかりやすく解説します。線形判別関数の結果と判別正誤率も解説します。多変量解析を学ぶ人は必読です。

    ➂マハラビノス距離で判別分析

    次に、線形判別関数と思想が異なるマハラビノス距離の関連記事を紹介します。</p.

    マハラビノス距離は普段使わない!
    普段使いユークリッド距離とどう違うの?

    を特に意識しながら関連記事を読んでいただきたいです。

    関連記事の流れとして次の5つのステップがあります。

    1. マハラビノス距離が導出できる
    2. マハラビノス距離が計算できる
    3. マハラノビス距離と相関係数の関係がわかる
    4. マハラノビス距離から判別できる
    5. マハラノビス距離と線形判別関数を使った判別分析の違いがわかる

    マハラビノス距離が導出できる

    マハラノビス距離の式が難解で理解しにくいですよね。どこから導出されてきたか?を理解するところが最も重要です。

    マハラビノス距離が導出できる
    マハラビノス距離が導出できますか? 本記事では、マハラビノス距離を主成分分析から導出し、距離の式をわかりやすくを解説します。公式暗記せず、導出過程をきちんと理解しましょう。多変量解析を学ぶ人は必読です。

    マハラビノス距離が計算できる

    導出がわかったら、実際に計算してみましょう。ユークリッド距離と比較しながら、σや相関係数の影響を見ていきましょう。

    マハラビノス距離が計算できる
    マハラノビス距離は計算できますか?本記事では、データ事例をもとに、マハラノビス距離を計算し、ユークリッド距離との比較やマハラノビス距離の楕円分布がわかるように丁寧に解説しています。多変量解析を学ぶ人は必読です。

    マハラノビス距離と相関係数の関係がわかる

    マハラノビス距離とユークリッド距離の違いはどこにあるか? 相関係数を使えば、違いがよくわかります。

    マハラビノス距離と相関係数の関係がわかる
    マハラビノス距離と相関係数の関係性が説明できますか?本記事では、マハラビノス距離と相関係数の関係、相関係数によるマハラビノス距離とユークリッド距離の差異について、わかりやすく解説します。マハラビノス距離の面白い性質がわかります。多変量解析を学ぶ人は必読です。

    マハラノビス距離から判別できる

    マハラノビス距離をつかって判別分析をしてみましょう。

    マハラビノス距離から判別できる
    マハラノビス距離を計算してデータを判別できますか? 本記事では、実データをもとにマハラノビス距離を使った判別分析をわかりやすく解説しています。座標の見た目と異なる判別結果が出る注意点などが理解できます。多変量解析を学ぶ人は必読です。

    マハラノビス距離と線形判別関数を使った判別分析の違いがわかる

    マハラノビス距離と線形判別関数を使って、同じデータで判別結果の違いを見ていきましょう。手法によって結果に差が出るので、最後は我々が判別するしかなさそうです。

    マハラビノス距離と線形判別関数から判別分析ができる
    判別分析で線形判別関数、マハラビノス距離の結果の違いが説明できますか?本記事は、同じデータを使って、線形判別関数、マハラビノス距離を計算し、判別分析の結果の違いをわかりやすく解説します。多変量解析を学ぶ人は必読です。

    これだけの関連記事を読めば、判別分析はマスターした!といって過言ではないでしょう!

    まとめ

    「【まとめ】判別分析がわかる」を解説しました。

    • ①判別分析に使う2つの手法
    • ➁線形判別関数で判別分析
    • ➂マハラビノス距離で判別分析

  • マハラビノス距離と線形判別関数から判別分析ができる

    マハラビノス距離と線形判別関数から判別分析ができる

    「判別分析はマハラビノス距離と線形判別関数の2つがあるけど、違いがわからない」などと困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    マハラビノス距離と線形判別関数から判別分析ができる

    おさえておきたいポイント

    • ①判別分析手法
    • ➁データ事例
    • ➂線形判別関数で判別分析
    • ➃マハラビノス距離で判別分析
    • ➄線形判別関数とマハラビノス距離の分析結果を比較
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】多変量解析問題集を販売します!

    QC検定®1級合格したい方、多変量解析をしっかり学びたい方におススメです。
    【QC検定®合格】「多変量解析」問題集を販売します! 内容は、①回帰分析 単回帰分析・重回帰分析 の復習、➁ 主成分分析、➂判別分析、➃因子分析、➄数量化分析の5章全42題を演習できる問題集です。

    判別分析は自分で解けます!
    Excelや公式は暗記不要!
    自力で導出できるぜ!

    ①判別分析手法

    線形判別関数について

    線形判別関数については、関連記事で解説していますので、先に確認してください。本記事では、線形判別関数の導出や具体的な計算ができる前提で話を進めていきます。

    線形判別関数が計算できる(2次元、その1)
    判別分析において、線形判別関数が計算できますか?本記事では2次元データを例に2記事にわたり線形判別関数の求め方をわかりやすく解説します。多変量解析を学ぶ人は必読です。

    線形判別関数が計算できる(2次元、その2)
    判別分析において、線形判別関数が計算できますか?本記事では2次元データを例に2記事にわたり線形判別関数の求め方をわかりやすく解説します。線形判別関数の結果と判別正誤率も解説します。多変量解析を学ぶ人は必読です。

    線形判別関数のポイント

    ●全変動STの一部である、群間変動SBが最大になる条件で判別するのが原則。
    ●ただし、SB/STの関数は変数の個数分、極値を持つので、その本数だけ線形判別関数が引ける。

    線形判別関数を解くプロセスでは特に意識しておく必要があります。

    マハラノビス距離について

    マハラノビス距離については、関連記事で解説していますので、先に確認してください。本記事では、マハラノビス距離の導出や具体的な計算ができる前提で話を進めていきます。

    マハラノビス距離の導出

    マハラビノス距離が導出できる
    マハラビノス距離が導出できますか? 本記事では、マハラビノス距離を主成分分析から導出し、距離の式をわかりやすくを解説します。公式暗記せず、導出過程をきちんと理解しましょう。多変量解析を学ぶ人は必読です。

    マハラノビス距離の計算

    マハラビノス距離が計算できる
    マハラノビス距離は計算できますか?本記事では、データ事例をもとに、マハラノビス距離を計算し、ユークリッド距離との比較やマハラノビス距離の楕円分布がわかるように丁寧に解説しています。多変量解析を学ぶ人は必読です。

    マハラノビス距離のポイント

    ●主成分分析方向を座標とした場合の距離がマハラビノス距離。
    ●距離の2乗を標本分散で割るイメージが強いが、それより主成分分析から導出する点が大事

    マハラビノス距離を解くプロセスでは特に意識しておく必要があります。

    ➁データ事例

    以下のデータを使って、線形判別関数とマハラビノス距離の両手法で判別分析をします。

    No \(x_1\) \(x_2\) 平均\(\bar{x_1}\) 平均\(\bar{x_2}\)
    1 1 4 8 4 10
    2 6 10
    3 2 12
    2 4 10 16 7.5 13.5
    5 5 10
    6 8 12
    7 7 16
    合計 42 84 全平均 6 12

    グラフは下図のとおりです。

    マハラノビス距離

    ➂線形判別関数で判別分析

    同じデータですでに線形判別関数から判別分析を、関連記事で解いています。途中経過は関連記事でご確認ください。

    線形判別関数が計算できる(2次元、その2)
    判別分析において、線形判別関数が計算できますか?本記事では2次元データを例に2記事にわたり線形判別関数の求め方をわかりやすく解説します。線形判別関数の結果と判別正誤率も解説します。多変量解析を学ぶ人は必読です。

    結果は下図の通りで、2次元のデータから2本の線形判別関数の直線ができますね。

    線形判別関数

    線形判別関数

    ➃マハラビノス距離で判別分析

    同じデータですでに線形判別関数から判別分析を、関連記事で解いています。途中経過は関連記事でご確認ください。

    マハラビノス距離が計算できる
    マハラノビス距離は計算できますか?本記事では、データ事例をもとに、マハラノビス距離を計算し、ユークリッド距離との比較やマハラノビス距離の楕円分布がわかるように丁寧に解説しています。多変量解析を学ぶ人は必読です。

    マハラビノス距離による判別分析は下図のようになります。

    マハラノビス距離

    ➄線形判別関数とマハラビノス距離の分析結果を比較

    グラフで確認

    線形判別関数とマハラビノス距離で同じデータをそれぞれ判別分析しました。

    結果をグラフにまとめてみましょう。

    ●線形判別関数Z1: y=x+6の場合とマハラビノス距離

    マハラビノス距離

    ●線形判別関数Z1: y=-13/6x+25の場合とマハラビノス距離

    線形判別関数

    【クイズ】次の4点はどちらの群に属するか?

    ●線形判別関数(Z1,Z2)場合とマハラビノス距離で次の座標は1群、2群のどちらに属するか?
    (i) (2,10)
    (ii) (8,18)
    (iii) (9,13)
    (iv) (6,10)

    マハラビノス距離
    マハラビノス距離

    (i)(ii)は計算しなくても図から明らかですが、
    (iii)(iv)はどうでしょうか?
    線形判別関数とマハラビノス距離の両面から計算して評価しましょう。

    解析結果

    No 座標 線形判別関数1
    y=x+6
    線形判別関数2
    y=-13/6x+25
    マハラビノス距離DM マハラビノス距離DM1 マハラビノス距離DM2
    (i) (2,10) 2群 1群 1群 1.154 2.799
    (ii) (8,18) 2群 2群 2群 6.111 1.867
    (iii) (9,13) 1群 2群 2群 4.041 1.173
    (iv) (6,10) 1群 1群 1群 1.1543 1.173

    各手法で計算すると、所属群が変わることがあります。
    手法で計算したら、あとは、あなたの考えで判別の結論を出すことになります。

    同じデータを線形判別関数・マハラビノス距離の両方を使って結果を比較する面白い内容を解説しました。

    まとめ

    「マハラビノス距離と線形判別関数から判別分析ができる」を解説しました。

    • ①判別分析手法
    • ➁データ事例
    • ➂線形判別関数で判別分析
    • ➃マハラビノス距離で判別分析
    • ➄線形判別関数とマハラビノス距離の分析結果を比較

  • マハラビノス距離から判別できる

    マハラビノス距離から判別できる

    「マハラビノス距離からデータをどうやって判別するかがわからない」などと困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    マハラビノス距離から判別できる

    おさえておきたいポイント

    • ①データ事例
    • ➁各群のマハラノビス距離を算出
    • ➂各点がどちらの群に属するか?
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】多変量解析問題集を販売します!

    QC検定®1級合格したい方、多変量解析をしっかり学びたい方におススメです。
    【QC検定®合格】「多変量解析」問題集を販売します! 内容は、①回帰分析 単回帰分析・重回帰分析 の復習、➁ 主成分分析、➂判別分析、➃因子分析、➄数量化分析の5章全42題を演習できる問題集です。

    マハラビノス距離を実際に計算してみよう
    判別分析は自分で解けます!
    Excelや公式は暗記不要!
    自力で導出できるぜ!
    2次元でしっかり導出過程を理解しましょう。

    ①データ事例

    マハラノビス距離について

    マハラノビス距離については、関連記事で解説していますので、先に確認してください。本記事では、マハラノビス距離の導出や具体的な計算ができる前提で話を進めていきます。

    マハラノビス距離の導出

    マハラビノス距離が導出できる
    マハラビノス距離が導出できますか? 本記事では、マハラビノス距離を主成分分析から導出し、距離の式をわかりやすくを解説します。公式暗記せず、導出過程をきちんと理解しましょう。多変量解析を学ぶ人は必読です。

    マハラノビス距離の計算

    マハラビノス距離が計算できる
    マハラノビス距離は計算できますか?本記事では、データ事例をもとに、マハラノビス距離を計算し、ユークリッド距離との比較やマハラノビス距離の楕円分布がわかるように丁寧に解説しています。多変量解析を学ぶ人は必読です。

    データ事例

    下表のように、2つの群に分かれている7個のデータを用意します。

    No \(x_1\) \(x_2\) 平均\(\bar{x_1}\) 平均\(\bar{x_2}\)
    1 1 4 8 4 10
    2 6 10
    3 2 12
    2 4 10 16 7.5 13.5
    5 5 10
    6 8 12
    7 7 16
    合計 42 84 全平均 6 12

    グラフは下図のとおりです。

    マハラノビス距離

    標本分散を計算

    マハラビノス距離の計算に必要な標本分散を計算します。結果は下表のとおりです。

    N0 \(x_1\) \(x_2\) 標本平均
    \(S_{11}\)
    標本平均
    \(S_{22}\)
    標本平均
    \(S_{12}\)
    1 1 4 8 4 4 -2
    2 6 10
    3 2 12
    2 4 10 16 4.33 9 4.33
    5 5 10
    6 8 12
    7 7 16

    ➁各群のマハラノビス距離を算出

    マハラビノス距離を相関係数で表現

    関連記事「」では、2次元のマハラノビス距離を

    \(D_M^2\)=\((X_1, X_2)\)\(\left(\begin{array}{cccc}
    S_{11} & S_{12} \\
    S_{12} & S_{22}
    \end{array}
    \right)^{-1}
    \)\(\left(
    \begin{array}{c}
    X_1\\
    X_2
    \end{array}
    \right)
    \)

    と表現できますね。

    上の式を使って、マハラビノス距離を計算します。

    各群のマハラノビス距離を計算

    1群のマハラノビス距離

    1群では、
    \(D_M^2\)=\((X_1, X_2)\)\(\left(\begin{array}{cccc}
    S_{11} & S_{12} \\
    S_{12} & S_{22}
    \end{array}
    \right)^{-1}
    \)\(\left(
    \begin{array}{c}
    X_1\\
    X_2
    \end{array}
    \right)
    \)
    =\((X_1, X_2)\)\(\left(\begin{array}{cccc}
    4 & -2 \\
    -2 & 4
    \end{array}
    \right)^{-1}
    \)\(\left(
    \begin{array}{c}
    X_1\\
    X_2
    \end{array}
    \right)
    \)
    =\((x_1-\bar{x_1}, x_2-\bar{x_2})\)\(\left(\begin{array}{cccc}
    0.333 & 0.167 \\
    0.167 & 0.333
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{c}
    x_1-\bar{x_1}\\
    x_2-\bar{x_2}
    \end{array}
    \right)
    \)
    より、結果をまとめると
    \(D_M^2\)=\(\frac{1}{3}(x_1-4)^2\)+\(\frac{1}{3}(x_1-4) (x_2-10)\)+ \(\frac{1}{3}(x_2-10)^2\)
    となります。

    2群のマハラノビス距離

    次に、2群では、
    \(D_M^2\)=\((X_1, X_2)\)\(\left(\begin{array}{cccc}
    S_{11} & S_{12} \\
    S_{12} & S_{22}
    \end{array}
    \right)^{-1}
    \)\(\left(
    \begin{array}{c}
    X_1\\
    X_2
    \end{array}
    \right)
    \)
    =\((X_1, X_2)\)\(\left(\begin{array}{cccc}
    4.33 & 4.33 \\
    4.33 & 9
    \end{array}
    \right)^{-1}
    \)\(\left(
    \begin{array}{c}
    X_1\\
    X_2
    \end{array}
    \right)
    \)
    =\((x_1-\bar{x_1}, x_2-\bar{x_2})\)\(\left(\begin{array}{cccc}
    0.445 & -0.214 \\
    -0.214 & 0.214
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{c}
    x_1-\bar{x_1}\\
    x_2-\bar{x_2}
    \end{array}
    \right)
    \)
    より、結果をまとめると
    \(D_M^2\)=0.445\((x_1-7.5)^2\)-0.214\((x_1-7.5) (x_2-13.5)\)+ 0.214\((x_2-13.5)^2\)
    となります。

    結果をまとめると、

    マハラビノス距離は
    ●1群:\(D_M^2\)=\(\frac{1}{3}(x_1-4)^2\)+\(\frac{1}{3}(x_1-4) (x_2-10)\)+ \(\frac{1}{3}(x_2-10)^2\)
    ●2群:\(D_M^2\)=0.445\((x_1-7.5)^2\)-0.214\((x_1-7.5) (x_2-13.5)\)+ 0.214\((x_2-13.5)^2\)
    となります。
    各座標において、1群、2群のマハラノビス距離を計算して
    マハラノビス距離が短い群に属することを確認しましょう。

    マハラビノス距離を図示

    その前に、マハラノビス距離を図示しましょう。傾いた楕円形になりますね。グラフに描く式は、

    図示するグラフは
    ●1群:\(\frac{1}{3}(x_1-4)^2\)+\(\frac{1}{3}(x_1-4) (x_2-10)\)+ \(\frac{1}{3}(x_2-10)^2\)=\(D_M^2\)
    ●2群:0.445\((x_1-7.5)^2\)-0.214\((x_1-7.5) (x_2-13.5)\)+ 0.214\((x_2-13.5)^2\)=\(D_M^2\)
    として、\(D_M^2\)=\(1^2\),\(2^2\)について図示します。

    マハラノビス距離

    上図の等高線を見ると、
    ●マハラノビス距離がどの程度あるか、
    ●どちらの群に属しているか、

    がはっきりしますね。

    ➂各点がどちらの群に属するか?

    3点を例に、マハラビノス距離から判別

    下図のように3つの赤い点(座標)を用意して、1群、2群どちらに属するかをみましょう。

    マハラノビス距離

    1. (\(x_1,x_2\))=(3,13)
    2. (\(x_1,x_2\))=(9,12)
    3. (\(x_1,x_2\))=(5,12)

    では、実際に計算すると下表のような結果になります。

    データ 座標 DM1 DM2 属する群
    (3,13) 1.53 2.85 2群
    (9,12) 3.61 1.56 1群
    (5,12) 1.53 1.28 2群

    ①➁はあきらかにすぐわかりますが、
    ➂のような、7つのデータからみると
    1群の3つの黒点に近い座標なので、1群に属しやすいかと思いきや、
    マハラノビス距離から評価すると2群に属することが分かりました。

    マハラビノス距離で判別するときの注意点

    マハラノビス距離では、標準偏差で割ったり、相関関係を配慮した値になるので、座標から見て直観的に判別した結果と異なる場合があります。

    各群のばらつき、変数(軸)どうし相関関係に注意してマハラノビス距離を計算しましょう。

    その一方、線形判別関数は直線で引くので、座標からすぐ判別がつきますが、マハラノビス距離からの評価は座標を見ただけでは完璧に判別できない難しさがありますね。

    まとめ

    「マハラビノス距離から判別できる」を解説しました。

    • ①データ事例
    • ➁各群のマハラノビス距離を算出
    • ➂各点がどちらの群に属するか?

error: Content is protected !!