【まとめ】多変量解析を究める

多変量解析を究める

本記事のテーマ

【まとめ】多変量解析を究める!

おさえておきたいポイント

  • ①多変量解析の目的は1つ
  • ➁多変量解析を分類
  • ➂各手法の解説(関連記事のご紹介)

【QC検定®1級合格】多変量解析問題集を販売します!

QC検定®1級合格したい方、多変量解析をしっかり学びたい方におススメです。
①回帰分析 単回帰分析・重回帰分析 の復習、➁ 主成分分析、➂判別分析、➃因子分析、➄数量化分析の5章全42題を演習できる問題集。

多変量解析は自分で解けます!
Excelなどのツールに頼る前に
自力で導出して理解しようぜ!
  1. 重回帰分析
  2. 主成分分析
  3. 判別分析
  4. 因子分析
  5. コレスポンデンス分析
  6. クラスター分析
  7. 数量化Ⅰ~Ⅳ類分析

をQCプラネッツは
自力で導出して理解できるように、わかりやすく解説!

解析ツールで何でも解けるけど
その意味を理解しよう!

①多変量解析の目的は1つ

多変量解析の目的

教科書や他のサイトでは、いろいろな多変量解析を下表にように分類しています。

多変量解析

ただ、どうでしょうか?

データの質的・量的で分類しても
イマイチ理解しにくい。

なので、QCプラネッツは別の区別方法で分けています。

それは、

多変量解析の目的は唯一!
「データから必要な情報を最大限抽出すること!」

全手法を研究してたどり着いた分類方法です。

必要な情報を最大限抽出することは
データの誤差を最小化することと同じ!

なので、多変量解析は
必要な情報を最大限抽出する手法
不要な誤差を最小化する手法
があります。

➁多変量解析を分類

多変量解析の種類

なので、多変量解析は
必要な情報を最大限抽出する手法
不要な誤差を最小化する手法
があります。

目的 手法 特徴
①必要な情報を最大化 ●重回帰分析(≒数量化Ⅰ類) 予測
➁不要な誤差を最小化 ●主成分分析 情報集約
●判別分析(≒数量化Ⅱ類) 判別
●因子分析 データ構成元抽出
●クラスター分析 判別
●コレスポンデンス分析
(≒数量化Ⅲ類、数量化Ⅳ類)
相関係数の最大化

シンプルな分類になりましたし、解法・目的が明確になりましたね!

➂各手法の解説(関連記事のご紹介)

上表のとおり、目的別に手法を解説した関連記事を紹介します。

(1)重回帰分析

誤差を最小化する重回帰分析

の解法を紹介します。
重回帰分析に出て来る公式の暗記ではなく、その導出過程をしっかり理解することが大事です。

【まとめ】重回帰分析がよくわかる
公式導出過程を詳しく解説!重回帰分析、多変量解析を学ぶ人は必読です。

(2)主成分分析

多変量解析はいろいろ手法がありますが、重回帰分析の次に学ぶのが主成分分析であることが多いですね。

主成分分析の目的(情報を最大化する方向を探すこと)に意識して、主成分分析を理解しましょう。

重回帰分析と主成分分析は全く別物ですが、
何がどう違うか?をわかりやすく解説できるよう挑戦してください。

主成分分析が計算できる
主成分負荷量、主成分得点、主成分平方和、主成分の寄与率は説明・計算ができますか? 本記事は各変数の導出方法を丁寧に解説します。ただ、主成分分析の本質は先に習得しておきましょう。多変量解析を学ぶ人は必読です。

(3)判別分析

主成分分析より、理解しやすいのが判別分析ですね。
何と何を区別して判別するか?なので、理解しやすいですね。

なので、
区別、判別をはっきりさせるに
両者をなるべく引き離して分離させる手法

を意識して判別分析の導出過程を理解しましょう。

変動比が最大になる条件を求めるのは、群間成分と群内成分を引き離すと分離しやすい!というイメージでとらえましょう。

【まとめ】判別分析がわかる
判別分析に使う、線形判別関数、マハラノビス距離の導出・使い方、特性などを分かりやすく解説!

(4)因子分析

最もわかりにくいのが、因子分析ですね。
主成分分析と比較されますが、
正直、主成分分析と因子分析は比較対象ではなく、全くの別物ですよ。

因子分析は、簡単にいうと、
●データを構成する元(共通因子)を見つけるもの
●共通因子の値から意味を考えるが、意味づけは人それぞれになる。
●しかし、共通因子を見つける方程式に自由度が余るため、最適値を外す場合がよくある

です。

因子分析は解析が難しいし、結果を読み取るもの人それぞれなので、よく注意して解析してください。

ブログ記事でまとめていましたが、PDFとしてまとめました。ダウンロードして学習ください。

因子分析の流れが理解できる関連記事を紹介します。上から下に沿って、それぞれの関連記事を読んでいってください。

以前、ブログ記事としていましたが、まとめて冊子にしました。
どれも重要なテーマなので勉強しましょう!

●【QCプラネッツ因子分析プレミアム勉強プリント】リンク

No ブログ記事リンク
1 因子分析の1因子モデルが導出できる
2 因子分析の1因子モデルが計算できる
3 因子分析の2因子モデルが導出できる
4 因子分析の2因子モデルが計算できる

(5)コレスポンデンス分析

クロス集計表の項目がバラバラな場合、ある規則に沿って並び替えるのに使う方法です。並び替えは人力でやってもよいですが、その意味合いを数学で評価できるのがコレスポンデンス分析です。

クロス集計表の項目を数値化して、その相関係数の最大化となる組み合わせを求めるものです。

重回帰分析、主成分分析、因子分析などと全く別物の分析手法ですね。

コレスポンデンス分析ができる
数量化3類と数量化4類をベースにコレスポンデンス分析をわかりやすく解説!

(6)クラスター分析

群分けを群間の距離で分離する原始的な方法で、直観的にわかりやすい分析方法です。クラスター分析を最初に勉強した方がいいでしょう。

ただし、分離方法の精度をよくするために、3つの手法
●最短距離法
●最長距離法
●群平均法

があります。

最短距離法は簡単ですが、最長距離法・群平均法が分かりにくいです。なので、3者の解き方を比較しながら解法を解説しています。必見な関連記事です。

●【QCプラネッツクラスター分析プレミアム勉強プリント】リンク

クラスター分析の流れが理解できる関連記事を紹介します。上から下に沿って、それぞれの関連記事を読んでいってください。

以前、ブログ記事としていましたが、まとめて冊子にしました。
どれも重要なテーマなので勉強しましょう!

(7)数量化分析

学生時代から思っていたのは、

データの質的・量的の違いだけで
手法名が変わるのはおかしい。
解法や数式が全く異なるなら
手法名が異なっていてもいいけど。

しっかり研究すると
●数量化Ⅰ類=重回帰分析
●数量化Ⅱ類=判別分析
●数量化Ⅲ、Ⅳ類=コレスポンデンス分析
でいいわけです。

わざわざ手法名を「数量化○○」と分類する意味がよくわかりませんが、皆知っているほどの知名度になっています。だから、かえって理解しにくいんですよね。

なので、多変量解析は
データの質的、量的ではなく
解法の目的で分類すべき

一応、数量化Ⅰ類からⅣ類まで関連記事で解説していますが、一番伝えたいのは、
●数量化Ⅰ類=重回帰分析
●数量化Ⅱ類=判別分析
●数量化Ⅲ、Ⅳ類=コレスポンデンス分析
でよいことです。

なるべく少ない解法や暗記量で多変量解析を究めたいので!

数量化分析のプレミアムテキストを紹介!

ブログ記事でまとめていましたが、PDFとしてまとめました。ダウンロードして学習ください。

数量化分析の流れが理解できる関連記事を紹介します。上から下に沿って、それぞれの関連記事を読んでいってください。

以前、ブログ記事としていましたが、まとめて冊子にしました。
どれも重要なテーマなので勉強しましょう!

●【QCプラネッツ数量化分析プレミアム勉強プリント】リンク

No ブログ記事リンク
1 数量化1類の分析ができる
2 数量化2類ができる
3 数量化4類の分析ができる
4 コレスポンデンス分析ができる

数量化分析のブログ記事を紹介!

上記のプレミアムテキスト以外に、ブログ記事もあります。ご確認ください。

数量化3類の分析ができる
数量化3類の本質や解法をデータ事例を使いながらわかりやすく解説!

まとめ

「【まとめ】多変量解析を究める!」を解説しました。

  • ①多変量解析の目的は1つ
  • ➁多変量解析を分類
  • ➂各手法の解説(関連記事のご紹介)

error: Content is protected !!