【まとめ】多変量解析を究める
「多変量解析がわからない、何を学べばよいかわからない」などと困っていませんか?
こういう疑問に答えます。
本記事のテーマ
おさえておきたいポイント
- ①多変量解析の目的は1つ
- ➁多変量解析を分類
- ➂各手法の解説(関連記事のご紹介)
Excelなどのツールに頼る前に
自力で導出して理解しようぜ!
- 重回帰分析
- 主成分分析
- 判別分析
- 因子分析
- コレスポンデンス分析
- クラスター分析
- 数量化Ⅰ~Ⅳ類分析
をQCプラネッツは
自力で導出して理解できるように、わかりやすく解説!
その意味を理解しよう!
①多変量解析の目的は1つ
多変量解析の目的
教科書や他のサイトでは、いろいろな多変量解析を下表にように分類しています。
ただ、どうでしょうか?
イマイチ理解しにくい。
なので、QCプラネッツは別の区別方法で分けています。
それは、
「データから必要な情報を最大限抽出すること!」
全手法を研究してたどり着いた分類方法です。
データの誤差を最小化することと同じ!
なので、多変量解析は
●必要な情報を最大限抽出する手法
●不要な誤差を最小化する手法
があります。
➁多変量解析を分類
多変量解析の種類
再掲しますが、
●必要な情報を最大限抽出する手法
●不要な誤差を最小化する手法
で分類すると下表になります。
目的 | 手法 | 特徴 |
①必要な情報を最大化 | ●重回帰分析(≒数量化Ⅰ類) | 予測 |
➁不要な誤差を最小化 | ●主成分分析 | 情報集約 |
●判別分析(≒数量化Ⅱ類) | 判別 | |
●因子分析 | データ構成元抽出 | |
●クラスター分析 | 判別 | |
●コレスポンデンス分析 (≒数量化Ⅲ類、数量化Ⅳ類) |
相関係数の最大化 |
シンプルな分類になりましたし、解法・目的が明確になりましたね!
➂各手法の解説(関連記事のご紹介)
上表のとおり、目的別に手法を解説した関連記事を紹介します。
(1)重回帰分析
誤差を最小化する重回帰分析
の解法を紹介します。
重回帰分析に出て来る公式の暗記ではなく、その導出過程をしっかり理解することが大事です。
【まとめ】重回帰分析がよくわかる 重回帰分析は自信もって解けますか?説明できますか? 本記事では、重回帰分析の考え方、理解すべきポイント、重回帰分析の特徴をわかりやすく解説し、公式の導出過程を詳しく解説します。公式暗記、解法暗記で終わらせずに、本質を学ぶことができます。多変量解析を学ぶ人は必読です。 |
(2)主成分分析
多変量解析はいろいろ手法がありますが、重回帰分析の次に学ぶのが主成分分析であることが多いですね。
主成分分析の目的(情報を最大化する方向を探すこと)に意識して、主成分分析を理解しましょう。
重回帰分析と主成分分析は全く別物ですが、
何がどう違うか?をわかりやすく解説できるよう挑戦してください。
【まとめ】主成分分析を究める 主成分分析は解けますか?主成分分析は何をやる手法か説明できますか? 本記事では、主成分分析を究めれられるポイントをわかりやすく解説しています。関連記事を読み進めると主成分分析はマスターできます。多変量解析を学ぶ人は必読です。 |
(3)判別分析
主成分分析より、理解しやすいのが判別分析ですね。
何と何を区別して判別するか?なので、理解しやすいですね。
なので、
「区別、判別をはっきりさせるに
両者をなるべく引き離して分離させる手法」
を意識して判別分析の導出過程を理解しましょう。
変動比が最大になる条件を求めるのは、群間成分と群内成分を引き離すと分離しやすい!というイメージでとらえましょう。
【まとめ】判別分析がわかる 判別分析ができますか? 本記事では、判別分析に使う、線形判別関数、マハラノビス距離の導出・使い方、特性などを分かりやすく解説しています。豊富な関連記事を紹介! 多変量解析を学ぶ人は必読です。 |
(4)因子分析
最もわかりにくいのが、因子分析ですね。
主成分分析と比較されますが、
正直、主成分分析と因子分析は比較対象ではなく、全くの別物ですよ。
因子分析は、簡単にいうと、
●データを構成する元(共通因子)を見つけるもの
●共通因子の値から意味を考えるが、意味づけは人それぞれになる。
●しかし、共通因子を見つける方程式に自由度が余るため、最適値を外す場合がよくある
です。
因子分析は解析が難しいし、結果を読み取るもの人それぞれなので、よく注意して解析してください。
【まとめ】因子分析がわかる 因子分析は自分で解けますか? 本記事では因子分析が自力で解けるためのエッセンスをまとめた記事です。ツール任せでなく、何を解いているかがわかるためにまとめました。多変量解析を学ぶ人は必読です。 |
(5)コレスポンデンス分析
クロス集計表の項目がバラバラな場合、ある規則に沿って並び替えるのに使う方法です。並び替えは人力でやってもよいですが、その意味合いを数学で評価できるのがコレスポンデンス分析です。
クロス集計表の項目を数値化して、その相関係数の最大化となる組み合わせを求めるものです。
重回帰分析、主成分分析、因子分析などと全く別物の分析手法ですね。
コレスポンデンス分析ができる コレスポンデンス分析ができますか?本記事では数量化3類と数量化4類をベースにコレスポンデンス分析をわかりやすく解説します。多変量解析を学ぶ人は必読です。 |
(6)クラスター分析
群分けを群間の距離で分離する原始的な方法で、直観的にわかりやすい分析方法です。クラスター分析を最初に勉強した方がいいでしょう。
ただし、分離方法の精度をよくするために、3つの手法
●最短距離法
●最長距離法
●群平均法
があります。
最短距離法は簡単ですが、最長距離法・群平均法が分かりにくいです。なので、3者の解き方を比較しながら解法を解説しています。必見な関連記事です。
【重要】クラスター分析できる クラスター分析はできますか?本記事は、最短距離法、最長距離法、群平均法の違いを理解しながらクラスター分析をわかりやすく解説しています。この記事でクラスター分析はマスターできます! 多変量解析を学ぶ人は必読です。 |
(7)数量化分析
学生時代から思っていたのは、
手法名が変わるのはおかしい。
解法や数式が全く異なるなら
手法名が異なっていてもいいけど。
しっかり研究すると
●数量化Ⅰ類=重回帰分析
●数量化Ⅱ類=判別分析
●数量化Ⅲ、Ⅳ類=コレスポンデンス分析
でいいわけです。
わざわざ手法名を「数量化○○」と分類する意味がよくわかりませんが、皆知っているほどの知名度になっています。だから、かえって理解しにくいんですよね。
データの質的、量的ではなく
解法の目的で分類すべき
一応、数量化Ⅰ類からⅣ類まで関連記事で解説していますが、一番伝えたいのは、
●数量化Ⅰ類=重回帰分析
●数量化Ⅱ類=判別分析
●数量化Ⅲ、Ⅳ類=コレスポンデンス分析
でよいことです。
なるべく少ない解法や暗記量で多変量解析を究めたいので!
数量化1類の分析ができる 数量化1類の分析ができますか?本記事では、数量化1類は重回帰分析であることを示したうえで、数量化1類の解析方法をわかりやすく解説しています。多変量解析を学ぶ人は必読です。 |
数量化2類ができる(その1) 数量化2類が分析できますか?数量化2類は判別分析と同じです。本記事は線形判別関数を使った数量化2類の解析をわかりやすく解説します。多変量解析を学ぶ人は必読です。 |
数量化2類ができる(その2) 数量化2類が分析できますか?数量化2類は判別分析と同じです。本記事はマハラビノス距離を計算し、線形判別関数とマハラビノス距離使った数量化2類の解析の比較をわかりやすく解説します。多変量解析を学ぶ人は必読です。 |
数量化3類の分析ができる 数量化3類が説明できますか?分析できますか? 本記事では、数量化3類の本質や解法をデータ事例を使いながらわかりやすく解説します。多変量解析を学ぶ人は必読です。 |
数量化4類の分析ができる 数量化4類の分析ができますか? 本記事では主成分分析、数量化3類の解法をベースに数量化4類の解法をわかりやすく解説します。ツールに頼らず、手計算でできる内容でまとめていますので、早く理解できます。多変量解析を学ぶ人は必読です。 |
全関連記事リンク
多変量解析関連記事は40記事あります。上のリンクは代表記事ですが、全記事のリンクを紹介します。
全部書き上げて、わかったことは、再掲しますが、
「データから必要な情報を最大限抽出すること!」
●必要な情報を最大限抽出する手法
●不要な誤差を最小化する手法
がある。
これを意識して40記事作りました。解法はたくさんありますが、一番上に立つ考え方である、
データから必要な情報を最大限抽出することを意識しましょう。多変量解析が早くマスターできます!
●1_【まとめ】単回帰分析がわかる
●2_【まとめ】重回帰分析がよくわかる
●3_【重要】主成分分析が導出できる
●4_【重要】主成分分析が導出できる(多次元)
●5_因子負荷量が導出できる
●6_主成分方向の平方和と固有値が一致する理由がわかる
●7_固有ベクトルが直交する理由がわかる
●8_主成分分析が計算できる
●9_主成分分析ができる(5次元)
●10_主成分分析ができる(3次元)
●11_主成分分析ができる(2次元)
●12_主成分分析と回帰分析の違いがわかる
●13_【注意】平方和・相関行列から求めた固有値・固有ベクトルは一致しない
●14_主成分分析ができる(3次元で重解がある場合)
●15_【まとめ】主成分分析を究める
●16_線形判別関数の正負がわかる
●17_線形判別関数Zの導出がわかる(2次元、平方和の分解)
●18_線形判別関数が計算できる(2次元、その1)
●19_線形判別関数が計算できる(2次元、その2)
●20_2次元の線形判別関数の傾きは最大2種類である理由がわかる
●21_線形判別関数が計算できる(2次元で3群以上分割する場合)
●22_マハラビノス距離が導出できる
●23_マハラビノス距離が計算できる
●24_マハラビノス距離と相関係数の関係がわかる
●25_マハラビノス距離から判別できる
●26_マハラビノス距離と線形判別関数から判別分析ができる
●27_【まとめ】判別分析がわかる
●28_因子分析の1因子モデルが導出できる
●29_因子分析の1因子モデルが計算できる
●30_因子分析の2因子モデルが導出できる
●31_因子分析の2因子モデルが計算できる
●32_主成分分析と因子分析の違いがわかる
●33_【まとめ】因子分析がわかる
●34_【重要】クラスター分析できる
●35_数量化1類の分析ができる
●36_数量化2類ができる(その1)
●37_数量化2類ができる(その2)
●38_コレスポンデンス分析ができる
●39_数量化3類の分析ができる
●40_数量化4類の分析ができる
まとめ
「【まとめ】多変量解析を究める!」を解説しました。
- ①多変量解析の目的は1つ
- ➁多変量解析を分類
- ➂各手法の解説(関連記事のご紹介)
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119