QCプラネッツ 品質のプロフェッショナルを育成するサイト

【まとめ】主成分分析を究める

多変量解析

「主成分分析がよくわからない、何を学べばよいかわからない?」などと困っていませんか?

こういう疑問に答えます。

本記事のテーマ

【まとめ】主成分分析を究める

おさえておきたいポイント

  • ①主成分分析で習得すべきポイント
  • ➁主成分分析の実践演習
  • ➂主成分分析の注意点
主成分分析は自分で解けます!
Excelや固有値、因子負荷量とか暗記不要!
自力で導出できるぜ!
主成分分析の流れを自分で導出し
n次元の分析を演習し
さらに、教科書等であまり書いていない注意点も解説!

①主成分分析で習得すべきポイント

主成分分析とは何かを理解する

一番ダメなのは

主成分分析は固有値を求めること
と条件反射的に公式暗記すること

確かに、テストとかでは点数とれますが、
本質は全く分かっていないと見抜かれますよ

本質は、

「主成分分析はデータを要約するもの
散布したデータの情報量が集まった方向を探す手法

平方和を使って方向を探す」
その条件式が固有方程式になるだけ

その集約した方向が主成分方向であり、
それと垂直な方向は誤差方向であり、
主成分方向は情報量を最大化
誤差方向は情報量を最小化
させるのが主成分方向の目的です。

主成分分析

主成分分析の演習問題を解いていくと、確かに、固有方程式を解くところはボリュームが大きいので、固有値を求めるのが主成分分析と頭がインプットされてしまいますが、

主成分分析はデータの集約であり、集約する情報量の式が最も大事です。

関連記事で解説

主成分分析の基礎をまとめた関連記事を紹介します。
主成分分析の解き方より、考えたが大事です。
分析結果が出ても、「だから何なの?」とならないよう
本質を理解しましょう。

主成分分析はデータ集約する点を理解する

データ集約する方法をわかりやすく2次元の場合、多次元の場合の記事を用意しています。2次元で理解出来たら、次元を拡張すれば多次元も理解できます。

主成分分析で使う変数の特徴を理解する

主成分分析を実施するといろいろな変数が必要となります。

  1. 相関係数行列
  2. 固有値、固有ベクトル
  3. 主成分の寄与率、累積寄与率
  4. 因子負荷量
  5. 主成分負荷量
  6. 主成分得点

いろいろな変数がある中で、どうしても気になるのが
因子負荷量って何者?
固有値と主成分方向の平方和が等しいのは何で?
何で固有ベクトルって互いに直交するの?
と教科書では当たり前に書いているところに疑問がわくはずです。

なので、関連記事で解説しています。導出過程を理解しながら読み進めてください。

主成分分析の演習の前に、主成分分析とは何か?、どんな変数で分析を評価するかをまず、関連記事で確認しましょう。

➁主成分分析の実践演習

基礎が理解できたら、あとはどんどん実践演習しましょう。
基本は手で解析して理解を深める事ですが、3次元で計算が複雑な場合や、4次元以上はPCや計算機を使いましょう。

  1. 2次元は簡単な計算で、流れを理解する
  2. 3次元もなるべく手計算で、2次元と同じ流れで解けることを確認する
  3. 5次元はツールを駆使するが、2次元、3次元と同じ流れで解ける事を確認する
  4. 主成分分析=固有値解ではなく、データの縮約であることを忘れないこと

上の4点を意識して、演習用の関連記事を紹介します。ご確認ください。

➂主成分分析の注意点

ここまで来たら、主成分分析はマスターしたと自信もってOKですが、
QCプラネッツ自身、さらに気になった3点があるので、紹介します。

同じデータを用意されて
主成分分析と回帰分析を両方したら、
両手法の違いを意識して解けるかどうか?
データの標準化して固有値解を解くが
同じデータでも
データの標準化する・しないで
固有値・固有ベクトルの値って違うのご存じでした?
主成分分析で固有方程式解いたら
重解がでちゃった。
固有値、固有ベクトルとかはちゃんと
計算されるの?

普通、ここまでやりませんが、
他の手法と比較したり、他の単元と主成分分析を比較するといろいろ気になることが出て来ます。それを解決するのがstudyですよね!

関連記事で解説しています。

ここまで理解すれば、主成分分析はマスターできますよね!

是非、関連記事を読み進めて、主成分分析をマスターしましょう!

まとめ

「【まとめ】主成分分析を究める」を解説しました。

  • ①主成分分析で習得すべきポイント
  • ➁主成分分析の実践演習
  • ➂主成分分析の注意点

error: Content is protected !!