無相関の検定がわかる
「相関係数があるのになんで相関の有無を検定する必要があるの?」、「無相関の検定の検定統計量の式がどうしてあの式なの?」など、疑問に思いませんか?
こういう疑問に答えます。
本記事のテーマ
おさえておきたいポイント
- ➀相関係数があるのになんで相関の有無を調べたいのか?
- ②無相関の検定の検定統計量を導出
試験でよく出る問題なので、公式暗記して代入すれば試験はOKですが、意味がよくわからないはずです。どの教科書にも無相関の検定について十分な説明がないからです。
●You tube動画もごらんください。
➀相関係数があるのになんで相関の有無を調べたいのか?
相関係数rがある(0ではない)のに、無相関の検定ってどういうこと?
と思いますよね。
どの教科書にも書いていませんでしたので、私の考えを紹介します。
標本データから相関係数を算出しますが、母集団は本当に相関性があるのか?は気になります。
標本データから母集団の相関性を調べるための方法が、無相関の検定と考えるとよいでしょう。イメージ図を下図に書きます。
よくあるのが、たまたま線形性(相関性)の高いデータが集まった標本データをとったが、データ全体を見ると均一にばらついていることがよくあります。木を見て森を見ずです。
たまたま、標本データに強い相関性が出たからといって、母集団も相関性があるかどうかはわからない。だから、本当にデータ集団全体も相関性があるかを確認する必要あります。
②無相関の検定の検定統計量を導出
検定統計量
無相関の検定について、検定統計量は次式です。
t分布、相関係数の両方が出て来るので、テストによく出題されます。
でも、どうやって導出したの? 自由度はなんで、n-2なの? 気になりませんか? なので、導出しましょう!
検定統計量の導出
F分布から導出
検定統計量はt分布の式でした。でもなんでF分布なの? と不思議ですが、導出していきます。
標本データから母集団を推測する方法
分散を使って、標本データと母集団はそれほど差がなく同じものと仮定します。よって分散比を使ったF分布からスタートします。統計学は数学を使って厳密に解く場合と、統計だけにざっくり定義する場合もあります。
相関の有無
相関の有無を式で定義しましょう。相関Rが多いか?それとも残差eが多いか?を比較すればよいのです。
回帰分析における分散分析は、回帰Rと残差eの比較ですね。
\(\frac{V_R}{V_e}= F(1, φ_e,α)\)は一見難しいですが、分散分析表でF値を計算するときに、分散の比と自由度をそれぞれ使うことがわかれば、この式は理解できますね。
\(\frac{V_R}{V_e}\)=\(\frac{S_R / φ_R}{S_e / φ_e}\)
=\(\frac{S_R / 1}{S_e / (n-2)}\)
(\(S_e=S_T-S_R\)を代入)
= \(\frac{S_R (n-2)}{S_T – S_R}\)
=(あ)
(回帰の自由度)=1,(残差自由度)=n-2ですね。
また、回帰について、T,R,eの平方和を数式で表現します。
\(S_T\)=\(S_{yy}\)
\(S_R\)=\(\frac{S_{xy}^2}{S_{xx}} \)
を(あ)に代入します。
(あ)= \(\frac{ \frac{S_{xy}^2}{S_{xx}} (n-2)}{ S_{yy} – \frac{S_{xy}^2}{S_{xx}}}\)
=\(\frac{S_{xy}^2 (n-2)}{S_{xx} S_{yy}- S_{xy}^2}\)
=\(\frac{\frac{S_{xy}^2}{S_{yy}S_{xx}}(n-2)}{1-\frac{S_{xy}^2}{S_{yy} S_{xx}}}\)
=\(\frac{r^2(n-2)}{1-r^2}\)
ここで、\(r^2\)=\(\frac{S_{xy}^2}{S_{xx} S_{yy}}\)です。
t分布の検定統計量\( t(n-2,α)\)=\(\frac{|r|\sqrt{n-2}}{\sqrt{1-r^2}}\)の2乗の式になりました。
F(1,φA,α)=t(φA,α)2
よって、無相関の検定で使う、検定統計量がt分布の式で作ることができます。
導出を見れば気づくと思いますが、
F(1,φe,α)ですから、t分布より簡単な式ですね。無相関の検定をt分布で計算させるのは試験だからと思ってもよいでしょう。
F分布とt分布の関係(補講)
t分布の確率変数は t=\(\frac{Z}{\sqrt{\frac{W}{n}}}\)
(分子ZはN(0,12)の標準正規分布、分母は自由度nのχ2乗分布の平方根)
とします。これは、t分布の定義です。なぜ?ではなく、そう決めたものです。
両辺を2乗します。
\(t^2\)=\(\frac{Z^2}{\frac{W}{n}}\)
=\(\frac{χ^2(1,α)}{χ^2(n,α)}\)
=F(1,n,α)
となります。これは、F分布の定義です。なぜ?ではなく、そう決めたものです。
まとめ
無相関の検定について解説しました。相関係数があるのに、相関の有無を検定する理由と、無相関の検定の式が複雑な式である理由を解説しました。
- ➀相関係数があるのになんで相関の有無を調べたいのか?
- ②無相関の検定の検定統計量を導出
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119