QCプラネッツ 品質のプロフェッショナルを育成するサイト

無相関の検定がわかる

回帰分析

「相関係数があるのになんで相関の有無を検定する必要があるの?」、「無相関の検定の検定統計量の式がどうしてあの式なの?」など、疑問に思いませんか?

こういう疑問に答えます。

本記事のテーマ

無相関の検定がわかる

おさえておきたいポイント

  • ➀相関係数があるのになんで相関の有無を調べたいのか?
  • ②無相関の検定の検定統計量を導出

試験でよく出る問題なので、公式暗記して代入すれば試験はOKですが、意味がよくわからないはずです。どの教科書にも無相関の検定について十分な説明がないからです。

●You tube動画もごらんください。

➀相関係数があるのになんで相関の有無を調べたいのか?

相関係数rがある(0ではない)のに、無相関の検定ってどういうこと?
と思いますよね。

どの教科書にも書いていませんでしたので、私の考えを紹介します。

標本データから相関係数を算出しますが、母集団は本当に相関性があるのか?は気になります。

標本データから母集団の相関性を調べるための方法が、無相関の検定と考えるとよいでしょう。イメージ図を下図に書きます。

無相関の検定

よくあるのが、たまたま線形性(相関性)の高いデータが集まった標本データをとったが、データ全体を見ると均一にばらついていることがよくあります。木を見て森を見ずです。

たまたま、標本データに強い相関性が出たからといって、母集団も相関性があるかどうかはわからない。だから、本当にデータ集団全体も相関性があるかを確認する必要あります。

②無相関の検定の検定統計量を導出

検定統計量

無相関の検定について、検定統計量は次式です。

\( t(n-2,α)\)=\(\frac{|r|\sqrt{n-2}}{\sqrt{1-r^2}}\)

t分布、相関係数の両方が出て来るので、テストによく出題されます。

でも、どうやって導出したの? 自由度はなんで、n-2なの? 気になりませんか? なので、導出しましょう!

検定統計量の導出

F分布から導出

検定統計量はt分布の式でした。でもなんでF分布なの? と不思議ですが、導出していきます。

標本データから母集団を推測する方法

分散を使って、標本データと母集団はそれほど差がなく同じものと仮定します。よって分散比を使ったF分布からスタートします。統計学は数学を使って厳密に解く場合と、統計だけにざっくり定義する場合もあります。

相関の有無

相関の有無を式で定義しましょう。相関Rが多いか?それとも残差eが多いか?を比較すればよいのです。

回帰分析における分散分析は、回帰Rと残差eの比較ですね。

\(\frac{V_R}{V_e}=F(φ_R,φ_e,α)=F(1, φ_e,α)\)ですね。

\(\frac{V_R}{V_e}= F(1, φ_e,α)\)は一見難しいですが、分散分析表でF値を計算するときに、分散の比と自由度をそれぞれ使うことがわかれば、この式は理解できますね。

\(\frac{V_R}{V_e}\)をどんどん変形する

\(\frac{V_R}{V_e}\)=\(\frac{S_R / φ_R}{S_e / φ_e}\)
=\(\frac{S_R / 1}{S_e / (n-2)}\)
(\(S_e=S_T-S_R\)を代入)
= \(\frac{S_R (n-2)}{S_T – S_R}\)
=(あ)

(回帰の自由度)=1,(残差自由度)=n-2ですね。

また、回帰について、T,R,eの平方和を数式で表現します。
\(S_T\)=\(S_{yy}\)
\(S_R\)=\(\frac{S_{xy}^2}{S_{xx}} \)
を(あ)に代入します。

(あ)= \(\frac{ \frac{S_{xy}^2}{S_{xx}} (n-2)}{ S_{yy} – \frac{S_{xy}^2}{S_{xx}}}\)

=\(\frac{S_{xy}^2 (n-2)}{S_{xx} S_{yy}- S_{xy}^2}\)

=\(\frac{\frac{S_{xy}^2}{S_{yy}S_{xx}}(n-2)}{1-\frac{S_{xy}^2}{S_{yy} S_{xx}}}\)

=\(\frac{r^2(n-2)}{1-r^2}\)

ここで、\(r^2\)=\(\frac{S_{xy}^2}{S_{xx} S_{yy}}\)です。

t分布の検定統計量\( t(n-2,α)\)=\(\frac{|r|\sqrt{n-2}}{\sqrt{1-r^2}}\)の2乗の式になりました。

F分布とt分布の関係
F(1,φA,α)=t(φA,α)2

よって、無相関の検定で使う、検定統計量がt分布の式で作ることができます。

\( t(n-2,α)\)=\(\frac{|r|\sqrt{n-2}}{\sqrt{1-r^2}}\)

導出を見れば気づくと思いますが、

無相関の検定はF検定でもよいのです。

F(1,φe,α)ですから、t分布より簡単な式ですね。無相関の検定をt分布で計算させるのは試験だからと思ってもよいでしょう。

F分布とt分布の関係(補講)

t分布の確率変数は t=\(\frac{Z}{\sqrt{\frac{W}{n}}}\)
(分子ZはN(0,12)の標準正規分布、分母は自由度nのχ2乗分布の平方根)
とします。これは、t分布の定義です。なぜ?ではなく、そう決めたものです。

両辺を2乗します。
\(t^2\)=\(\frac{Z^2}{\frac{W}{n}}\)

=\(\frac{χ^2(1,α)}{χ^2(n,α)}\)

=F(1,n,α)
となります。これは、F分布の定義です。なぜ?ではなく、そう決めたものです。

まとめ

無相関の検定について解説しました。相関係数があるのに、相関の有無を検定する理由と、無相関の検定の式が複雑な式である理由を解説しました。

  • ➀相関係数があるのになんで相関の有無を調べたいのか?
  • ②無相関の検定の検定統計量を導出


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!