QCプラネッツ 品質のプロフェッショナルを育成するサイト

(必読)クラメールの連関係数が導出できる

回帰分析

「クラメールの連関係数の式ってどうやって導出するの?」など、疑問に思いませんか?

こういう疑問に答えます。

本記事のテーマ

(必読)クラメールの連関係数が導出できる

おさえておきたいポイント

  • ➀クラメールの連関係数とは
  • ②(必読)クラメールの連関係数を導出する

➀クラメールの連関係数とは

クラメールの連関係数とは

●クラメールの連関係数
・\(χ^2\)=各セルについての \(\frac{(実測度数-期待度数)^2}{期待度数}\)
・\(n\):データ数
・\(k\):少ない方のカテゴリーの個数
・\(r_c\):クラメールの連関係数
\(r_c\)=\(\sqrt{\frac{χ^2}{n(k-1)}}\)

ここで、おさえるポイントは、

  1. 適合度の検定を使って、\(χ^2\)分布を使うこと
  2. 0 ≤ \(\sqrt{\frac{χ^2}{n(k-1)}}\) ≤1 なので、\(r_c\)を相関係数みたいに使う

クラメールの連関係数の計算例

よく、「クラメールの連関係数」で検索したり、教科書を読むと解き方や事例集ばかり解説していますが、

\(r_c\)=\(\sqrt{\frac{χ^2}{n(k-1)}}\)は
どうやって導出したの?
何で、こんな変な式なの?
何で、適合度の検定\(χ^2\)分布なの?

と疑問に思いますよね。

適合度の検定で\(χ^2\)分布を使う理由が説明できますか?

そもそも、

適合度の検定で\(χ^2\)分布を使う理由もわからない。。。

これも、どこにも書いていません。困った!

なので、関連記事を用意しています。QCプラネッツは、わからないことはすべて解説します!

【6】分割表(χ2乗分布)に関する検定【QC検定®2級対策】
QC検定®2級で頻出な、分割表に関する検定と推定の解法を解説します。検定から推定区間まで5分以内に解けるための流れとテクニックについて解説します。QC検定®2級合格したい方は必見です。

●商標使用について、
①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

この関連記事の、
「➂【本記事限定】分割表の検定統計量は\(χ^2\)分布である理由がわかる」
に書いています。

大事なポイントは

  1. \(A\)=\(\frac{(観測度数-期待度数)}{期待度数}\)
    ≡\(\frac{x-\bar{x}}{σ}\)のように見て
  2. \(\sum A^2\)を分散のように扱うのでχ2乗分布で扱う
  3. 自由度は(列-1)(行-1)も理解しておく

ですね。関連記事で必ず確認してください。ここがわからないと、クラメールの連関係数は公式暗記で終わってしまいます。。。

②クラメールの連関係数を導出する

クラメールの連関係数を変形

\(r_c\)=\(\sqrt{\frac{χ^2}{n(k-1)}}\)自身は重要ではなく、

●\(χ^2\)が
0 ≤ \(χ^2\) ≤ \(n(k-1)\)
を証明することを考えます。

観測度数と期待度数を用意する

ここで、行×列が\(J\)×\(I\)の表を用意して、観測度数と期待度数を文字式で表現します。

観測度数

下表のようにまとめます。

\(j\)/\(i\) 1 \(i\) \(I\)
1 \(n_{11}\) \(n_{i1}\) \(n_{I1}\) \(f_1\)
\(j\) \(n_{1j}\) \(n_{ij}\) \(n_{Ij}\) \(f_j\)
\(J\) \(n_{1J}\) \(n_{iJ}\) \(n_{IJ}\) \(f_J\)
\(g_1\) \(g_i\) \(g_I\) \(N\)

期待度数

同様に下表のようにまとめます。ここで、\(j\)行\(i\)列の期待度数\(E_{ij}\)は
\(E_{ij}\)=\(\frac{g_i}{N}\)×\(\frac{f_j}{N}\)×\(N\)
=\(\frac{g_i f_j}{N}\)
と表現できます。抽象的な式なので、具体的な値で式を確認しましょう。

期待度数を下表にまとめます。

\(j\)/\(i\) 1 \(i\) \(I\)
1 \(E_{11}\)=\(\frac{g_1 f_1}{N}\) \(E_{i1}\)=\(\frac{g_i f_1}{N}\) \(E_{I1}\)=\(\frac{g_I f_1}{N}\) \(f_1\)
\(j\) \(E_{1j}\)=\(\frac{g_1 f_j}{N}\) \(E_{ij}\)=\(\frac{g_i f_j}{N}\) \(E_{Ij}\)=\(\frac{g_I f_j}{N}\) \(f_j\)
\(J\) \(E_{1J}\)=\(\frac{g_1 f_J}{N}\) \(E_{iJ}\)=\(\frac{g_i f_J}{N}\) \(E_{IJ}\)=\(\frac{g_I f_J}{N}\) \(f_J\)
\(g_1\) \(g_i\) \(g_I\) \(N\)

\(χ^2\)を計算

定義どおり\(χ^2\)を計算します。

\(χ^2\)=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{(観測度数-期待度数)^2}{期待度数}\)
=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{(n_{ij}-E_{ij})^2}{ E_{ij}}\)
=(式1)

2乗を展開します。
(式1)
=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)(\(\frac{n_{ij}^2}{E_{ij}}-2n_{ij}+E_{ij}\))
=(式2)

ここで、(式2)の第1項は
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{E_{ij}}\)
=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j/N}\)
=\(N \sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\)
と変形します。

次に、(式2)の第2項は
=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(-2n_{ij}\)
=\(-2N\)
です。

そして、(式2)の第3項は
=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\( E_{ij}\)
=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\( \frac{g_i f_j}{N}\)
=\(\sum_{i=1}^{I} f_j \) \(\sum_{j=1}^{J}\ f_j /N\)
=\(\frac{N×N}{N}\)=\(N\)
です。

(式2)をまとめると、
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)(\(\frac{n_{ij}^2}{E_{ij}}-2n_{ij}+E_{ij}\))
=\(N \sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j } -2N+N\)
=\(N (\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }-1\))
=(式3)
となります。

証明のゴールを確認

で、ここで、ゴールを確認すると、

●\(χ^2\)が
0 ≤ \(χ^2\) ≤ \(n(k-1)\)
を証明することを考えます。

0 ≤ \(χ^2\)は明らかですよね!
\(χ^2\)=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{(観測度数-期待度数)^2}{期待度数}\)
より分子は2乗で正かつ、分母の正なので、
0 ≤ \(χ^2\)は明らかですよね!

次に、
\(χ^2\) ≤ \(n(k-1)\)
と(式3)を比較すると
\(χ^2\) =\(N \sum_{i=1}^{I}\sum_{j=1}^{J}\)\((\frac{n_{ij}^2}{g_i f_j }-1\))
\(N→n\)、\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\)→\(k\)と置くと、
\(χ^2\) ≤ \(n(k-1)\)の形になっていますね。
つまり、ゴールまでもう少しですね。

証明の最後まで進めると

(式3)の
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\)ですが
そもそも
●\(\sum_{i=1}^{I} n_{ij}\) ≤ \(f_j\)
かつ
●\(\sum_{j=1}^{J} n_{ij}\) ≤ \(g_i\)
ですよね。

ここに注目すると
\( n_{ij}\) ≤ \(g_i\) かつ\( n_{ij}\) ≤ \(f_j\)が共に成立しますね。

この不等式を\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\)に代入すると
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\)
≤ \(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{g_i ×n_{ij}}{g_i f_j }\)
=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}}{f_j }\)
=\(\sum_{j=1}^{J}\)\(\frac{n_{1j}+n_{2j}+…+n_{Ij}}{f_j}\)
=\(\sum_{j=1}^{J}\)\(\frac{f_j}{f_j}\)
=\(\sum_{j=1}^{J}\)1
=\(J\)

まとめると、
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\) ≤ \(J\)
となります。

同様に、
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\)
≤ \(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}×f_j}{g_i f_j }\)
=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}}{g_i }\)
=\(\sum_{i=1}^{I}\)\(\frac{n_{i1}+n_{i2}+…+n_{iJ}}{g_i}\)
=\(\sum_{i=1}^{I}\)\(\frac{g_i}{g_i}\)
=\(\sum_{i=1}^{I}\)1
=\(I\)

まとめると、
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\) ≤ \(I\)
となります。

つまり、共に上の2つの不等式が
成り立つわけですから、
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\) ≤ \(I\)
かつ
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\) ≤ \(J\)
となり、まとめると、
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\) ≤ \(k=min(I,J)\)
とします。

以上から

(式3)と上の不等式の関係を代入すると
\(χ^2\)=(式3)
=\(N (\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }-1\))
≤ \(n(k-1)\)
(\(N→n\), \(k=min(I,J)\)とする。)

よって、
0 ≤ \(χ^2\) ≤ \(n(k-1)\)
が証明できました。

両辺を\(n(k-1)\)で割り、\(χ^2\)の2乗を平方根に変えた変数の方が使いやすいということで、

●クラメールの連関係数
\(r_c\)=\(\sqrt{\frac{χ^2}{n(k-1)}}\)
と置くと、0~1までの変数となり、
相関係数や寄与率に似た変数として扱える!
というわけです。

難しい導出過程でしたが、ちゃんとできましたね!

公式は導出できてから使いましょう。

まとめ

「クラメールの連関係数が導出できる」を解説しました。

  • ➀クラメールの連関係数の計算例
  • ②(必読)クラメールの連関係数を導出する


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!