(必読)クラメールの連関係数が導出できる
「クラメールの連関係数の式ってどうやって導出するの?」など、疑問に思いませんか?
こういう疑問に答えます。
本記事のテーマ
おさえておきたいポイント
- ➀クラメールの連関係数とは
- ②(必読)クラメールの連関係数を導出する
➀クラメールの連関係数とは
クラメールの連関係数とは
・\(χ^2\)=各セルについての \(\frac{(実測度数-期待度数)^2}{期待度数}\)
・\(n\):データ数
・\(k\):少ない方のカテゴリーの個数
・\(r_c\):クラメールの連関係数
\(r_c\)=\(\sqrt{\frac{χ^2}{n(k-1)}}\)
ここで、おさえるポイントは、
- 適合度の検定を使って、\(χ^2\)分布を使うこと
- 0 ≤ \(\sqrt{\frac{χ^2}{n(k-1)}}\) ≤1 なので、\(r_c\)を相関係数みたいに使う
クラメールの連関係数の計算例
よく、「クラメールの連関係数」で検索したり、教科書を読むと解き方や事例集ばかり解説していますが、
どうやって導出したの?
何で、こんな変な式なの?
何で、適合度の検定\(χ^2\)分布なの?
と疑問に思いますよね。
適合度の検定で\(χ^2\)分布を使う理由が説明できますか?
そもそも、
これも、どこにも書いていません。困った!
なので、関連記事を用意しています。QCプラネッツは、わからないことはすべて解説します!
【6】分割表(χ2乗分布)に関する検定【QC検定®2級対策】 QC検定®2級で頻出な、分割表に関する検定と推定の解法を解説します。検定から推定区間まで5分以内に解けるための流れとテクニックについて解説します。QC検定®2級合格したい方は必見です。 |
①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。
●リンクページ
この関連記事の、
「➂【本記事限定】分割表の検定統計量は\(χ^2\)分布である理由がわかる」
に書いています。
大事なポイントは
- \(A\)=\(\frac{(観測度数-期待度数)}{期待度数}\)
≡\(\frac{x-\bar{x}}{σ}\)のように見て - \(\sum A^2\)を分散のように扱うのでχ2乗分布で扱う
- 自由度は(列-1)(行-1)も理解しておく
ですね。関連記事で必ず確認してください。ここがわからないと、クラメールの連関係数は公式暗記で終わってしまいます。。。
②クラメールの連関係数を導出する
クラメールの連関係数を変形
\(r_c\)=\(\sqrt{\frac{χ^2}{n(k-1)}}\)自身は重要ではなく、
0 ≤ \(χ^2\) ≤ \(n(k-1)\)
を証明することを考えます。
観測度数と期待度数を用意する
ここで、行×列が\(J\)×\(I\)の表を用意して、観測度数と期待度数を文字式で表現します。
観測度数
下表のようにまとめます。
\(j\)/\(i\) | 1 | … | \(i\) | … | \(I\) | 計 |
1 | \(n_{11}\) | … | \(n_{i1}\) | \(n_{I1}\) | \(f_1\) | |
… | … | … | … | … | … | … |
\(j\) | \(n_{1j}\) | … | \(n_{ij}\) | \(n_{Ij}\) | \(f_j\) | |
… | … | … | … | … | … | … |
\(J\) | \(n_{1J}\) | … | \(n_{iJ}\) | \(n_{IJ}\) | \(f_J\) | |
計 | \(g_1\) | … | \(g_i\) | \(g_I\) | \(N\) |
期待度数
同様に下表のようにまとめます。ここで、\(j\)行\(i\)列の期待度数\(E_{ij}\)は
\(E_{ij}\)=\(\frac{g_i}{N}\)×\(\frac{f_j}{N}\)×\(N\)
=\(\frac{g_i f_j}{N}\)
と表現できます。抽象的な式なので、具体的な値で式を確認しましょう。
期待度数を下表にまとめます。
\(j\)/\(i\) | 1 | … | \(i\) | … | \(I\) | 計 |
1 | \(E_{11}\)=\(\frac{g_1 f_1}{N}\) | … | \(E_{i1}\)=\(\frac{g_i f_1}{N}\) | \(E_{I1}\)=\(\frac{g_I f_1}{N}\) | \(f_1\) | |
… | … | … | … | … | … | … |
\(j\) | \(E_{1j}\)=\(\frac{g_1 f_j}{N}\) | … | \(E_{ij}\)=\(\frac{g_i f_j}{N}\) | \(E_{Ij}\)=\(\frac{g_I f_j}{N}\) | \(f_j\) | |
… | … | … | … | … | … | … |
\(J\) | \(E_{1J}\)=\(\frac{g_1 f_J}{N}\) | … | \(E_{iJ}\)=\(\frac{g_i f_J}{N}\) | \(E_{IJ}\)=\(\frac{g_I f_J}{N}\) | \(f_J\) | |
計 | \(g_1\) | … | \(g_i\) | \(g_I\) | \(N\) |
\(χ^2\)を計算
定義どおり\(χ^2\)を計算します。
\(χ^2\)=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{(観測度数-期待度数)^2}{期待度数}\)
=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{(n_{ij}-E_{ij})^2}{ E_{ij}}\)
=(式1)
2乗を展開します。
(式1)
=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)(\(\frac{n_{ij}^2}{E_{ij}}-2n_{ij}+E_{ij}\))
=(式2)
ここで、(式2)の第1項は
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{E_{ij}}\)
=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j/N}\)
=\(N \sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\)
と変形します。
次に、(式2)の第2項は
=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(-2n_{ij}\)
=\(-2N\)
です。
そして、(式2)の第3項は
=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\( E_{ij}\)
=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\( \frac{g_i f_j}{N}\)
=\(\sum_{i=1}^{I} f_j \) \(\sum_{j=1}^{J}\ f_j /N\)
=\(\frac{N×N}{N}\)=\(N\)
です。
(式2)をまとめると、
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)(\(\frac{n_{ij}^2}{E_{ij}}-2n_{ij}+E_{ij}\))
=\(N \sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j } -2N+N\)
=\(N (\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }-1\))
=(式3)
となります。
証明のゴールを確認
で、ここで、ゴールを確認すると、
0 ≤ \(χ^2\) ≤ \(n(k-1)\)
を証明することを考えます。
0 ≤ \(χ^2\)は明らかですよね!
\(χ^2\)=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{(観測度数-期待度数)^2}{期待度数}\)
より分子は2乗で正かつ、分母の正なので、
0 ≤ \(χ^2\)は明らかですよね!
次に、
\(χ^2\) ≤ \(n(k-1)\)
と(式3)を比較すると
\(χ^2\) =\(N \sum_{i=1}^{I}\sum_{j=1}^{J}\)\((\frac{n_{ij}^2}{g_i f_j }-1\))
\(N→n\)、\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\)→\(k\)と置くと、
\(χ^2\) ≤ \(n(k-1)\)の形になっていますね。
つまり、ゴールまでもう少しですね。
証明の最後まで進めると
(式3)の
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\)ですが
そもそも
●\(\sum_{i=1}^{I} n_{ij}\) ≤ \(f_j\)
かつ
●\(\sum_{j=1}^{J} n_{ij}\) ≤ \(g_i\)
ですよね。
ここに注目すると
\( n_{ij}\) ≤ \(g_i\) かつ\( n_{ij}\) ≤ \(f_j\)が共に成立しますね。
この不等式を\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\)に代入すると
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\)
≤ \(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{g_i ×n_{ij}}{g_i f_j }\)
=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}}{f_j }\)
=\(\sum_{j=1}^{J}\)\(\frac{n_{1j}+n_{2j}+…+n_{Ij}}{f_j}\)
=\(\sum_{j=1}^{J}\)\(\frac{f_j}{f_j}\)
=\(\sum_{j=1}^{J}\)1
=\(J\)
まとめると、
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\) ≤ \(J\)
となります。
同様に、
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\)
≤ \(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}×f_j}{g_i f_j }\)
=\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}}{g_i }\)
=\(\sum_{i=1}^{I}\)\(\frac{n_{i1}+n_{i2}+…+n_{iJ}}{g_i}\)
=\(\sum_{i=1}^{I}\)\(\frac{g_i}{g_i}\)
=\(\sum_{i=1}^{I}\)1
=\(I\)
まとめると、
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\) ≤ \(I\)
となります。
つまり、共に上の2つの不等式が
成り立つわけですから、
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\) ≤ \(I\)
かつ
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\) ≤ \(J\)
となり、まとめると、
\(\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }\) ≤ \(k=min(I,J)\)
とします。
以上から
(式3)と上の不等式の関係を代入すると
\(χ^2\)=(式3)
=\(N (\sum_{i=1}^{I}\sum_{j=1}^{J}\)\(\frac{n_{ij}^2}{g_i f_j }-1\))
≤ \(n(k-1)\)
(\(N→n\), \(k=min(I,J)\)とする。)
よって、
0 ≤ \(χ^2\) ≤ \(n(k-1)\)
が証明できました。
両辺を\(n(k-1)\)で割り、\(χ^2\)の2乗を平方根に変えた変数の方が使いやすいということで、
\(r_c\)=\(\sqrt{\frac{χ^2}{n(k-1)}}\)
と置くと、0~1までの変数となり、
相関係数や寄与率に似た変数として扱える!
というわけです。
難しい導出過程でしたが、ちゃんとできましたね!
公式は導出できてから使いましょう。
まとめ
「クラメールの連関係数が導出できる」を解説しました。
- ➀クラメールの連関係数の計算例
- ②(必読)クラメールの連関係数を導出する
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119