大波の相関、小波の相関、符号検定がよくわかる
「大波の相関、小波の相関、符号検定がわからない」など、困っていませんか?
こういう疑問に答えます。
本記事のテーマ
おさえておきたいポイント
- ①符号検定と検定統計量の定義
- ➁検定統計量の期待値と分散は2項分布で解ける
- ➂符号検定表は自分で作れる
- ➃大波の相関、小波の相関の本質を理解せよ。
- ➄大波、小波以外の相関も考えてみよう。
①符号検定と検定統計量の定義
符号検定と検定統計量とは
ノンパラメトリック検定の一種で、次のように定義します。よく「1標本検定」とか言われます。
●帰無仮説: \(H_0\):\(θ\)=\(θ_0\)
●対立仮説: \(H_1\):\(θ\)≠\(θ_0\)
この場合、検定統計量を以下とし、N(0,12)に従う正規分布とする。
●\(Z\)=\(\frac{U-E[U]}{\sqrt{Var[U]}}\) ~N(0,12)
ただし、統計量\(U,Z_i\)は
●\(U\)=\(\sum_{i=1}^{n}Z_i\)
●\(Z_i\)=1 (\(X_i\) ≥ \(θ_0\))
=0 (\(X_i\) < \(θ_0\))
つまり、中央値以下なら\(Z_i\)は0で、中央値以上なら1とします。
これは、\(Z_i\)は中央値前後に同数個あるとして、
確率P=1/2を使って統計量の期待値と分散を計算するためです。
定義は難しいですが、統計量の期待値と分散の計算は簡単です。
➁検定統計量の期待値と分散は2項分布で解ける
符号検定のポイントは、二項定理と確率P=1/2であること
大波の相関、小波の相関でも話しますが、ポイントは、
ここがわかれば、
これを知らないと、大波の相関と小波の相関しか知らないとなってしまいます。
なので、
●\(Z_i\)が中央値以下のである確率
Pr{\(Z_i\)}=0
●\(Z_i\)が中央値以上のである確率
Pr{\(Z_i\)}=1
を使うと、
統計量\(U\)が\(θ_i\)より大きくなる確率Pは二項定理から
P=\(\sum_{r=0}^{i} {}_n C_r (\frac{1}{2})^r (\frac{1}{2})^{n-r} \)
と計算できます。
よくみると、
ここまで準備して、検定統計量の期待値と分散を計算します。
検定統計量の期待値を導出
二項分布の期待値は
E[U]=npですね。ここにp=\(\frac{1}{2}\)を代入します。
E[U]=\(\frac{n}{2}\)
おしまい!
検定統計量の分散を導出
二項分布の分散は
V[U]=np(1-p)ですね。ここにp=\(\frac{1}{2}\)を代入します。
V[U]=n\(\frac{1}{2}\)×\(\frac{1}{2}\)=\(\frac{n}{4}\)
おしまい!
シンプルに計算できます。
➂符号検定表は自分で作れる
符号検定表とは
符号検定では、比較したい2つの値の差から、符号検定表を使って検定します。
符号検定表は下表にあります。
N | 有意水準 α=1% |
有意水準 α=5% |
10 | 0 | 1 |
11 | 1 | 2 |
12 | 1 | 2 |
13 | 1 | 3 |
14 | 2 | 3 |
15 | 2 | 3 |
16 | 2 | 4 |
17 | 3 | 4 |
18 | 3 | 5 |
19 | 4 | 5 |
20 | 4 | 5 |
25 | 6 | 7 |
30 | 8 | 10 |
50 | 16 | 18 |
100 | 37 | 41 |
この符号検定表ですが、実は、
自分で作ると符号検定の意味がよくわかる!
符号検定表の値の求め方を理解せよ
符号検定表の値はどうやって計算するかですが、
Pr=\(\sum_{r=0}^{i}{}_n C_r p^r (1-p)^{n-r}\) ≥ \(α\) (有意水準)
を満たす最小の\(i\)を考えると、
\(i\)-1は
Pr ≤ \(α\) を満たす最大の整数になるので、
\(i\)-1の値が符号検定表の値になる。
検定統計量の期待値と分散にも出てきた、二項分布の式がしっかり入っていますね。
BINOM.inv(個数N,確率P,有意水準\(α\))-1
を代入します。
つまり、
Pr=\(\sum_{r=0}^{i} {}_n C_r p^r (1-p)^{n-r}\) ≥ \(α\)を満たす\(i\)に1引いた数式と
BINOM.inv(個数N,確率P,有意水準\(α\))-1
は同じ意味です。
1つ例を挙げて計算しましょう。
n=9 p=1/2でα=0.05の場合
Pr(i=0)=\({}_9 C_0\frac{1}{2}^0 (1-\frac{1}{2})^{9-0}\)=0.00195
Pr(i=1)=\({}_9 C_1\frac{1}{2}^1 (1-\frac{1}{2})^{9-1}\)=0.01953
Pr(i=2)=\({}_9 C_2\frac{1}{2}^2 (1-\frac{1}{2})^{9-2}\)=0.08984
…
と計算していきます。
ここで、
Pr(i=0)+Pr(i=1) < \(α\)=0.05
ですが、
Pr(i=0)+Pr(i=1)+Pr(i=2) > \(α\)=0.05
ですね。
なので、\(i\)=2となるので、
符号検定表の値は\(i\)-1=1
となります。
これをコツコツ計算すればOKですが、計算より、方法を理解しましょう。二項分布の式を使っているだけですね。
はっきりいうと、
➃大波の相関、小波の相関の本質を理解せよ。
では、符号検定から「大波の相関」、「小波の相関」があるわけですが、この分類はどこから来たのでしょうか? これを理解するのは解き方を暗記するより、はるかに重要です!
符号検定表の値を求める式は、検定統計量の式とよく似た
Pr=\(\sum_{r=0}^{i}{}_n C_r p^r (1-p)^{n-r}\) ≥ \(α\)
ですよね。この式から、「大波の相関」、「小波の相関」を意味する変数があります。どれか?わかりますか?
ヒントは、すでに本記事で話したとおり、
二項定理と確率P=1/2を使うこと
つまり、
確率P=1/2である場合を意味する。
確かに、
●大波の相関:中央値と比較
●小波の相関:前値と比較
ですから、
●大波の相関→中央値と比較して大小どちらかに割れる確率は1/2に近い
●小波の相関→前の値と比較して大小どちらかに割れる確率は1/2に近い
という意味です。
基本は符号検定表の値を求める式は同じ
なぜなら、大波の相関も小波の相関も符号検定表を使うわけですから、符号検定表の値を求める式は
Pr=\(\sum_{r=0}^{i}{}_n C_r p^r (1-p)^{n-r}\) ≥ \(α\)
で同じです。この式で表現できるケースがいくつかあり、その中の1つが
大波の相関と小波の相関と言うわけです。
大波、小波は何を意味するのか?
特に意味はなく、確率p=1/2として計算できるケースのうち2つが大波の相関と小波の相関ということです。
大波と小波で対義語が使われているので、2つしかないように思いますが、数式から考えるとそうではないことがわかりますね。
➄大波、小波以外の相関も考えてみよう。
別に他の定義で、相関性を検定してもいい
数式を再掲すると
Pr=\(\sum_{r=0}^{i}{}_n C_r p^r (1-p)^{n-r}\) ≥ \(α\)
ですから、別にp=1/2以外を使っても問題ありません。後は運用しやすいかどうかだけですね。
大波、小波以外の相関を調べてもOK
さっと分類すると下図のように、QCプラネッツでは考えています。
赤枠部を考えると、新たな相関分析ができそうですね。
まとめ
「大波の相関、小波の相関、符号検定がよくわかる」を解説しました。
- ①符号検定と検定統計量の定義
- ➁検定統計量の期待値と分散は2項分布で解ける
- ➂符号検定表は自分で作れる
- ➃大波の相関、小波の相関の本質を理解せよ。
- ➄大波、小波以外の相関も考えてみよう。
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119