【重要】分散分析の期待値は極限値としてとらえる
「分散分析の期待値って何?」、「期待値とはいっても、何の平均?」、「分散分析の期待値はいつも文字式でなぜ数値が出ないの?」など、分散分析において、分散の期待値は何者か?について疑問に思いませんか?
こういう疑問に答えます。
本記事のテーマ
分散分析の期待値は極限値としてとらえる
- ➀わかりやすい期待値とわかりにくい期待値
- ②分散分析の期待値は極限として理解する
- ③データ数を極限増やした場合の分散分析
記事の信頼性
記事を書いている私は、実験計画法に磨きをかけていますので、わかりやすく解説します。
➀わかりやすい期待値とわかりにくい期待値
期待値については、関連記事確率変数の期待値と分散が計算できる【初心者向け】に解説しています。
期待値は、簡単な内容と、難解な内容があります。
- サイコロの出る目の期待値(平均値)は簡単
- E[V]の数学公式が出てくると一気に期待値が難しくなる
分散分析の期待値は、期待値の難解な内容である、E[V]の数学公式を使って求めます。そのため、数式の理解が難解です。分散分析のE[V]の列の文字式を丸暗記で済ませるしかないオチになっています。
②分散分析の期待値は極限として理解する
わかりやすい分散の期待値とは
\(\displaystyle \lim_{n \to \infty} V(A)\)
③データ数を極限増やした場合の分散分析
では本当に、データ数をおもいっきり増やしたら平均平方(不偏分散)Vが分散の期待値\(σ_*^2\)に近づくのかを実験してみましょう。
簡単のため、一元配置実験とし、因子A水準3とします。繰り返し回数nをどんどん増やしてみます。
n | A1 | A2 | A3 |
1 | 12 | 26 | 28 |
2 | 17 | 19 | 21 |
3 | 16 | 17 | 23 |
・・・ | ・・・ | ・・・ | ・・・ |
∞ | ・・・ | ・・・ | ・・・ |
繰返し数n=3の場合
n=3 | S | Φ | V |
A | 194 | 2 | 97 |
e | 70 | 6 | 11.67 |
T | 264 | 8 |
繰返し数n=69の場合
n=69 | S | Φ | V |
A | 2954.81 | 2 | 1477.41 |
e | 2415.79 | 204 | 11.84 |
T | 5370.61 | 206 |
繰返し数n=5241の場合
n=5241 | S | Φ | V |
A | 265576.21 | 2 | 132788.11 |
e | 187641.50 | 15720 | 11.94 |
T | 453217.72 | 15722 |
繰返し数n=10933の場合
n=10933 | S | Φ | V |
A | 547174.85 | 2 | 273587.42 |
e | 391492.52 | 32796 | 11.94 |
T | 938667.37 | 32798 |
ところで、一元配置実験の分散分析において、分散の期待値をまとめます。
S | Φ | V | E[V] | |
A | \(S_A\) | \(Φ_A\) | \(V_A\) | \(nσ_A^2+σ_e^2\) |
e | \(S_e\) | \(Φ_e\) | \(V_e\) | \(σ_e^2\) |
T | \(S_T\) | \(Φ_T\) | – | – |
\(σ_e^2\)=E[\(V_e\)]≡\(V_e\)
\(σ_A^2\)=E[\(\frac{V_A-V_e}{n}\)]≡\(\frac{V_A-V_e}{n}\)
として、各nの値に対して\(σ_e^2\),\(σ_A^2\)を推定します。
n | \(σ_e^2\) | \(σ_A^2\) |
3 | 11.67 | 28.44 |
69 | 11.84 | 21.24 |
5241 | 11.94 | 25.33 |
10933 | 11.93 | 25.02 |
・・・ | ・・・ | ・・・ |
上表から、
E[\(V_e\)]=\(σ_e^2\)≒11.9
E[\(\frac{V_A-V_e}{n}\)]=\(σ_A^2\)≒25.0
程度であることがわかります。
本記事の最も重要なポイント
しかし、本来はその水準には無限なデータがあり、
その一部を実験から調べているにすぎません。
測定データから、測定用の平方和や分散を求め、
期待値によって無限あるデータにおける平方和や分散を推測する
イメージが重要です。
分散分析表の右側にある,E[V]は単なる付けたしではなく、
無限あるデータを推測するためにあるのです。
以上から、分散分析の期待値は、平均値ではなく、データ数を∞に増やした場合の極限値として見ると理解しやすいことを解説しました。
まとめ
分散分析の期待値は極限値としてとらえる理由を解説しました。
- ➀わかりやすい期待値とわかりにくい期待値
- ②分散分析の期待値は極限として理解する
- ③データ数を極限増やした場合の分散分析
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119