【簡単】χ2乗分布とt分布とF分布がすぐわかる【初心者向け】
「χ2乗分布とt分布とF分布の式は複雑でわからない」、「χ2乗分布とt分布とF分布の関係がわからない」、「解き方は暗記したけど本質がわからない」など、分布の特性や利用目的を理解しないまま、検定や推定、分散分析していませんか?
こういう疑問に答えます。
本記事のテーマ
分布関数を理解するポイント
- ➀χ2乗分布→t分布→F分布の順で学ぶ
- 分布関数は導出イメージが理解できる
- ③正規分布、χ2乗分布、t分布とF分布の関係
さっそく見ていきましょう。
➀χ2乗分布→t分布→F分布の順で学ぶ
教科書あるある
教科書は、母平均の検定に使う正規分布とt分布を先に、分散の検定に使うχ2乗分布とF分布を後に紹介します。
確かに、この順番でもOKですが、
本記事はt分布よりχ2乗分布を先に解説します。
本記事
分布関数は導出イメージが理解できる
それぞれの分布関数の使い方は個別の記事で紹介しますが、全体像を本記事で理解してください。
・正規分布
・χ2乗分布
・t分布
・F分布
χ2乗分布は分散の検定のために作られた関数
χ2乗分布の定義を見ましょう。
\(χ^2=\frac{(X_1-\bar{X})^2+(X_2-\bar{X})^2+…+(X_n-\bar{X})^2}{σ^2}\)
は、自由度N-1のχ2乗分布になる。
正しいですが、わかりませんよね。簡単にわかるよう解説します。
統計量の最重要な確認事項
・平均
・ばらつき
しか使いません。まず、これだけ理解してください。
平均を扱うのが、正規分布、t分布です。
母集合の母分散が既知で理想的な分布な正規分布
母集合の母分散が未知で現実的な分布なt分布
と、平均を扱う分布は2種類あります。
次にばらつき(分散)用の分布も必要になりますね。
χ2乗分布は分散の検定のために作られた関数で
正規分布から出発します。
平均\(\bar{x}\)、分散\(σ^2\)の正規分布に従う変数\(x_i\)の分散を考えます。
まず、変数\(x_i\)を標準化します。標準化についてはここを見てください。
\( \frac{x_i-\bar{x}}{σ}\)
そして、この2乗和が平方和であり、分散を考えるχ2乗分布関数の基本形になります。
χ2乗分布関数
関数のイメージ:(χ2乗分布関数)=Σ(正規分布関数)^2
(χ2乗分布関数)
\( f(x)= \frac{1}{2^{\frac{k}{2}}}\)\(Γ(\frac{k}{2}) \)\(x^{\frac{k}{2}-1}\)\(e^{\frac{x}{2}} \) (A)
(正規分布関数)
\( f(x)=\frac{1}{\sqrt{2π}}exp(-\frac{x^2}{2}) \)(B)
と超難解な式です。ですが、
(A)=Σ(B)^2で計算できる
の理解で十分です。あとの難解な計算や式は、数学者にお願いしましょう。
実務で統計学を早く理解するポイント
・数学的な正しさより、相手にわかりやすい説明ができることが重要!
χ2乗分布関数
χ2乗分布関数は、ざっくり書くと
\( Z=\sum_{i} (\frac{x_i-\bar{x}}{σ})^2\)
ですね。よく見ると、
\(\sum_{i} (x_i-\bar{x})^2\)
は平方和Sですよね。
つまり、
$$ χ^2 = \frac{S}{σ^2} $$
の関係があります。よく教科書にありますが、本記事を読めば、暗記する必要はありません。
χ2乗分布のさらなる特徴については、χ2乗分布を読んでください。
t分布は正規分布の一部を取り出した分布
t分布の定義を見ましょう。
\(X=\frac{Z}{\sqrt{Y/n}}\)
は自由度n-1のt分布に従う。
正しいですが、全然意味がわからないですね。簡単にわかるよう解説します。
本記事で先に、χ2乗分布関数を説明した理由は、
t分布の導出にχ2乗分布関数が必要だからです。
平均を扱うのが、正規分布、t分布です。
母集合の母分散が既知で理想的な分布な正規分布
母集合の母分散が未知で現実的な分布なt分布
ですね。
正規分布は、理想・全体、無限のイメージですが、
t分布は、現実・一部・有限のイメージがあります。
t分布のイメージ
・一部/全体についてはχ2乗分布関数を使う。
・正規分布、t分布は平均\(x\)、χ2乗分布は分散\(x^2\)なため、χ2乗分布の平方根を使う
t分布 X = 正規分布 Z / √ χ2乗分布Y になっていますね!
正規分布はσを、t分布はσではなく自由度nを使う理由
t分布 X = 正規分布 Z / √χ2乗分布Y
をよく見ると、
正規分布 Z のσ/√χ2乗分布(σ^2/n)
→ σ/√(σ^2/n)=nとざっくり計算できますね。
σ→nに変わっていますよね。これが、
正規分布はσを、t分布はσではなく自由度nを使う
わかりやすい理由です。
数学的な証明ではないため、厳密さは欠けますが、
慣れないうちはこの程度の説明で十分です。
私がわかりやすい説明を考え抜いた結果、この説明にたどり着きました。
t分布のさらなる特徴については、t分布を読んでください。
F分布は分散比の検定のために作られた関数
F分布の定義を見ましょう。
\( X=\frac{\frac{Y}{m}}{\frac{Z}{n}}\)
は自由度(m,n)のF分布に従う。
正しいですが、わかりにくいですね。簡単にわかるよう解説します。
F分布の目的
・分散比だから、χ2乗分布関数の比になる。
・F分布によって、分散分析ができる。
分散比だから、χ2乗分布関数の比になるわけですから、
F分布関数= χ2乗分布関数1/ χ2乗分布関数2
となりますよね。
χ2乗分布関数1 と χ2乗分布関数2は自由度が異なるため、
F分布は両方の自由度が必要となるのも理解できますね。
F分布はこれだけわかれば十分です。
F分布のさらなる特徴については、F分布を読んでください。
③正規分布、χ2乗分布、t分布とF分布の関係
4つの分布関数の関係をざっくり書くと下の図のようになります。まずはこれだけわかれば十分実務に活かせます。
それぞれの関係と、利用目的が理解しやすいですね。活用できる良いイメージ図です。
なお、厳密に書くと下図になります。でも、わかりにくいですね。
まとめ
正規分布、χ2乗分布、t分布、F分布の順で、実務や試験に活かせるようにわかりやすく解説しました。かなりイメージがついて、検定・推定、分散分析の解法に自信がついたでしょう。
- ➀χ2乗分布→t分布→F分布の順で学ぶ
- 分布関数は導出イメージが理解できる
- ③正規分布、χ2乗分布、t分布とF分布の関係
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119