【簡単】確率分布関数がすぐ身につく方法
「正規分布、t分布、F分布がわからない」、「確率・期待値・標準偏差の計算になぜ積分があるのかがわからない」、「苦手な数学が多くて辛い」など困っていませんか?
こういう疑問に答えます。
本記事のテーマ
身近な関数から確率密度関数に慣れよう!
- ➀確率密度関数が理解できる
- ②確率、期待値、標準偏差の算出ができる
- ③正規分布,t分布は難しい式になる理由がわかる
本記事を読んでいるあなたは、確率分布関数をマスターしたいはずです。いくつかの確率分布関数がすぐわかる関連記事がありますので、関連記事も読んでください。
★品質管理・統計に頻出な分布関数をわかりやすく解説したページ
【簡単】F分布がすぐ使いこなせる【初心者向け】
【簡単】t分布がすぐ使いこなせる【初心者向け】
【簡単】χ2乗分布がすぐ使いこなせる【初心者向け】
【簡単】χ2乗分布とt分布とF分布がすぐわかる【初心者向け】
★理解が難しいポアソン分布がすぐ理解できるページ
【簡単】わかりやすく理解できるポアソン分布
★ばらつきはなぜ平方和で評価するか?統計学で最初に悩むポイントがすぐ解決できるページ
【簡単】統計学最初の関門「平方和」がマスターできる【初心者向け】
さっそく見ていきましょう。
➀確率密度関数が理解できる
難しい式ではなく、簡単な式で練習しましょう。
まず、分布をイメージします。
左右対象で左右端は0。
最も簡単な関数は2次関数ですね
次に、分布関数を理解しやすい問いを作ります。「学校の試験の点数分布」としてみましょう。
変数xを点数、変数yを生徒数として、分布関数を定義します。
分布関数: y=-(x-50)^2+2500
簡単な二次関数ですね。分布関数は、0点,100点の人は少なく、平均50点に近づくにつれて生徒数が増えているのがわかりますね。
②確率、期待値、標準偏差の算出ができる
試験成績の分布を2次関数で用意したので、次の問いを見てみましょう。
- (1)この試験の総受験者数は何人ですか?
- (2)ある受験者が70点台の受験者である確率はいくらですか?
- (3)この試験の平均点と点数の標準偏差は何点ですか?
受験者数、平均点、標準偏差と調べたくなるデータですね。
分布関数から算出するポイント
(1)この試験の総受験者数は図のどこに相当するかというと、分布関数とy軸に囲まれた青色部の面積ですね。これはイメージしやすいですね/p>
計算は分布関数y=-(x-50)^2+2500をx=0からx=100まで積分した定積分の値となりますね
総受験者数=∫ -(x-50)^2+2500 dx=16万6667人となります。
(2)ある受験者が70点台の受験者数は図どこに相当するかというと、分布関数、y軸とx=70から80に囲まれた青色部の面積ですね。これもイメージしやすいですね
計算は分布関数y=-(x-50)^2+2500をx=70からx=80まで積分した定積分の値を(1)の総受験数で割った値となります
総受験者数=∫ -(x-50)^2+2500 dx=1万7037人となります。確率は0.102となります。
関数が簡単でも徐々に計算が難しくなってきますね。1つずつ解説します
(3) 平均点、分散、標準偏差を求めるときに1つ細工をします。
f(x)={-(x-50)^2+2500}/N (Nは総受験者数)とします。
これはf(x)とy軸との面積をN→1に変えるためです。総面積は全確率1に合わせるためです。
平均μ=E[X]=∫ xf(x)dx と公式から求めます。
平均μ=E[X]=∫x{-(x-50)^2+2500}/N dx = 50点となります。
次に分散です。公式 V[X]=E[X^2]-E[X]^2ですね。公式についてはここを参照ください。
V[X]=∫ x^2 f(x)dx -E[X]^2=3000-2500=500
よって標準偏差はs=√V=22.36点となります。
簡単な関数を用いて確率分布関数から積分を活用して期待値(平均値)、分散、標準偏差を導出しました。
③正規分布,t分布は難しい式になる理由がわかる
正規分布の詳細はここをご覧ください。指数関数の2乗型であり、t分布はΓ関数のオンパレードで手が出ません。エクセル頼みになってしまいますね
でもなぜ、一般の確率分布関数は簡単な式で表現できないのでしょうか?
頭のいい数学者が一般人を寄せ付けないためでしょうか?
それなら一般に広がりませんよね。
確率分布関数にノミネートされるには下の条件が必要と考えられます。
- ➀区間[-∞、∞]で積分値∫f(x)dxが有限な値になること
- ②左右対称性であること/li>
- ③なめらかな曲線であること
「➀区間[-∞、∞]で積分値∫f(x)dxが有限な値になる」には、指数関数 exp(-x)などの難解な関数が必要です。
高校数学の数Ⅲ以上のレベルになり、一気に難しくなります。
なお、∫ -(x-50)^2+2500 dxの区間[-∞、∞]で積分すると∞に発散しますね。
「②左右対称性であること」はわかりやすいので解説は略します。
「③なめらかな曲線であること」を解説します。例として、➀②を満たし、正規分布より簡単な関数を提案します。
f(x) =exp(-|x|) です。
絶対値はありますが、場合分けして外せば、微積分しても関数が変わらないexp(-x)なので、扱いやすい関数で有能です。
でも正規分布関数は不定積分がないexp(-x^2)型です。計算が複雑にも関わらずよく使われるのはなぜでしょうか?
f(x) =exp(-|x|)と正規分布関数f(x) =exp(-x^2)を図で比較するとその理由がよくわかります。
左側は尖っていて、右側はなめらかですね。
自然現象や社会現象のヒストグラムを描くと多くの場合、「なめらか」な正規分布型に近づくのです。
分布関数が難しい式になる理由
- ➀区間[-∞、∞]で積分値∫f(x)dxが有限な値になること
- ②左右対称性であること/li>
- ③なめらかな曲線であること
まとめ
- ➀確率密度関数が理解できる
- ②確率、期待値、標準偏差の算出ができる
- ③正規分布,t分布は難しい式になる理由がわかる
本記事を読んでいるあなたは、確率分布関数をマスターしたいはずです。いくつかの確率分布関数がすぐわかる関連記事がありますので、関連記事も読んでください。
★品質管理・統計に頻出な分布関数をわかりやすく解説したページ
【簡単】F分布がすぐ使いこなせる【初心者向け】
【簡単】t分布がすぐ使いこなせる【初心者向け】
【簡単】χ2乗分布がすぐ使いこなせる【初心者向け】
【簡単】χ2乗分布とt分布とF分布がすぐわかる【初心者向け】
★理解が難しいポアソン分布がすぐ理解できるページ
【簡単】わかりやすく理解できるポアソン分布
★ばらつきはなぜ平方和で評価するか?統計学で最初に悩むポイントがすぐ解決できるページ
【簡単】統計学最初の関門「平方和」がマスターできる【初心者向け】
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119