カテゴリー: 基本統計量

  • 【簡単】確率分布関数がすぐ身につく方法

    【簡単】確率分布関数がすぐ身につく方法

    「正規分布、t分布、F分布がわからない」、「確率・期待値・標準偏差の計算になぜ積分があるのかがわからない」、「苦手な数学が多くて辛い」など困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    【初心者向け】確率分布関数がすぐわかる方法【5分で理解できます】

    身近な関数から確率密度関数に慣れよう!

    • ➀確率密度関数が理解できる
    • ②確率、期待値、標準偏差の算出ができる
    • ③正規分布,t分布は難しい式になる理由がわかる

    本記事を読んでいるあなたは、確率分布関数をマスターしたいはずです。いくつかの確率分布関数がすぐわかる関連記事がありますので、関連記事も読んでください。

    ★品質管理・統計に頻出な分布関数をわかりやすく解説したページ



    ★理解が難しいポアソン分布がすぐ理解できるページ

    ★ばらつきはなぜ平方和で評価するか?統計学で最初に悩むポイントがすぐ解決できるページ

    [themoneytizer id=”105233-2″]

    さっそく見ていきましょう。

    ➀確率密度関数が理解できる

    難しい式ではなく、簡単な式で練習しましょう。

    まず、分布をイメージします。

    中央にピークが来る。
    左右対象で左右端は0。

    最も簡単な関数は2次関数ですね

    次に、分布関数を理解しやすい問いを作ります。「学校の試験の点数分布」としてみましょう。
    変数xを点数、変数yを生徒数として、分布関数を定義します。

    分布関数: y=-(x-50)^2+2500

    簡単な二次関数ですね。分布関数は、0点,100点の人は少なく、平均50点に近づくにつれて生徒数が増えているのがわかりますね。

    ②確率、期待値、標準偏差の算出ができる

    試験成績の分布を2次関数で用意したので、次の問いを見てみましょう。

    • (1)この試験の総受験者数は何人ですか?
    • (2)ある受験者が70点台の受験者である確率はいくらですか?
    • (3)この試験の平均点と点数の標準偏差は何点ですか?

    受験者数、平均点、標準偏差と調べたくなるデータですね。

    分布関数から算出するポイント

    求めたい値を図から求めよう。
    (1)この試験の総受験者数は何人ですか?

    (1)この試験の総受験者数は図のどこに相当するかというと、分布関数とy軸に囲まれた青色部の面積ですね。これはイメージしやすいですね/p>

    分布関数2b

    計算は分布関数y=-(x-50)^2+2500をx=0からx=100まで積分した定積分の値となりますね
    総受験者数=∫ -(x-50)^2+2500 dx=16万6667人となります。

    (2)ある受験者が70点台の受験者である確率はいくらですか?

    (2)ある受験者が70点台の受験者数は図どこに相当するかというと、分布関数、y軸とx=70から80に囲まれた青色部の面積ですね。これもイメージしやすいですね

    分布関数2c

    計算は分布関数y=-(x-50)^2+2500をx=70からx=80まで積分した定積分の値を(1)の総受験数で割った値となります
    総受験者数=∫ -(x-50)^2+2500 dx=1万7037人となります。確率は0.102となります。

    (3)この試験の平均点と点数の標準偏差は何点ですか?

    関数が簡単でも徐々に計算が難しくなってきますね。1つずつ解説します

    (3) 平均点、分散、標準偏差を求めるときに1つ細工をします。
    f(x)={-(x-50)^2+2500}/N (Nは総受験者数)とします。
    これはf(x)とy軸との面積をN→1に変えるためです。総面積は全確率1に合わせるためです。

    平均μ=E[X]=∫ xf(x)dx と公式から求めます。
    平均μ=E[X]=∫x{-(x-50)^2+2500}/N dx = 50点となります。

    次に分散です。公式 V[X]=E[X^2]-E[X]^2ですね。公式についてはここを参照ください。

    V[X]=∫ x^2 f(x)dx -E[X]^2=3000-2500=500
    よって標準偏差はs=√V=22.36点となります。

    簡単な関数を用いて確率分布関数から積分を活用して期待値(平均値)、分散、標準偏差を導出しました。

    ③正規分布,t分布は難しい式になる理由がわかる

    正規分布の詳細はここをご覧ください。指数関数の2乗型であり、t分布はΓ関数のオンパレードで手が出ません。エクセル頼みになってしまいますね

    でもなぜ、一般の確率分布関数は簡単な式で表現できないのでしょうか?
     頭のいい数学者が一般人を寄せ付けないためでしょうか?
     それなら一般に広がりませんよね。
    確率分布関数にノミネートされるには下の条件が必要と考えられます。

    • ➀区間[-∞、∞]で積分値∫f(x)dxが有限な値になること
    • ②左右対称性であること/li>
    • ③なめらかな曲線であること

    「➀区間[-∞、∞]で積分値∫f(x)dxが有限な値になる」には、指数関数 exp(-x)などの難解な関数が必要です。
    高校数学の数Ⅲ以上のレベルになり、一気に難しくなります。

    なお、∫ -(x-50)^2+2500 dxの区間[-∞、∞]で積分すると∞に発散しますね。

    「②左右対称性であること」はわかりやすいので解説は略します。

    「③なめらかな曲線であること」を解説します。例として、➀②を満たし、正規分布より簡単な関数を提案します。

    f(x) =exp(-|x|) です。
    絶対値はありますが、場合分けして外せば、微積分しても関数が変わらないexp(-x)なので、扱いやすい関数で有能です。

    でも正規分布関数は不定積分がないexp(-x^2)型です。計算が複雑にも関わらずよく使われるのはなぜでしょうか?

    f(x) =exp(-|x|)と正規分布関数f(x) =exp(-x^2)を図で比較するとその理由がよくわかります。

    分布関数2c

    左側は尖っていて、右側はなめらかですね
    自然現象や社会現象のヒストグラムを描くと多くの場合、「なめらか」な正規分布型に近づくのです。

    分布関数が難しい式になる理由

    • ➀区間[-∞、∞]で積分値∫f(x)dxが有限な値になること
    • ②左右対称性であること/li>
    • ③なめらかな曲線であること

    まとめ

    • ➀確率密度関数が理解できる
    • ②確率、期待値、標準偏差の算出ができる
    • ③正規分布,t分布は難しい式になる理由がわかる

    本記事を読んでいるあなたは、確率分布関数をマスターしたいはずです。いくつかの確率分布関数がすぐわかる関連記事がありますので、関連記事も読んでください。

    ★品質管理・統計に頻出な分布関数をわかりやすく解説したページ



    ★理解が難しいポアソン分布がすぐ理解できるページ

    ★ばらつきはなぜ平方和で評価するか?統計学で最初に悩むポイントがすぐ解決できるページ

error: Content is protected !!