QCプラネッツ 品質のプロフェッショナルを育成するサイト

【簡単】確率分布関数がすぐ身につく方法

基本統計量

「正規分布、t分布、F分布がわからない」、「確率・期待値・標準偏差の計算になぜ積分があるのかがわからない」、「苦手な数学が多くて辛い」など困っていませんか?

こういう疑問に答えます。

本記事のテーマ

【初心者向け】確率分布関数がすぐわかる方法【5分で理解できます】

身近な関数から確率密度関数に慣れよう!

  • ➀確率密度関数が理解できる
  • ②確率、期待値、標準偏差の算出ができる
  • ③正規分布,t分布は難しい式になる理由がわかる

本記事を読んでいるあなたは、確率分布関数をマスターしたいはずです。いくつかの確率分布関数がすぐわかる関連記事がありますので、関連記事も読んでください。

★品質管理・統計に頻出な分布関数をわかりやすく解説したページ



★理解が難しいポアソン分布がすぐ理解できるページ

★ばらつきはなぜ平方和で評価するか?統計学で最初に悩むポイントがすぐ解決できるページ

さっそく見ていきましょう。

➀確率密度関数が理解できる

難しい式ではなく、簡単な式で練習しましょう。

まず、分布をイメージします。

中央にピークが来る。
左右対象で左右端は0。

最も簡単な関数は2次関数ですね

次に、分布関数を理解しやすい問いを作ります。「学校の試験の点数分布」としてみましょう。
変数xを点数、変数yを生徒数として、分布関数を定義します。

分布関数: y=-(x-50)^2+2500

簡単な二次関数ですね。分布関数は、0点,100点の人は少なく、平均50点に近づくにつれて生徒数が増えているのがわかりますね。

②確率、期待値、標準偏差の算出ができる

試験成績の分布を2次関数で用意したので、次の問いを見てみましょう。

  • (1)この試験の総受験者数は何人ですか?
  • (2)ある受験者が70点台の受験者である確率はいくらですか?
  • (3)この試験の平均点と点数の標準偏差は何点ですか?

受験者数、平均点、標準偏差と調べたくなるデータですね。

分布関数から算出するポイント

求めたい値を図から求めよう。
(1)この試験の総受験者数は何人ですか?

(1)この試験の総受験者数は図のどこに相当するかというと、分布関数とy軸に囲まれた青色部の面積ですね。これはイメージしやすいですね/p>

分布関数2b

計算は分布関数y=-(x-50)^2+2500をx=0からx=100まで積分した定積分の値となりますね
総受験者数=∫ -(x-50)^2+2500 dx=16万6667人となります。

(2)ある受験者が70点台の受験者である確率はいくらですか?

(2)ある受験者が70点台の受験者数は図どこに相当するかというと、分布関数、y軸とx=70から80に囲まれた青色部の面積ですね。これもイメージしやすいですね

分布関数2c

計算は分布関数y=-(x-50)^2+2500をx=70からx=80まで積分した定積分の値を(1)の総受験数で割った値となります
総受験者数=∫ -(x-50)^2+2500 dx=1万7037人となります。確率は0.102となります。

(3)この試験の平均点と点数の標準偏差は何点ですか?

関数が簡単でも徐々に計算が難しくなってきますね。1つずつ解説します

(3) 平均点、分散、標準偏差を求めるときに1つ細工をします。
f(x)={-(x-50)^2+2500}/N (Nは総受験者数)とします。
これはf(x)とy軸との面積をN→1に変えるためです。総面積は全確率1に合わせるためです。

平均μ=E[X]=∫ xf(x)dx と公式から求めます。
平均μ=E[X]=∫x{-(x-50)^2+2500}/N dx = 50点となります。

次に分散です。公式 V[X]=E[X^2]-E[X]^2ですね。公式についてはここを参照ください。

V[X]=∫ x^2 f(x)dx -E[X]^2=3000-2500=500
よって標準偏差はs=√V=22.36点となります。

簡単な関数を用いて確率分布関数から積分を活用して期待値(平均値)、分散、標準偏差を導出しました。

③正規分布,t分布は難しい式になる理由がわかる

正規分布の詳細はここをご覧ください。指数関数の2乗型であり、t分布はΓ関数のオンパレードで手が出ません。エクセル頼みになってしまいますね

でもなぜ、一般の確率分布関数は簡単な式で表現できないのでしょうか?
 頭のいい数学者が一般人を寄せ付けないためでしょうか?
 それなら一般に広がりませんよね。
確率分布関数にノミネートされるには下の条件が必要と考えられます。

  • ➀区間[-∞、∞]で積分値∫f(x)dxが有限な値になること
  • ②左右対称性であること/li>
  • ③なめらかな曲線であること

「➀区間[-∞、∞]で積分値∫f(x)dxが有限な値になる」には、指数関数 exp(-x)などの難解な関数が必要です。
高校数学の数Ⅲ以上のレベルになり、一気に難しくなります。

なお、∫ -(x-50)^2+2500 dxの区間[-∞、∞]で積分すると∞に発散しますね。

「②左右対称性であること」はわかりやすいので解説は略します。

「③なめらかな曲線であること」を解説します。例として、➀②を満たし、正規分布より簡単な関数を提案します。

f(x) =exp(-|x|) です。
絶対値はありますが、場合分けして外せば、微積分しても関数が変わらないexp(-x)なので、扱いやすい関数で有能です。

でも正規分布関数は不定積分がないexp(-x^2)型です。計算が複雑にも関わらずよく使われるのはなぜでしょうか?

f(x) =exp(-|x|)と正規分布関数f(x) =exp(-x^2)を図で比較するとその理由がよくわかります。

分布関数2c

左側は尖っていて、右側はなめらかですね
自然現象や社会現象のヒストグラムを描くと多くの場合、「なめらか」な正規分布型に近づくのです。

分布関数が難しい式になる理由

  • ➀区間[-∞、∞]で積分値∫f(x)dxが有限な値になること
  • ②左右対称性であること/li>
  • ③なめらかな曲線であること

まとめ

  • ➀確率密度関数が理解できる
  • ②確率、期待値、標準偏差の算出ができる
  • ③正規分布,t分布は難しい式になる理由がわかる

本記事を読んでいるあなたは、確率分布関数をマスターしたいはずです。いくつかの確率分布関数がすぐわかる関連記事がありますので、関連記事も読んでください。

★品質管理・統計に頻出な分布関数をわかりやすく解説したページ



★理解が難しいポアソン分布がすぐ理解できるページ

★ばらつきはなぜ平方和で評価するか?統計学で最初に悩むポイントがすぐ解決できるページ


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!