QCプラネッツ 品質のプロフェッショナルを育成するサイト

正規分布の導出がよくわかる

統計学

「正規分布って何で\(e^{-x^2}\)なの?」、「正規分布の導出が理解できない!」と困っていませんか?

こういう疑問に答えます。

本記事のテーマ

正規分布の導出がよくわかる
  • ①正規分布の導出は難しすぎる
  • ➁正規分布は何で\(e^{-x^2}\)の式を使うの?
  • ➂わかりやすい正規分布の導出を伝授!
高校数学で十分わかる!
専門書に導出過程あるけど、読んでもわからない。。。
最も使う正規分布について、超わかりやすく解説します。数学が苦手でも大丈夫!QCプラネッツにお任せ下さい!

①正規分布の導出は難しすぎる

正規分布の導出方法は専門書を読んでもわからない

実は、正規分布の導出をしっかりまとめた本があります(無理にポチる必要はありません!)。

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

正規分布ハンドブック [ 蓑谷千凰彦 ]
価格:19800円(税込、送料無料) (2022/9/10時点)

この本のP137~181まで、「正規分布の歴史」として、過去の偉大な数学者が式の導出を解説しています。

でも、

読んでもわからない。。。

正規分布の導出方法が書いているサイトを見てもわからない。。。

ネットにも、いろいろ解説がありますが、

「正規分布 導出」で検索!

でも、でも、でも

読んでもわからない。。。
東大入試よりムズイで! 
わかる人いるん?くらいムズイ!

だから、本記事を書くことにしました。

➁正規分布は何で\(e^{-x^2}\)の式を使うの?

正規分布の「正規」って何なの?

わかります? この質問?

  • 正規分布の「正規」って、何が「正規」なの?
  • なんで、\(e^{-x^2}\)の式を使うの?

これを簡単に答えると、

  1. 中心が0、標準偏差が1であること
  2. 左右対称な分布関数であること
  3. [-∞,∞]で分布関数を積分しても有限な値であること

でOKです。

上の3条件を満たす関数なら、正規分布は\(f(x)=e^{-x^2}\)でなくてもOKです。ですが、\(f(x)=e^{-x^2}\)以外の関数を見たことがありません。

もしあったら教えてください。

この定義でいくと、分布関数は
\(f(x)=x^a+・・・\)とかは、[-∞,∞]で積分すると∞に発散するのでNGです。

なので、\(f(x)=e^{-g(x)}\)型が有効なのは理解できます。

ここで、疑問が沸きます!

\(f(x)=e^{-x}\)の方が、積分簡単なのに、
なんで、\(f(x)=e^{-x^2}\)と複雑な式を使うの?

高校数学や大学入試で、出て来る関数は圧倒的に、
\(f(x)=e^{-x}\)の方です!

なぜなら、

\(f(x)=e^{-x}\)は微分も積分も簡単にできて便利!

じゃー、正規分布も\(f(x)=e^{-x}\)にすればいいじゃん!

これをわかりやすく解説します。

➂わかりやすい正規分布の導出を伝授!

モデル式(微分方程式)を作る!

ガウスの公理というものがあります。感覚的に理解できるものです。

  1. 大きさの大きい正と負の誤差は等しい確率で生じる
  2. 小さい誤差は大きな誤差より起こりやすい
  3. ある限界値より大きな誤差は実際上起こらない
最初の「大きさの大きい正と負の誤差は等しい確率で生じる」は、
y軸で対称な確率密度関数\(\f(x))を用意すればOKということ。
先に最後の「ある限界値より大きな誤差は実際上起こらない」は、
モデル式とは関係ないので一旦保留にしておきます。

モデル式で大事なのは、

モデル式で大事なのは、
2つ目の「小さい誤差は大きな誤差より起こりやすい」。

これを式でQCプラネッツ的に考えます。

ヒントするのは、高校数学・物理で習う、「放射性物質の時間に対する質量の変化率は質量に変化する」です。

確率密度関数は下図のように、ある点\(x\)での確率\(f(x)\)(<1)の確率の変化\(f’(x)\)は、その確率\(f(x)\)(<1)に関係があるはずで、誤差が増える(\(x\)が増える)ほど、確率\(f(x)\)は0に近づくように値が下がっていきます。

正規分布1

これを表現すると
\(f’(x)\)=\(-af(x)\) (\(a\) >0)
と置いてもよいでしょう。

この微分方程式を解くと、
\(\frac{df}{dx}=-af\)
\(\frac{df}{f}=-adx\)
両辺を積分すると
\(log(f(x))=-ax\)
\(f(x)=e^{-ax}\)
となります。

あれ? 正規分布の式\(f(x)=e^{-x^2}\)じゃない!

正規分布が\(f(x)=e^{-x}\)でない理由の1つは、
下図のように尖っているから

正規分布2

ヒストグラムを書くと、もう少し滑らかな確率分布関数ですよね!

正規分布3

なので、モデル式を改造して再検討しましょう!

モデル式(微分方程式)を修正して再度解く!

正規分布は滑らかさが必要!
これをどうやってモデル式に表現したらよいか?

ヒストグラムを見ると、滑らかさの秘訣がわかります。

ある点まではゆっくり\(f(x)\)が下がるが
ある点を超えると一気に\(f(x)\)が下がる!

これを表現できるいい方法があります!
モデル式をこう変えます!

\(f’(x)\)=\(-af(x)\) (\(a\) >0)を
\(f’(x)\)=\(-axf(x)\) (\(a\) >0)に
変える!

つまり、\(x\)の積を追加すればOK!

\(x\)は 0 < \(x\) <1 の時、
\(f’(x)\)= \(axf(x)\) < \(af(x)\)より、
\(f’(x)\)は小さいから、\(f(x)\)の下がり方は小さい!

\(x\)は 1 < \(x\) の時、
\(f’(x)\)= \(axf(x)\) > \(af(x)\)より、
\(f’(x)\)は大きくなるから、\(f(x)\)は一気に下がる!

\(x\)の積を追加すれば、
正規分布の滑らかさが表現できていますね!

正規分布4

この微分方程式を解くと、
\(\frac{df}{dx}=-axf\)
\(\frac{df}{f}=-axdx\)
両辺を積分すると
\(log(f(x))=-\frac{1}{2}ax^2\)
\(f(x)=e^{-\frac{1}{2}ax^2}\)
となります。

正規分布の式になりましたね!

正規分布5

この説明の方が、正規分布の導出は理解しやすい!です。

本記事の注意点

正規分布の導出を簡易的に理解できる方法を本記事で解説しました。

ただし、厳密な証明をやっぱり身に着けたい方は、本や他のサイトで勉強してください。

QCプラネッツも厳密な証明方法をわかりやすく解説したかったのですが、
難しくて挫折したのと、
専門書の導出過程は強引な所が多々あるため、

本記事の簡易的な導出方法としました。

専門書と本記事を比較しても正規分布の導出については、
それほど説明力は変わらないのかもしれません。

難しい式や概念は、精度を下げてもいいから、わかりやすいものから理解する!
慣れてきたら、専門書で厳密な定義を理解する!

わかりやすい正規分布の導出方法を解説しました。

まとめ

「正規分布の導出がよくわかる」を解説しました。

  • ①正規分布の導出は難しすぎる
  • ➁正規分布は何で\(e^{-x^2}\)の式を使うの?
  • ➂わかりやすい正規分布の導出を伝授!


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!