QCプラネッツ 品質のプロフェッショナルを育成するサイト

【簡単】正規分布は怖くない!正規分布表や確率計算の求め方がすぐわかる

基本統計量

「正規分布とは何か?」、「正規分布の難解な式が理解できない」、「正規分布表の意味がわからない」など困っていませんか?難解な公式を暗記だけして済ませていませんか?

こういう疑問に答えます。

本記事のテーマ

【簡単】正規分布の特徴や確率計算の求め方がすぐわかる【初心者向け】

正規分布を理解するポイント

  • ➀正規分布がなぜよく使われるかがわかる
  • ②正規分布はどんな確率密度関数かがわかる
  • ③正規分布表の使い方が理解できる

記事の信頼性

記事を書いている私は、QC検定®1級合格し、つまずきやすいQC検定®2級挑戦者に難解な確率密度関数をわかりやすく解説しています。

正規分布の理解を深めるための関連記事を紹介します。眺めて、慣れて、手で計算して習得しましょう。






さっそく見ていきましょう。

●商標使用について、
①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

●You tube動画もご確認ください。

➀正規分布がなぜよく使われるかがわかる

世の中のデータや分布をグラフにまとめると、

  • ・中心がピーク
  • ・中心の前後で対称性をもつ
  • ・なめらかな曲線になる

のような分布が綺麗とされています。

身長、体重、試験点数などを分布にとると、綺麗な分布になりますよね。
数学的に証明されていませんが、多くのデータが不思議と正規分布にのります

経験的に、社会現象、生物などのデータをとってきた結果、綺麗な分布な正規分布に従うことがおおいため、正規分布が確率密度関数の中心的存在となっています。
だから、教科書で最初に習う関数なのです。

「正規」に意味はない

正規分布の「正規」とは何か? 理想的? 中心的? など気になりますが、
「正規」に意味はありません。正規分布を英語にすると「normal distribution」です。
正規分布とは、標準的「normal」な確率密度関数です。

②正規分布はどんな確率密度関数かがわかる

確率密度関数は難しいイメージがありますが、y=ax+bやy=\(x^2\)などの簡単な関数でも良いです。

ただし、で解説したように、区間[-∞,∞]で定積分∫f(x)dxが有限値を取り、なめらかである必要があります。

よって、指数関数などの難しい式になります。

正規分布関数の難しい式を見る前に、正規分布関数の特徴をおさえましょう。

正規分布関数の特徴

  • ・特徴1:平均0、分散\(1^2\)な関数
  • ・特徴2:y軸に対称でなめらか
  • ・特徴3:不定積分がないため積分計算が困難

正規分布の平均と分散(特徴1)

特徴1については平均がμ、分散\(σ^2\)と一般型にできますが、本記事では簡単のため平均0、分散\(1^2\)で解説します。なお、平均(期待値E)と分散Vは次の式で計算できます。
期待値E,分散Vを積分から算出する過程も慣れてください。

$$ E= \int xf(x) dx $$
$$ V=\int x^2f(x) dx -E^2 $$

y軸に対称でなめらか(特徴2)

で解説したように、y軸対称で平均0、分散\(1^2\)な関数は正規分布以外にもあります。

$$ f(x)=\frac{1}{4} e^{-|x|} $$

です。期待値E=0,分散V=1になります。しかし、\(e^{-x}\)型は尖っていて、なめらかではないため、あまり使いません。正規分布の関数より簡単な式なのに、残念!

なめらかな形状が必要な理由は、高い山をイメージすればわかります。例えば富士山の山頂は尖って要らずなめらかですよね。頂上ほど大気などによって削られてなめらかになります。多くのデータも中心付近でなめらかになります。

分布関数

不定積分がないため積分計算が困難(特徴3)

正規分布の関数の最大に弱点が、不定積分が求められないことです。つまり、
\(\int e^{-x^2}\)=??
なのです。

大学数学を駆使すれば定積分
\( \int_{-∞}^∞ f(x)dx\)
は計算できます。

不定積分がなければ、求めたい区間の積分値が計算できません。

積分値が計算できないため正規分布表がある

正規分布表の使い方を理解する前に、区間の定積分が計算できないから表があることを理解しましょう。

なお、なめらかさを取らずに、正規分布関数を
\( f(x)=\frac{1}{4} e^{-|x|} \)
にすれば、区間の定積分が簡単に計算できます。この場合、正規分布表は不要ですね。

近似値で確率を求めるイメージ

近似値として積分値を求めるイメージを紹介します。

正規分布

赤線部dSの面積を求めます。曲線とはいえ、微小な領域を小さくすれば、面積dSはほぼ台形として近似して良いです。
図では例として、x=0.14と0.15の区間の面積dSとして台形の面積を求めます。
実際はx=0.14と0.15と差0.01よりもっと細かくして微小面積dSを求めていきます。

数値計算やシミュレーションでは積分できないものは細かく細分化して台形の面積としてかき集めることをやります。

③正規分布表の使い方が理解できる

正規分布表の使い方

  • 1.確率は面積(積分)から求める
  • 2.正規分布表の距離Kpと面積pとの関係をイメージできる
  • 3.自力で面積が算出できないから正規分布表があることを理解する

1.確率は面積(積分)から求める

確率は確率密度関数から面積(積分)で求めることがイメージできない方は、

を読んでください。

確率密度関数は、変数xの区間[a,b]に発生する確率を算出したり、全体の分布がわかる便利な関数です。
また、確率密度関数の全区間の積分値は全確率1になります。

面積(積分)の計算が楽になるように、確率密度関数を簡単な式にしたいのですが、変な式ばかりなのが現実です。これが苦手意識につながります。苦手な人はイメージだけ持ってください。計算は世の中の数学が好きな人にお願いしましょう。

2.正規分布表の距離Kpと面積pとの関係をイメージできる

正規分布表はKpとpから値を読み取ります。ただの数表と思わず、面積で考えるイメージを持ってください。

正規分布表

正規分布表は下の図の青部の面積とそのxの位置を数値化したものです

正規分布表とグラフ

まず縦にxに相当するKpがあります。正規分布は正負対称のグラフなので、正(x≧0)のみ表があれば十分です。例えば、Kp=1.96の時は確率P=0.05ですが、Kp=-1.96の時も同じ確率P=0.05です。

次に確率Pを見ます。確率PはKpが0の時は図3の左図のように1の半分の0.5と最大になりますが、Kpが大きくなるにつれて確率Pは小さくなります。表で見ると確率Pは上が大で下に行くにつれて確率Pは小になります。正規分布のグラフをイメージしましょう。

最後に表の横の流れを見ます。表の横は、Kpの0.01の桁とそれに対応する確率Pの値が書いており、横の流れは微調整程度と理解してください。本来はKpの値ですから縦に並べるべきですが、表が縦長になるため、0.01桁は横に流しているわけです。

よく使う正規分布表の値

・Kp=0.00の時は確率P=0.5ですね。
・片側検定でよく使うP=0.05のときのKp=1.645。
・両側検定でよく使うP=0.025(=0.05/2)のときのKp=1.96
表の見方を暗記するのではなく、関数のグラフをよく見て理解しましょう。

3.自力で面積が算出できないから正規分布表があることを理解する

正規分布表の見方がわかれば、おしまいではなく、慣れたころにも再度ここに戻ってきてください。
なぜ正規分布表があるのか?説明できますか? それは積分計算が大変だからです。
正規分布表の使い方という手段だけでなく、正規分布表が必要な意味や目的も理解しましょう。

まとめ

本記事では、正規分布がよく活用される背景や、分布の特徴、正規分布表の存在意義や使い方を解説しました。計算だけでなくグラフ、面積、確率を図でイメージすることが重要です。

  • ➀正規分布がなぜよく使われる関数なのかがわかる
  • ②正規分布はどんな確率密度関数かがわかる
  • ③正規分布表の使い方が理解できる

正規分布の理解を深めるための関連記事を紹介します。眺めて、慣れて、手で計算して習得しましょう。







Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!