★ 本記事のテーマ
【簡単】高校数学で十分できる二項分布【初心者向け】
- ➀高校数学の確率を復習
- ②二項分布の期待値・分散は暗記
- ③二項分布の正規分布化を実例で体験
- ④OC曲線に二項分布が必須
- ⑤二項分布の式がマスターできる!
- ⑥二項分布の期待値・分散の導出(その1)
- ⑦二項分布の期待値・分散の導出(その2)
「正規分布、二項分布、ポアソン分布の公式を覚えるのが大変」、「二項分布って何?」、「正規分布がなぜ出てくるの?」、「OC曲線にも二項分布が出てくるけど何で?」など困っていませんか?
★記事の信頼性
記事を書いている私は、QC検定®1級合格し、つまずきやすいQC検定®2級挑戦者に難解な確率密度関数をわかりやすく解説しています。
●商標使用について、
①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。
●リンクページ
★理解を深めるための関連記事を紹介
基本統計量をマスターするために必要な関連記事を紹介します。ご確認ください。
【1】分散、平方和、確率変数に慣れる
●【簡単】確率分布関数がすぐ身につく方法
●【簡単】統計学最初の関門「平方和」がマスターできる【初心者向け】
●確率変数の期待値と分散が計算できる【初心者向け】
【2】正規分布、二項分布、ポアソン分布に慣れる
●【初心者必見】正規分布の標準化や応用問題は怖くない!必勝解法を解説します。
●【簡単】χ2乗分布とt分布とF分布がすぐわかる【初心者向け】
●【簡単】わかりやすく理解できるポアソン分布
●【簡単】正規分布は怖くない!正規分布表や確率計算の求め方がすぐわかる
さっそく見ていきましょう。
➀高校数学の確率を復習
統計学や品質管理を勉強しているあなたは、高校数学をすでに勉強しているはずです。確率の良問を見ながら、二項分布に入っていきましょう。
問:1から6まで等確率で出るサイコロ1個を600回投げる。
1がr回出る確率をPrとする。
(1) Prをrの式で表せ。
(2) Prが最大になるrはいくらか。
(1)は組み合わせの確率問題ですね。
600回のうち、n回1(確率1/6)が出て、600-n回はそれ以外(確率5/6)が出ます。
どのn回に1が出るかは組み合わせで求めましたよね。式でまとめます。
Pr=\( _nC_r p^r (1-p)^{n-r} \)
を使いますね。わからない場合は高校数学確率の章に戻って復習しましょう。
n=600,p=\(\frac{1}{6}\)を代入すればよいです。
よって、
Pr=\( {}_{600}C_r (\frac{1}{6})^r (\frac{5}{6})^{600-r} \)
(2)は解いてみてください。詳細は解説集に載せています。ご覧下さい。答えはr=100のときです。
確率\(\frac{1}{6}\)で600回振るから100回になるのも納得できます。
(1)の式を見ると、二項分布の式そのものですね。
高校数学を学んでいれば二項分布の式は書けるはずです。大学の難しい数学ではありませんね。
②二項分布の期待値・分散は暗記
●期待値E[X]=np
●分散V[X]=np(1-p)
高校数学で期待値と分散は証明できるのですが、意外と難しいです。
しかし、計数値の検定・推定(母不適合品率がある場合の検定・推定)や
計数値管理図(pn管理図、p管理図)に二項分布が使われます。
検定や管理図を使いこなせるレベル(資格でいうとQC検定®2級合格レベル)までは
期待値と分散は公式暗記でよいです。
なお、期待値E[X]=np、分散V[X]=np(1-p)の証明はここに記載しています。
➀の例題で、サイコロ1個をn=600回、確率p=\(\frac{1}{6}\)ですか、np=100が期待値となります。
③二項分布の正規分布化を実例で体験
実際にやってみましょう。
1から6まで等確率のサイコロを1個から6個までそれぞれ1回振って、出た目の合計をxとし、xが出る確率をPxとする。
サイコロ1個から6個についてxとPxの関係をグラフに図示せよ。
サイコロが1個2個の場合
●サイコロが1個の場合
| 目 |
1 |
2 |
3 |
4 |
5 |
6 |
回数 |
1 |
1 |
1 |
1 |
1 |
1 |
回数を6で割ると確率Pになりますね。
●サイコロが2個の場合
| 目 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
回数 |
1 |
2 |
3 |
4 |
5 |
6 |
5 |
4 |
3 |
2 |
1 |
回数を36で割ると確率Pになりますね。
サイコロ1個,2個の場合についてグラフを描くと、次のとおりです。二項分布とはいえ、直線で角々していますね。

サイコロが3個以上の場合
同様にサイコロの数を増やしていきます。その結果、滑らかな曲線になっていき、正規分布に近い形になっていますね。サイコロの数の目の出方は一見、正規分布とは関係がありませんが、データが増えるにつれて正規分布近似できるようになります。これが科学・社会データも同じことが言えます。不思議ですね。

ここで大事なのは、二項分布に従うデータも数が増えると正規分布に近づくことを実例で理解することです。教科書暗記せず、体感することが大切です。なお、サイコロの場合、たったn=3で正規分布に従う形になります。
最初から二項分布を使わずに正規分布で考えても良いかもしれませんね。
二項分布の理解を深める演習問題を解きましょう
理解度のアップと、QC検定®2級の合格と一石二鳥です。
●基本統計量の演習問題【QC検定®2級対策】
●【必読】基本統計量をマスターする【QC検定®2級対策】
④OC曲線に二項分布が必須
抜取検査で必須なOC曲線(Operating Characteristic curve)に二項分布の式が必須です。
OC曲線は丸暗記する人が多いので、式で理解しましょう。解説します。
OC曲線の目的
一定の不良率pをもつサンプルを抜取検査する。不良率pとそのサンプルの合格率L(p)の関係を明確するためにOC曲線を描く。
OC曲線は合格率L(p)と不良率pの関係を見るわけですから、縦軸はL(p)、横軸はpですね。
次にL(p)の式を作りましょう。
検査合格条件は不良数c個以下とします。不良率pのサンプル(サンプル数n)を取り出した際、不良がr個ある確率を式化し、0≦r≦cの場合の確率を合計がL(p)になります。
式で書くと
\( \sum_{r=0}^{c} {}_nC_r p^r(1-p)^{n-r} \)
と書けます。
OC曲線は、不良率から消費者危険、生産者危険、(n,c)によるグラフの関係性を見ます。これは抜取検査の記事で詳細に解説します。
大事なのは、OC曲線は二項分布の式で作ることです。グラフの性質を丸暗記せず、式で理解しましょう。式で理解した方が、応用が効くからです。
なお、いろいろな(n,c)の場合のOC曲線を見ましょう。ここまでグラフ化した図は本記事以外にありません。エクセルとVBAを使ってグラフにしました。貴重なデータですよ。

ここから先は、期待値、分散を導出します。もう少し見ていきましょう。
⑤二項分布の式がマスターできる!
二項定理を理解する
まず、 \((p+q)^n\)を展開すると、
\((p+q)^n\)=\(p^n\)+…+\(q^n\)となりますね。
これをまとめると
\((p+q)^n\)=\(\sum_{r=0}^{n} {}_n C_r p^r q^{n-r}\)
となります。これが二項定理ですね。
特に、\(p+q=1\)の場合、
●\(\sum_{r=0}^{n} {}_n C_r p^r q^{n-r}\)=\((p+q)^n\)=1
となるし、\(p+q=2\)の場合、
●\(\sum_{r=0}^{n} {}_n C_r p^r q^{n-r}\)=\((p+q)^n\)=\(2^n\)
となりますね。これも高校数学でよく出題されたはずです。
今回は、
特に、\(p+q=1\)の場合、つまり、\(q=1^p\)の場合
●\(\sum_{r=0}^{n} {}_n C_r p^r q^{n-r}\)=\((p+q)^n\)=1
を使うのが二項分布です!
二項分布の式の構造を理解する
\(\sum_{r=0}^{n} {}_n C_r p^r q^{n-r}\)
の形が複雑すぎる!
大丈夫です。構造体として式を理解すればOK。式の構造をいじらずに式変形するのが二項分布の式を扱うポイントです。

固定と有るところは変えず、それ以外の値を計算する
二項分布の式の基本形を維持して式変形する
例を挙げます。
【例題】
●\(\sum_{r=0}^{n} {}_n C_r p^r q^{n-r}\)=\((p+q)^n\)=1
とする場合、
●\(\sum_{r=0}^{n} r {}_{n-1} C_{r-1} p^r q^{n-r}\)
はいくらか?
解いてみましょう。基本を変えないので、
\(\sum_{r=0}^{n} {}_n C_r p^r q^{n-r}\)
の式に持って行きます。
ところで、
●\( {}_n C_r\)=\(\frac{n!}{r!(n-r)!}\)です。この式も重要です!
なので、
●\({}_{n-1} C_{r-1}\)=\(\frac{(n-1)!}{(r-1)!(n-r)!}\)と機械的に公式代入すると、
\(\frac{(n-1)!}{(r-1)!(n-r)!}\)= \(\frac{r}{n}\)× \(\frac{n!}{r!(n-r)!}\)
= \(\frac{r}{n}\)× \( {}_n C_r\)
となるので、
問いの式は
●\(\sum_{r=0}^{n} r {}_{n-1} C_{r-1} p^r q^{n-r}\)
=\(\sum_{r=0}^{n} r \frac{1}{n} {}_n C_r p^r q^{n-r}\)
=\(\frac{1}{n} \)×\(\sum_{r=0}^{n} {}_n C_r p^r q^{n-r}\)
=\(\frac{1}{n} \)×1
=\(\frac{1}{n} \)
と計算できます。
二項分布の式の基本形を維持して式変形することが大事です。
では、この式変形を活用して、二項分布の期待値npと分散np(1-p)を2通りの解法で解いてみましょう。
⑥二項分布の期待値・分散の導出(その1)
問題
【問1】
確率変数Xが二項分布に従い、P(X=\(i\))=\( {}_n C_r p^r q^{n-r}\) (ただし、\(p+q=1\))に従うとき、期待値E(X)=\(np\)、分散V(X)=\(np(1-p)\)を以下のやり方で導出したい。
(1) \(i {}_n C_i \)=\(n {}_{n-1} C_{i-1} \) (\(i\) ≥1)を示し、E(X)=\(np\)を導出せよ。
(2) \(i (i-1) {}_n C_i \)=\(n(n-1) {}_{n-2} C_{i-2} \) (\(i\) ≥2)を示し、V(X)=\(npq\)を導出せよ。
期待値
(1)を解きます。
●\(i {}_n C_i \)=\(i \frac{n!}{i!(n-i)!}\)= \(\frac{n!}{(i-1)!(n-i)!}\)
= \(n \frac{(n-1)!}{(i-1)!(n-i)!}\)= \(n {}_{n-1} C_{i-1} \)
となります。
●期待値E(X)は
E(X)= \(\sum_{i=1}^{n} \) \(i\)\({}_n C_i p^i q^{n-i}\)
(E(X)なので、\(i\)を掛け算する必要がありますね。)
=\(\sum_{i=1}^{n} \) \(i\)\({}_n C_i p^i q^{n-i}\)
=\(\sum_{i=1}^{n} n {}_{n-1} C_{i-1} p^i q^{n-i}\)
=\(np\)\(\sum_{i=1}^{n} {}_{n-1} C_{i-1} p^{n-1} q^{(n-1)-(i-1)}\)
二項定理から
\(\sum_{i=1}^{n} {}_{n-1} C_{i-1} p^{n-1} q^{(n-1)-(i-1)}\)=1
なので、
=\(np\)
よって、
E(X)= \(np\)
となります。
二項定理の式変形、少し慣れたでしょうか?
分散
(2)を解きます。
●\(i(i-1) {}_n C_i \)=\(i(i-1) \frac{n!}{i!(n-i)!}\)= \(n(n-1)\frac{(n-2)!}{(i-2)!(n-i)!}\)
= \(n(n-1) {}_{n-2} C_{i-2} \)
となります。
まず、曲者であるE(X2)を計算します。
E(X2)= \(\sum_{i=0}^{n} \) \(i^2\)\({}_n C_i p^i q^{n-i}\)
(E(X2)なので、\(i^2\)を掛け算する必要がありますね。)
=\(\sum_{i=0}^{n} \) \(i^2\)\({}_n C_i p^i q^{n-i}\)
で、ここであえて、\(i^2=i(i-1)+i\)と分解します。ここはテクニックです。
=\(\sum_{i=1}^{n} i(i-1) {}_n C_i p^i q^{n-i}\)+\(\sum_{i=0}^{n} i {}_n C_i p^i q^{n-i}\)
=\(n(n-1)p^2 \sum_{i=2}^{n} {}_{n-2} C_{i-2} p^{i-2} q^{n-i}\)+\(np \sum_{i=1}^{n} {}_{n-1} C_{i-1} p^{i-1} q^{n-i}\)
と二項定理の式の構造体を作る事ができます。
よって、
E(X2)=\(n(n-1)p^2+np\)
となります。
よって、分散V(X)は
V(X)= E(X2)-E(X)
=\(n(n-1)p^2+np-(np)^2\)
=\(np(1-p)\)
⑦二項分布の期待値・分散の導出(その2)
問題
【問2】
確率変数Xが二項分布に従い、P(X=\(i\))=\( {}_n C_r p^r q^{n-r}\) (ただし、\(p+q=1\))に従うとき、期待値E(X)=\(np\)、分散V(X)=\(np(1-p)\)を以下のやり方で導出したい。
\(f(x)=(px+q)^n\)を使って、\(f^{‘}(x)\),\(f^{‘‘}(x)\)を導出して、E(X),V(X)を導出せよ。
期待値
(1)を解きます。
\(f(x)\)= \(\sum_{i=0}^{n} {}_n C_i (px)^i q^{n-i}\)として微分すると、
\(f^{‘}(x)\)=\(np(px+q)^{n-1}\)=\(\sum_{i=0}^{n} i {}_n C_i p^i x^{i-1} q^{n-i}\)
となるので、
\(f^{‘}(1)\)= \(\sum_{i=0}^{n} i {}_n C_i p^i 1^{i-1} q^{n-i}\)
=\(\sum_{i=0}^{n} i {}_n C_i p^i q^{n-i}\)
がまさに、 E(X)であり、
\(f^{‘}(1)\)=\(np(p×1+q)^{n-1}\)=\(np(p+q)\)=\(np\) (\(p+q=1\)となります。
あっさり解けましたね。
分散
(2)を解きます。
さらに微分して、
\(f^{‘‘}(x) \)=\(n(n-1)p^2 (px+q)^{n-2}\)= \(\sum_{i=0}^{n} i(i-1) {}_n C_i p^i x^{i-2} q^{n-i}\)
\(f^{‘‘}(1) \)=\(n(n-1)p^2\)=\(\sum_{i=0}^{n} i(i-1) {}_n C_i p^i q^{n-i}\)は前問の計算経過からもよく見ると、
\(f^{‘‘}(1) \)+\(np\)=E(X2)となるので、
V(X)= E(X2)-E(X)
=\(n(n-1)p^2+np-(np)^2\)
=\(np(1-p)\)
となります。2通りの解法で解けるので面白いですね!
以上、
①二項定理の式に慣れる
➁二項定理の式の構造体を活用して期待値、分散を計算する
をわかりやすく解説しました。
まとめ
二項分布は確率分布の一種と見ずに、高校数学の確率の延長にあるものです。二項分布は、正規分布に近づく不思議な性質があります。また、抜取検査のOC曲線のベースにもなります。高校数学で書ける易しい分布であると理解できます。
- ➀高校数学の確率を復習
- ②二項分布の期待値・分散は暗記
- ③二項分布の正規分布化を実例で体験
- ④OC曲線に二項分布が必須
- ⑤二項分布の式がマスターできる!
- ⑥二項分布の期待値・分散の導出(その1)
- ⑦二項分布の期待値・分散の導出(その2)