カテゴリー: 基本統計量

  • 【初心者必見!】分散の加法性を使った問題が解ける

    【初心者必見!】分散の加法性を使った問題が解ける

    本記事のテーマ

    【初心者必見!】分散の加法性を使った問題が解ける
    • ①分散の加法性でおさえるべきポイント
    • ➁分散の加法性の演習問題
    QC検定®2級、1級で必ず出題される
    分散の加法性の解き方を伝授!
    何度も見て、解けるようになりましょう!
    ●商標使用について、
    ①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
    ➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
    ➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

    ①分散の加法性でおさえるべきポイント

    分散の加法性は展開できること

    まず、

    V(X+Y)=V(X)+2Cov(X,Y)+V(Y)
    は自力で導出できますか?
    QC検定®2級なら、 V(X+Y)=V(X)+V(Y)
    QC検定®1級なら、V(X+Y)=V(X)+2Cov(X,Y)+V(Y)
    と区別して暗記してませんか?
    ちゃんと自力で導出しようぜ!

    簡単なので、導出しましょう。自分で意味を理解することが大事です。

    自力で導出

    \(V(X+Y)\)=\(E((X_i-\bar{X})+(Y_i-\bar{Y}))^2\)は、分散の定義どおりですね。これを展開すると
    \(E((X_i-\bar{X})+(Y_i-\bar{Y}))^2\)=\(E((X_i-\bar{X})^2\)+2\(E((X_i-\bar{X})(Y_i-\bar{Y}))\)+\(E((Y_i-\bar{Y}))^2\)
    =V(X)+2Cov(X,Y)+V(Y)

    ここで、
    ●V(X)= \(E((X_i-\bar{X})^2\)
    ●Cov(X,Y)= \(E((X_i-\bar{X})(Y_i-\bar{Y}))\)
    ●V(Y)= \(E((Y_i-\bar{Y}))^2\)

    ちゃんと練習しておきましょう。

    X,Yが独立なら、Covは無視(QC検定®2級レベル)

    QC検定®2級では、よく、 

    変数X,Yは独立

    と書いていますが、これは、「共分散Covは考えなくていいというサイン」です。

    大事なポイント

    変数XにYを増減する場合の期待値と分散の±の動きに注目です。

    ●期待値E(X±Y)=E(X)±E(Y)
    ●分散V(X±Y)=V(X)+V(Y)

    と、

    分散は変数の増減に関係なく
    ●分散V(X±Y)=V(X)+V(Y)
    と増えます。

    理由はわかりますか? 理由が分かる方が、正しく計算できるより大事です。

    分散は2乗するので
    ±の2乗はすべて+になる!

    ですね。

    公式や問題を丸暗記せず、
    その理由をしっかり理解しましょう!

    自力で導出できれば公式暗記は不要になりますよね!

    X,Yに相関性あれば、Covも使う(QC検定®1級レベル)

    QC検定®1級レベルになると、共分散が出て来ますね。
    V(X+Y)=V(X)+2Cov(X,Y)+V(Y)
    は理解できたとしても、1つ疑問が出ます。

    共分散Cov(X,Y)はどこから値を求めるの?

    ですね。

    これはほとんどの場合、相関係数ρからCovを計算する流れになります。

    \(ρ(X,Y)\)=\(\frac{Cov(X,Y)}{V(X)V(Y)}\)
    から計算します。

    相関係数ρを問題文に与えれば、V(X),V(Y)がわかれば共分散は計算できますね。

    \(ρ(X,Y)\)=\(\frac{Cov(X,Y)}{V(X)V(Y)}\)
    ですが、自力で導出できますか?
    是非やってみてください。

    ➁分散の加法性の演習問題

    問題

    では①で解説したポイントを踏まえて問題を解きましょう。

    【問題】
    部品A(厚みxが母平均20.0mm,母標準偏差0.40mmの正規分布に従う)と部品B(厚みyが母平均30.0mm,母標準偏差0.60mmの正規分布に従う)がある。1個の部品Aを2個の部品Bで挟んで接着して作成させる組合せ部品Cを作る。部品Cは厚みにおいて、下限規格値78.0mm,上限規格値82.0mmの規定がある。
    (1) 部品Cの厚さの母平均と母標準偏差を求めよ。
    (2) 部品Cの厚みの母不適合品率を求めよ。
    (3) 部品Bを2つ選ぶときに、一方の部品Bの厚さが厚いときに、他方の部品Bの厚さは薄いものを選ぶようにする。2つの部品Bのそれぞれの厚みには負の相関(-0.2)があるようにする。
     ①2つの部品Bのそれぞれの厚みの共分散を求めよ。
     ②部品Cの厚みの母平均と母標準偏差を求めよ。

    (1)(2)は共分散Covの無い場合、(3)は共分散Covを考える場合ですね。

    解説

    問(1)
    ●母平均:80.0(=20.0+30.0×2)
    ●母標準偏差:0.934(=√(〖0.4〗^2+〖0.6〗^2+〖0.6〗^2 ))
    これは分散の加法性の基本ですね。

    問(2)
    答え:0.0332
    ●上限:u=(82-80)/0.934=2.14 Kp=2.14の時の確率P=0.0162
    ●下限:u=(80-78)/0.934=2.14 Kp=2.14の時の確率P=0.0162
    より、 0.0162×2=0.0332
    ここまではQC検定®2級レベルですね。

    問3①
    ●Cov(y1,y2)=ρ(y1,y2)×√(V_y1 V_y2 )=-0.2×0.36=-0.072
    公式どおり代入しましょう。

    問3➁
    ●母平均:80.0
    ●母標準偏差:0.858

    V(y1+y2)=V(y1)+V(y2)+2Cov(y1,y2)=0.62+0.62+2・1・1・(-0.072)=0.576
    V(z+y1+y2)=0.16+0.576=0.736 s=√V(z+y1+y2)=0.858
    共分散も考慮した計算結果になっていますね。

    問3➂
    答え:0.0198
    u=(82-80)/0.858=2.33 Kp=2.33の確率P=0.0099 0.0099×2=0.198
    となります。

    いかがでしょうか。分散の加法性の解き方を解説しました! 苦手な所があれば何度も読み返してマスターしましょう!QCの初心者を悩ます内容ですが、この計算をモノにしましょう!

    いろいろな問題が出ますが、エッセンスは本記事の内容です。ここを抑えれば大丈夫!

    まとめ

    「【初心者必見!】分散の加法性を使った問題が解ける」を解説しました。

    • ①分散の加法性でおさえるべきポイント
    • ➁分散の加法性の演習問題
  • 【初心者必見!】正規分布、二項分布、ポアソン分布が比較できる

    【初心者必見!】正規分布、二項分布、ポアソン分布が比較できる

    本記事のテーマ

    【初心者必見!】正規分布、二項分布、ポアソン分布が比較できる
    • ①3つの分布の分布関数、期待値、分散
    • ➁正規分布、二項分布、ポアソン分布を比較
    ●正規分布:\(\frac{1}{\sqrt{2π}σ} e^{-\frac{(x-μ)^2}{2σ^2}}\)
    ●二項分布:\({}_n C_r p^r (1-p)^{n-r}\)
    ●ポアソン分布:\(e^{-λ} \frac{λ^x}{x!}\)
    って式が全く別物だけど
    ぴったりそろうんだよね!

    正規分布、二項分布、ポアソン分布のグラフがぴったりそろえてみましょう。

    ①3つの分布の分布関数、期待値、分散

    さて、正規分布、二項分布、ポアソン分布の
    確率密度関数、期待値、分散は答えられますか?

    導出もよいですが、初心者は暗記から入ってもOKです。

    二項分布、ポアソン分布の期待値と分散は関連記事で丁寧に導出しています。ご覧ください。

    【初心者必見!】二項分布の期待値と分散が解ける(高校数学で解ける!)
    二項定理の式変形をしっかり演習し、二項分布の期待値、分散を2通りの方法で導出解説!初心者は必読です。

    【初心者必見!】ポアソン分布の期待値と分散が解ける(高校数学で解ける!)
    本記事では、慣れにくいポアソン分布の式変形をしっかり演習しつつ、ポアソン分布の期待値、分散を導出解説!

    下表に結果をまとめます。さっと書き出せるかを確認してください。

    分布 確率密度関数 期待値E 分散V
    正規分布 \(f(x)\)=\(\frac{1}{\sqrt{2π}σ} ・exp(-\frac{(x-μ)^2}{2σ^2})\) \(μ\) \(σ^2\)
    二項分布 \(f(x)\)=\({}_n C_x p^x・(1-p)^{n-r}\) \(np\) \(np(1-p)\)
    ポアソン分布 \(f(x)\)=\(e^{-λ}・\frac{λ^x}{x!}\) \(λ\) \(λ\)

    ➁正規分布、二項分布、ポアソン分布を比較

    パラメータをそろえる

    ここで、正規分布、二項分布、ポアソン分布の期待値、分散のパラメータをそろえます。つまり、

    分布 期待値E 分散V
    正規分布 \(μ\) \(np\) \(σ^2\) \(np(1-p)\)
    二項分布 \(np\) \(np\) \(np(1-p)\) \(np(1-p)\)
    ポアソン分布 \(λ\) \(np\) \(λ\) \(np\)

    とパラメータをそろえます。

    正規分布、二項分布、ポアソン分布を比較

    ここで、(n,p)=(100,0.2)と(n,p)=(1000,0.02)を代入して、3つの分布関数のグラフを描いて比較しましょう。

    正規分布

    正規分布

    2つの場合とも、ほぼ3つの分布関数が重なりましたね。n=100の方は数が少ないこともあり、ポアソン分布だけ少しずれますが、n=1000まで増やすとほぼぴったりそろいます。

    標本数が大きい場合は
    正規分布で考えればOKといえますね。

    学問的には、正規分布、二項分布、ポアソン分布は別物ですが、
    実務上は同じとして扱ってもよいでしょう。

    まとめ

    「【初心者必見!】正規分布、二項分布、ポアソン分布が比較できる」を解説しました。

    • ①3つの分布の分布関数、期待値、分散
    • ➁正規分布、二項分布、ポアソン分布を比較
  • 【初心者必見!】正規分布の概形、近似式、定積分が解ける!(高校数学で解ける!)

    【初心者必見!】正規分布の概形、近似式、定積分が解ける!(高校数学で解ける!)

    本記事のテーマ

    【初心者必見!】正規分布の概形、近似式、定積分が解ける!(高校数学で解ける!)
    • ①正規分布の概形を描いてみよう!(高3レベル)
    • ➁正規分布に近いグラフを描いてみよう!(高3レベル)
    • ➂正規分布の積分の近似値を解いてみよう!(高2レベル)
    正規分布は絶対勉強しないといけないけど、
    式が難しいし、
    正規分布表が何であるのかわからない
    など、最初悩みますよね!
    正規分布に慣れるには、
    高校数学の微分積分を使って
    実際にグラフを描いて、面積を求めてみましょう!
    \(e^{-\frac{x^2}{2}}\)の式に
    圧倒される必要はありません。
    自分の解けるテリトリーに持って行きましょう。

    正規分布に慣れる良問を持ってきましたので、一緒に解きながら慣れていきましょう!

    ①正規分布の概形を描いてみよう!(高3レベル)

    例題

    正規分布の分布関数\(f(x)\)=\(e^{-\frac{x^2}{2}}\)のグラフを描く。
    (1) 極値と変曲点の座標を求めよ。
    (2) \(y=f(x)\)を描け

     理系の高校数学の定期試験問題レベルです。ここは、しっかり解けるようにしましょう。

    問(1)の回答

    微分します。
    ●\(f’(x)\)=\(-x e^{-\frac{x^2}{2}}\)
    ●\(f’’(x)\)=\((-1+x^2 e^{-\frac{x^2}{2}})\)

    ここで、極値と変曲点を考えます。
    ●\(f’(x)\)=0のときは、\(x\)=0 で、
    ●\(f’’(x)\)=0のときは、\(x\)=±1 なので、
    増減表ができますね。

    正規分布

    増減表をもとに、概形を描くと下図になります。

    正規分布

    高校数学では、あまり\(e^{-\frac{x^2}{2}}\)の式が出ませんが、特に気にせず、普通に微分積分すれば解けます!

    ➁正規分布に近いグラフを描いてみよう!(高3レベル)

    正規分布の式になぜ正規分布表があるのか?

    統計学やQCを勉強すると、必ず、正規分布表の読み方などを勉強しますが、
    何で、あんな表があるかわかりますか? この疑問を持つことの方が表の読み方の勉強より大事です!

    正規分布の式
    \(e^{-\frac{x^2}{2}}\)
    は積分できない(不定積分が作れない)
    正規分布の式
    \(e^{-\frac{x^2}{2}}\)
    の積分値は近似値で与えているのが現状
    でも、正規分布の式の定積分
    \( \displaystyle \int_{-∞}^{∞}e^{-\frac{x^2}{2}}dx \)は計算できる!

    不定積分が計算できないのに、なぜか定積分は計算できる
    変な式です。だから、理解が難しい!

    だったら、簡単な近似式を作ってしまおう!

    次の例題に行きましょう。

    例題

    正規分布の分布関数\(f(x)\)=\(e^{-\frac{x^2}{2}}\)をテイラー展開して4次の整式からなる近似式を作って、積分を考えたい。
    (1) \(f(x)\)=\(1-\frac{x^2}{2}+\frac{x^4}{8}\)と近似できることを示せ。
    (2) 正規分布から\( \displaystyle \int_{0}^{1} \frac{1}{\sqrt{2π}} e^{-\frac{x^2}{2}}dx \)を求め、
    手計算から\( \displaystyle \int_{0}^{1}\frac{1}{\sqrt{2π}}(1-\frac{x^2}{2}+\frac{x^4}{8})dx \)の結果と比較せよ。

    問(1)の回答

    テイラー展開は教科書どおりで、\(x=0\)のまわりで、テイラー展開すると
    \(f(x)\)=\(f(0)\)+\(\frac{f^{(1)}(0)}{1!} x^1\)+\(\frac{f^{(2)}(0)}{2!} x^2\)+\(\frac{f^{(3)}(0)}{3!} x^3\)+\(\frac{f^{(4)}(0)}{4!} x^4\)+…

    どんどん微分しましょう。この微分は良い練習です。是非計算しましょう!
    ●\( f^{(1)}(x)\)=\(-x e^{-\frac{x^2}{2}}\)
    ●\( f^{(2)}(x)\)=\((-1+x^2) e^{-\frac{x^2}{2}}\)
    ●\( f^{(3)}(x)\)=\((-x^3+3x) e^{-\frac{x^2}{2}}\)
    ●\( f^{(4)}(x)\)=\((x^4-6x^2+3) e^{-\frac{x^2}{2}}\)

    より、\(x=0\)を代入して、\(f(x)\)の近似式を計算すると、
    ●\( f^{(1)}(0)\)=0
    ●\( f^{(2)}(0)\)=-1
    ●\( f^{(3)}(0)\)=0
    ●\( f^{(4)}(0)\)=3
    となるので、

    \(f(x)\)=1-\(\frac{1}{2} x^2\)+\(\frac{1}{8} x^4\)

    近似式の概形と正規分布の概形を描いてみる

    近似式は4次関数で高2レベルですね。Excelでグラフを描いてみましょう。

    正規分布

    確かに、\(x=0\)付近は2つのグラフは重なっていますね。近似値からでも正規分布の定積分は精度よく求められそうですね。

    ➂正規分布の積分の近似値を解いてみよう!(高2レベル)

    問(2)を再掲

    正規分布の分布関数\(f(x)\)=\(e^{-\frac{x^2}{2}}\)をテイラー展開して4次の整式からなる近似式を作って、積分を考えたい。
    (2) 正規分布から\( \displaystyle \int_{0}^{1}\frac{1}{\sqrt{2π}} e^{-\frac{x^2}{2}}dx \)を求め、
    手計算から\( \displaystyle \int_{0}^{1}\frac{1}{\sqrt{2π}}(1-\frac{x^2}{2}+\frac{x^4}{8})dx \)の結果と比較せよ。

    では、2つの関数の積分を解いてみましょう。

    正規分布表から確認

    正規分布表から値を読みます。正規分布表の読み方は大丈夫でしょうか?一応解説します。

    Kp *=0 *=1 ・・・  *=9
    0.0* 0.5 0.496 ・・・ ・・・
    ・・・ ・・・ ・・・ ・・・ ・・・
    1.0* 0.1587 0.1562 ・・・  ・・・
    1.1* 0.1357 ・・・  ・・・  ・・・
    ・・・ ・・・ ・・・ ・・・ ・・・

    上表のマーカ部でKp=1.00の値「0.1587」を見ますが、
    これは、\( \displaystyle \int_{1}^{∞}\frac{1}{\sqrt{2π}} e^{-\frac{x^2}{2}}dx \)の値なので、
    0.5-0.1587=0.3413が、求めたい積分値\( \displaystyle \int_{0}^{1}\frac{1}{\sqrt{2π}} e^{-\frac{x^2}{2}}dx \)です。

    何を言っているかわからない場合は、正規分布の基礎を復習しましょう。関連記事を紹介します。

    【簡単】正規分布は怖くない!正規分布表や確率計算の求め方がすぐわかる
    「正規分布とは何か?」、「正規分布の難解な式が理解できない」、「正規分布表の意味がわからない」など、よくある困りごとをわかりやすく解説します。

    【初心者必見】正規分布の標準化や応用問題は怖くない!必勝解法を解説します。
    「正規分布の標準化する理由がわからない」、「平均μ、分散\(σ^2\)の一般的な正規分布の確率の計算ができない」など、よくある困りごとをわかりやすく解説します。

    近似式の定積分

    \( \displaystyle \int_{0}^{1}\frac{1}{\sqrt{2π}}(1-\frac{x^2}{2}+\frac{x^4}{8})dx \)を計算します。高2レベルです。

    \( \displaystyle \int_{0}^{1}\frac{1}{\sqrt{2π}}(1-\frac{x^2}{2}+\frac{x^4}{8})dx \)
    =\(\frac{1}{\sqrt{2π}} \frac{103}{120}\)=0.3425
    となります。この計算もやってみてください。

    積分値の比較

    ●正規分布の場合は、0.3413
    ●近似式の場合は、0.3425
    とほぼ一致していますね。差は0.4%!

    グラフ見れば、x=0~1の区間は2つのグラフのyの値はほぼ一致していますね。

    正規分布

    以上、
    ①微分を計算してわかる正規分布の概形
    ➁正規分布の概形近似式の作り方
    ➂定積分の値の比較
    を解説しました! 正規分布にだいぶ慣れたはずです!

    まとめ

    「【初心者必見!】正規分布の概形、近似式、定積分が解ける!(高校数学で解ける!)」を解説しました。

    • ①正規分布の概形を描いてみよう!(高3レベル)
    • ➁正規分布に近いグラフを描いてみよう!(高3レベル)
    • ➂正規分布の積分の近似値を解いてみよう!(高2レベル)
  • 【簡単】F分布がすぐ使いこなせる【初心者向け】

    【簡単】F分布がすぐ使いこなせる【初心者向け】

    本記事のテーマ

    【簡単】F分布がすぐ使いこなせる【初心者向け】
    「F分布を使った検定方法がよくわからない」、「F分布とt分布・χ2乗分布・正規分布の関係がよくわからない」、「F分布表の注意点がわからない」など、実際に分散比の検定や分散分析を計算するときにいろいろ困っていませんか?

    こういう疑問に答えます。

    • ➀F分布の導出がわかる
    • ②F分布とt分布・χ2乗分布・正規分布の関係
    • ③F分布表の注意点

    さっそく見ていきましょう。

    ➀F分布の導出がわかる

    F分布の導出のポイント

    詳細は、をご覧下さい。まとめると次の3点ですね。

    (A) F分布は2つのχ2乗分布の比。
    (B)F分布のχ2乗分布の比なので。確率密度関数はx≧0のみ。

    ②F分布とt分布・χ2乗分布・正規分布の関係

    Xが自由度tのt分布に従うなら、\(X^2\)は自由度(1,n)のF分布に従う

    F分布とt分布・χ2乗分布・正規分布と4つの分布関数の関係を使って確かめてみましょう。

    ● Z: 正規分布に従う
    ●X: 自由度nのt分布に従う
    ●\(Y^2\)/n: 自由度nのχ2乗分布に従う

    と定義します。

    t分布は
    t分布 = 正規分布 / \( \sqrt{χ2乗分布}\)
    ですね。X,Y,Z,nを代入します。
    \( X=\frac{Z}{1}\)/\({\sqrt{\frac{Y^2}{n}}}\)

    両辺を2乗します。
    \( X^2 = \frac{Z^2}{1}\)/\(\frac{Y^2}{n}\)

     右辺は\(\frac{Z^2}{1}\)と\(\frac{Y^2}{n}\)の比、つまり
    自由度1のχ2乗分布\(Z^2\)と、
    自由度nのχ2乗分布\(Y^2\)の比
    ですから、
    これが自由度(1,n)のF分布に従うことを意味しています。

    \(X^2\)は自由度(1,n)のF分布に従います。

    まとめると、

    t分布 = 正規分布 / \(\sqrt{χ2乗分布}\)
    を2乗すると
    (1,n)F分布 =(自由度1のχ2乗分布)/(自由度nのχ2乗分布)

    となることが言えます。

    ③F分布表の注意点

    自由度(m,n)はどちらを先頭にするか?

    自由度の順番

    比較する対象を前に、比較される対象が後ろにします。
    順番が逆になるとF値は逆数になります。

    例題を見ましょう。

    A,Bにおいて
    (1)Aの分散について調べたいとき: F(\(φ_A,φ_B,α\))とします。
    (1) Bの分散について調べたいとき: F(\(φ_B,φ_A,α\))とします。
    F(\(φ_A,φ_B,α\))=\(\frac{1}{F(φ_A,φ_B,α)}\)

    自由度の順番が変わるとF値が逆数になる理由

    (1,n)F分布 =(自由度1のχ2乗分布)/(自由度nのχ2乗分布)
    を拡張します。つまり、
    \( X^2 = \frac{Z^2}{1}\)/\(\frac{Y^2}{n}\)

    \( X^2(m,n)= \frac{Z^2}{m}\)/\(\frac{Y^2}{n}\)
    とします。両辺を逆数にします。
    \( X’^2(n,m)= \frac{1}{ X^2(m,n)}\)=\(\frac{Y^2}{n}\)/\(\frac{Z^2}{m}\)
    より、自由度が入れ替わるとF値が逆数に変わりますね。

    分散分析して、F値が予定より乖離がある場合は、自由度が入れ替わっている可能性があることがわかります。

    直交表を使った実験計画法での注意点

    F分布において、自由度1の場合、F値が大きすぎる。
    分散分析結果で自由度1のF値をそのまま使って良いかよく考える必要がある。

    F表を見ましょう。自由度がφ1、φ2ともに1の色枠部を見てください。
    色のない値に比べて、色がついた値は高いですよね。
    特にφ2の自由度1の場合は3桁です。

    F表(α=0.05)
    φ2/φ1 1 2 3 4 5 ・・・
    1 161 200 216 225 230 ・・・
    2 18.5 19 19.2 19.2 19.3 ・・・
    3 10.1 9.55 9.28 9.12 9.01 ・・・
    4 7.71 6.94 6.59 6.39 6.26 ・・・
    5 6.61 5.79 5.41 5.19 5.05 ・・・
    ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・

    直交表の多因子実験で残差の自由度が1の場合は、F値が3桁になるので、ほぼすべての実験が有意でない結果となってしまいます。実際は、F値が高すぎないように、残差の自由度は2または3以上にしています。これも注意点として知っておいてください。

    まとめ

    F分布について実務や試験に活かせるようにわかりやすく解説しました。かなりイメージがついて、検定・推定、分散分析の解法に自信がついたでしょう。

    • ➀F分布の導出がわかる
    • ②F分布とt分布・χ2乗分布・正規分布の関係
    • ③F分布表の注意点
  • 【簡単】t分布がすぐ使いこなせる【初心者向け】

    【簡単】t分布がすぐ使いこなせる【初心者向け】

    本記事のテーマ

    【簡単】t分布がすぐ使いこなせる【初心者向け】
    • ➀t分布の導出がわかる
    • ②t分布表の使い方
    • ③t分布と正規分布の違い
    「t分布を使った検定方法がわからない」、「正規分布とt分布の違いがよくわからない」、「片側検定、両側検定のときのt分布表の見方がわからない」など、実際に計算するときにいろいろ困っていませんか?

    さっそく見ていきましょう。

    ➀t分布の導出がわかる

    t分布の導出の導出のポイント

    詳細は、をご覧下さい。まとめると次の3点ですね。

    (A) t分布は理想的な正規分布に対する現実版。
    (B)正規分布関数×割合/全体からt分布を算出。割合/全体の比にχ2乗分布を活用。
    (C)t分布は分散ではなく、自由度から確率を算出。

    ②t分布表の使い方

    t分布の分布関数をざっくり理解する方がわかりやすい

    t分布表に載っているグラフの関数

    \( f(x)= \frac{Γ(\frac{φ+1}{2})}{\sqrt{φπ}Γ(\frac{φ}{2})}(1+\frac{t^2}{φ})^{-\frac{φ+1}{2}}\)

    よくわからない関数ですが、自由度φとtを代入してf(x)を計算します。手計算は大変なので、エクセルを使って計算します。

    t分布関数をざっくり書くと、
    f(x)= B(φ) \(\frac{1}{(1+t^2)^{C(φ)}}\)
    です。
    関数 \(\frac{1}{1+t^2}\)に自由度φからなる関数B(φ)、C(φ)がくっついてきます。
    関数 \(\frac{1}{1+t^2}\)の区間[-∞,∞]の∫は∞に発散しますが、関数B(φ)、C(φ)がくっついているおかげで有限値になるというイメージです。

    また、t分布の関数形は、
    関数 \(\frac{1}{1+t^2}\)
    なので、y軸に対称になります。
    よって、正規分布と似たグラフになるのが特徴です。

    t分布

    エクセルを使う場合は、
    tと自由度φを用意して、t分布関数を
    「= T.DIST (C6,D3,false)」
    として代入します。C6はtのセル、D3は自由度φのセルです。

    χ2乗分布表の見方

    t分布関数の特徴

    (A)y軸に対称である。
    (B) t分布関数(確率密度関数)は、区間[-∞.∞]で積分すると1。
    (C)正規分布表と同様に確率P/2からt値を読み取る場合は、確率P/2は区間[t,∞]とする。確率PではなくP/2と運用しているので注意。

    片側検定、両側検定の場合のt分布表の見方を図で確認しましょう。

    t分布でよく試験で間違えるところなので、注意しましょう。

    片側検定の場合

    確率P/2=0.05つまり、P=0.1(有意水準)に相当するtを読み取ります。

    t分布

    Φ=10,P=0.1のときは、t分布表からt=1.812とわかります。

    両側検定の場合

    確率 P/2=0.05/2つまり、P=0.05 (有意水準)に相当するtを読み取ります。

    t分布

    Φ=10,P=0.05のときは、t分布表からt=2.228とわかります。

    ③t分布と正規分布の違い

    t分布と正規分布の違い

    数学的には違う分布関数。
    でも、値はほぼ同じなので実務上は同じと考えてもよい。

    試験、資格ではt分布と正規分布は別物として勉強しましょう。
    これはt分布、正規分布をそれぞれ理解しているかを確認するためです。
    一方、実務上は下図のようにデータ数n=10個程度で、
    t分布と正規分布N(0,\(1^2\))は同じグラフですね。

    10個以下のデータ数なら、分析としては不十分なので、
    もっと多くのデータ数を用いて分析しますよね。
    つまり、最初から正規分布と過程しても実務上問題がないと言えます。

    t分布の関数の形が少ない自由度で、
    正規分布に重なるようになっているのが現状
    です。
    私が思うあるべきt分布とは、データ数が100個くらいでも正規分布とずれているが、データ数が10000個以上になってようやく正規分布に接近してくるイメージです。

    t分布

    まとめ

    t分布について実務や試験に活かせるようにわかりやすく解説しました。かなりイメージがついて、検定・推定、分散分析の解法に自信がついたでしょう。

    • ➀t分布の導出がわかる
    • ②t分布表の使い方
    • ③t分布と正規分布の違い
  • 【簡単】χ2乗分布がすぐ使いこなせる【初心者向け】

    【簡単】χ2乗分布がすぐ使いこなせる【初心者向け】

    本記事のテーマ

    【簡単】\(χ^2\)乗分布がすぐ使いこなせる【初心者向け】
    • ➀\(χ^2\)乗分布の導出がわかる
    • ②よく使う\(χ^2\)乗分布関数と標準偏差sの関係
    • ③\(χ^2\)乗分布表の使い方
    「\(χ^2\)乗分布を使った検定方法がわからない」、「標準偏差、平方和と\(χ^2\)乗分布関数の関係がわからない」、「片側検定、両側検定のときの\(χ^2\)乗分布表の見方がわからない」など、実際に計算するときにいろいろ困っていませんか?

    さっそく見ていきましょう。

    ➀\(χ^2\)乗分布の導出がわかる

    \(χ^2\)乗分布の導出のポイント

    【簡単】\(χ^2\)乗分布がすぐ使いこなせる【初心者向け】

    詳細は、をご覧下さい。まとめると次の3点ですね。

    (A) \(χ^2\)乗分布は分散の検定のために正規分布から作られた関数
    (B)難しい式の導出より、(\(χ^2\)乗分布関数)=Σ(正規分布関数)^2で理解
    (C)\( χ^2=\sum_{i} (\frac{x_i-\bar{x}}{σ})^2\)=\(\frac{S(平方和)}{σ^2}\)

    ②よく使う\(χ^2\)乗分布関数と標準偏差sの関係

    よく見かけるので、解説します。

    \(χ^2\)乗分布と平方和S(大文字)との関係

    \( χ^2=\frac{S}{σ^2}\)

    \(χ^2\)乗分布と標準偏差s(小文字)との関係

    \( χ^2=\frac{s^2}{σ^2}(n-1)\)

    これは簡単に導出できます。
    (i)平方和Sと分散(不偏分散)Vの関係は
    \( V=\frac{S}{n-1}\)

    ですね。
    (ii)分散Vと標準偏差sの関係は
    \( V=s^2\)
    ですね。よって、
    \(S=V(n-1)=s^2(n-1)\)
    になります。

    まとめると、
    ●\(χ^2=\frac{S}{σ^2}\)
    ●\(χ^2=\frac{ s^2(n-1)}{σ^2}\)
    ●\(χ^2=\frac{s^2}{σ^2}(n-1)\)
    ●\(χ^2=(\frac{s}{σ})^2(n-1)\)

    標準偏差sと母分散σの比とデータ数nから\(χ^2\)を算出する場合
    \(χ^2\)と標準偏差sから母分散\(σ^2\)を推定することがよくあります。

    ③\(χ^2\)乗分布表の使い方

    片側検定、両側検定において、\(χ^2\)乗分布表の見方を確認しましょう。

    いろいろな自由度のχ2乗分布

    \(χ^2\)乗分布表に載っているグラフの関数

    \( f(x)= \frac{1}{2^{\frac{k}{2}}}\)\(Γ(\frac{k}{2}) \)\(x^{\frac{k}{2}-1}\)\(e^{\frac{x}{2}} \)

    よくわからない関数ですが、自由度kとx(χ2)を代入してf(x)を計算します。手計算は大変なので、エクセルを使って計算します。

    χ2乗分布

    エクセルを使う場合は、
    xと自由度φを用意して、\(χ^2\)乗分布関数を
    「=CHISQ.DIST(C6,D3,false)」
    として代入します。C6はxのセル、D3は自由度φのセルです。

    χ2乗分布表の見方

    \(χ^2\)乗分布関数の特徴

    (A)χ2乗なので、\(χ^2\)乗分布関数にx<0の範囲は無い。
    (B) \(χ^2\)乗分布関数(確率密度関数)は、区間[0.∞]で積分すると1。
    (C)正規分布表と同様に確率Pから\(χ^2\)値を読み取る場合は、確率Pは区間[\(χ^2\),∞]とする。

    片側検定、両側検定の場合の\(χ^2\)乗分布表の見方を図で確認しましょう。

    片側検定の場合

    確率P=0.05(有意水準)に相当する\(χ^2\)を読み取ります。

    χ2乗分布

    自由度φ=8の場合P=0.05に相当する\(χ^2\)は15.51になります。

    両側検定の場合

    母分散の推定区間を求めるために、両側検定をよく使います。

    両側検定の場合は、有意水準が0.05のとき、P=0.025とP=0.975に相当する\(χ^2\)を読み取ります。

    χ2乗分布

    χ2乗分布

    ここで注意なのは、P=0.025の\(χ^2\)値方がP=0.975の\(χ^2\)値より大きいことです。

    まとめ

    \(χ^2\)乗分布について、実務や試験に活かせるようにわかりやすく解説しました。かなりイメージがついて、検定・推定、分散分析の解法に自信がついたでしょう。

    • ➀\(χ^2\)乗分布の導出がわかる
    • ②よく使う\(χ^2\)乗分布関数と標準偏差sの関係
    • ③\(χ^2\)乗分布表の使い方
  • 【簡単】χ2乗分布とt分布とF分布がすぐわかる【初心者向け】

    【簡単】χ2乗分布とt分布とF分布がすぐわかる【初心者向け】

    本記事のテーマ

    【簡単】χ2乗分布とt分布とF分布の関係がわかる【初心者向け】
    「χ2乗分布とt分布とF分布の式は複雑でわからない」、「χ2乗分布とt分布とF分布の関係がわからない」、「解き方は暗記したけど本質がわからない」など、分布の特性や利用目的を理解しないまま、検定や推定、分散分析していませんか?

    こういう疑問に答えます。

    • ➀χ2乗分布→t分布→F分布の順で学ぶ
    • ②分布関数は導出イメージが理解できる
    • ③正規分布、χ2乗分布、t分布とF分布の関係

    さっそく見ていきましょう。

    ➀χ2乗分布→t分布→F分布の順で学ぶ

    教科書あるある

    正規分布→t分布→χ2乗分布→F分布

    教科書は、母平均の検定に使う正規分布とt分布を先に、分散の検定に使うχ2乗分布とF分布を後に紹介します。
    確かに、この順番でもOKですが、
    本記事はt分布よりχ2乗分布を先に解説します。

    本記事

    正規分布→χ2乗分布→t分布→F分布

    ②分布関数は導出イメージが理解できる

    それぞれの分布関数の使い方は個別の記事で紹介しますが、全体像を本記事で理解してください。
    ・正規分布
    ・χ2乗分布
    ・t分布
    ・F分布

    χ2乗分布は分散の検定のために作られた関数

    χ2乗分布の定義を見ましょう。

    N個の確率変数\(X_1\)、…、\(X_n\)が互いに独立に同一の平均μ、分散\(σ^2\)の正規分布に従う。このとき統計量
    \(χ^2=\frac{(X_1-\bar{X})^2+(X_2-\bar{X})^2+…+(X_n-\bar{X})^2}{σ^2}\)
    は、自由度N-1のχ2乗分布になる。

    正しいですが、わかりませんよね。簡単にわかるよう解説します。

    統計量の最重要な確認事項

    基本中の基本ですが、データ分析は、
    平均
    ・ばらつき

    しか使いません。まず、これだけ理解してください。

    ●平均を扱うのが、正規分布、t分布です。
    ●母集合の母分散が既知で理想的な分布な正規分布
    ●母集合の母分散が未知で現実的な分布なt分布
    と、平均を扱う分布は2種類あります。

    次にばらつき(分散)用の分布も必要になりますね。

    χ2乗分布は分散の検定のために作られた関数で
    正規分布から出発します。

    平均\(\bar{x}\)、分散\(σ^2\)の正規分布に従う変数\(x_i\)の分散を考えます。
    まず、変数\(x_i\)を標準化します。標準化についてはここを見てください。
    \( \frac{x_i-\bar{x}}{σ}\)
    そして、この2乗和が平方和であり、分散を考えるχ2乗分布関数の基本形になります。

    χ2乗分布関数

    \( Z=\sum_{i} (\frac{x_i-\bar{x}}{σ})^2\)
    関数のイメージ:(χ2乗分布関数)=Σ(正規分布関数)^2

    (χ2乗分布関数)
    \( f(x)= \frac{1}{2^{\frac{k}{2}}}\)\(Γ(\frac{k}{2}) \)\(x^{\frac{k}{2}-1}\)\(e^{\frac{x}{2}} \) (A)
    (正規分布関数)
    \( f(x)=\frac{1}{\sqrt{2π}}exp(-\frac{x^2}{2}) \)(B)
    と超難解な式です。ですが、
    (A)=Σ(B)^2で計算できる
    の理解で十分です。あとの難解な計算や式は、数学者にお願いしましょう。

    実務で統計学を早く理解するポイント

    ・難解な式を厳密に解くより、「何をやっている式なのか」をざっくりでよいので早く理解する!
    ・数学的な正しさより、相手にわかりやすい説明ができることが重要!

    χ2乗分布関数は、ざっくり書くと
    \( Z=\sum_{i} (\frac{x_i-\bar{x}}{σ})^2\)
    ですね。よく見ると、
    \(\sum_{i} (x_i-\bar{x})^2\)
    は平方和Sですよね。
    つまり、
    $$ χ^2 = \frac{S}{σ^2} $$
    の関係があります。よく教科書にありますが、本記事を読めば、暗記する必要はありません。

    χ2乗分布のさらなる特徴については、χ2乗分布を読んでください。

    t分布は正規分布の一部を取り出した分布

    t分布の定義を見ましょう。

    2つの確率変数X,Yが独立で、Yが自由度nのχ2乗分布、Zが正規分布N(0,\(1^2\))に従うとき、
    \(X=\frac{Z}{\sqrt{Y/n}}\)
    は自由度n-1のt分布に従う。

    正しいですが、全然意味がわからないですね。簡単にわかるよう解説します。

    本記事で先に、χ2乗分布関数を説明した理由は、
    t分布の導出にχ2乗分布関数が必要だからです。

    平均を扱うのが、正規分布、t分布です。
    母集合の母分散が既知で理想的な分布な正規分布
    母集合の母分散が未知で現実的な分布なt分布

    ですね。

    正規分布は、理想・全体、無限のイメージですが、
    t分布は、現実・一部・有限のイメージがあります。

    t分布のイメージ

    ・正規分布 × 一部/全体 = t分布
    ・一部/全体についてはχ2乗分布関数を使う。
    ・正規分布、t分布は平均\(x\)、χ2乗分布は分散\(x^2\)なため、χ2乗分布の平方根を使う
    t分布 X = 正規分布 Z / √ χ2乗分布Y になっていますね!

    正規分布はσを、t分布はσではなく自由度nを使う理由

    t分布 X = 正規分布 Z / √χ2乗分布Y
    をよく見ると、
    正規分布 Z のσ/√χ2乗分布(σ^2/n)
    → σ/√(σ^2/n)=nとざっくり計算できますね。
    σ→nに変わっていますよね。これが、
    正規分布はσを、t分布はσではなく自由度nを使う
    わかりやすい理由です。

    数学的な証明ではないため、厳密さは欠けますが、
    慣れないうちはこの程度の説明で十分です。

    私がわかりやすい説明を考え抜いた結果、この説明にたどり着きました。

    t分布のさらなる特徴については、t分布を読んでください。

    F分布は分散比の検定のために作られた関数

    F分布の定義を見ましょう。

    2つの独立な確率変数Y,Zがあり、確率変数Yは自由度mのχ2乗分布、確率変数Zは自由度nのχ2乗分布に従うとき、
    \( X=\frac{\frac{Y}{m}}{\frac{Z}{n}}\)
    は自由度(m,n)のF分布に従う。

    正しいですが、わかりにくいですね。簡単にわかるよう解説します。

    F分布の目的

    ・分散比の検定が欲しいからF分布ができた。
    ・分散比だから、χ2乗分布関数の比になる。
    ・F分布によって、分散分析ができる。

    分散比だから、χ2乗分布関数の比になるわけですから、
    F分布関数= χ2乗分布関数1/ χ2乗分布関数2

    となりますよね。
    χ2乗分布関数1 と χ2乗分布関数2は自由度が異なるため、
    F分布は両方の自由度が必要
    となるのも理解できますね。

    F分布はこれだけわかれば十分です。

    F分布のさらなる特徴については、F分布を読んでください。

    ③正規分布、χ2乗分布、t分布とF分布の関係

    4つの分布関数の関係をざっくり書くと下の図のようになります。まずはこれだけわかれば十分実務に活かせます。

    分布関数

    それぞれの関係と、利用目的が理解しやすいですね。活用できる良いイメージ図です。

    なお、厳密に書くと下図になります。でも、わかりにくいですね。

    分布関数

    まとめ

    正規分布、χ2乗分布、t分布、F分布の順で、実務や試験に活かせるようにわかりやすく解説しました。かなりイメージがついて、検定・推定、分散分析の解法に自信がついたでしょう。

    • ➀χ2乗分布→t分布→F分布の順で学ぶ
    • 分布関数は導出イメージが理解できる
    • ③正規分布、χ2乗分布、t分布とF分布の関係
  • 【簡単】わかりやすく理解できるポアソン分布

    【簡単】わかりやすく理解できるポアソン分布

    本記事のテーマ

    【簡単】わかりやすくできるポアソン分布【初心者向け】
    「ポアソン分布の式がわからない」、 「ポアソン分布を使い方がイメージできない」などとポアソン分布は、二項分布や正規分布よりわかりくいですよね。
    • ➀ポアソン分布の式の覚え方
    • ②ポアソン分布のわかりやすい導出
    • ③ポアソン分布の活用例
    • ④ポアソン分布の式を理解する
    • ⑤ポアソンの期待値と分散の導出

    本記事を読んでいるあなたは、平方和、確率分布関数など統計学の基礎をマスターしたいはずです。理解度アップのための必須な関連記事がありますので、関連記事も読んでください。

    ★統計学で最初に悩む関門! 平方和が簡単にマスターできるページ

    確率分布関数の作り方や確率・期待値を積分で計算する理由が簡単にわかるページ

    ★品質管理・統計に頻出な分布関数をわかりやすく解説したページ



    さっそく見ていきましょう。

    ●You tube動画もご覧下さい

    ➀ポアソン分布の式の覚え方

    ポアソン分布の関数

    $$ f(x)= e^{-λ}\frac{λ^x}{x!} $$

    見た瞬間、「何じゃこりゃ?」ですね。
    \( e^{-λ}\)と\(λ^x \)と\( x!\)とややこしい項ばかりですね。
    式見てもグラフのイメージがつきません。
    どうやってこの式ができたのか?イメージつきません
    あなただけではありません。みんなイメージできません。

    ポアソン分布の関数の覚え方

    この式は何回使っても忘れます。忘れにくい方法があります

    • (A)\( e^{-λ}\)と\(λ^x \)と\( x!\)の書く順番を決める
    • (B)変数が変わったときに要注意
    • (C)覚え方

    (A)\( e^{-λ}\)と\(λ^x \)と\( x!\)の書く順番を決める

    \( e^{-λ}\)→\(λ^x \)→\( x!\)としましょう。入れ替わると私も式がわからなくなります。

    (B)変数が変わったときに要注意

    本記事では、λ、xとしています。教科書によってはλ→m,x→kに変えていることがあります。要注意です。

    (C)覚え方

    下図のように、λ,xの変数を一箇所に集めれば、間違いなく公式暗記できます。

    ポアソン分布1

    ②ポアソン分布のわかりやすい導出

    ポアソン分布の導出は、基本わかりにくいです。
    2つ導出方法があります。概要を解説します。詳細はここを参照ください。

    (A)二項分布の式で個数nをn→∞に発散させるとポアソン分布の式になる。
    (B) モデルから方程式を立てて導出する。

    (A)はいろいろな教科書やwebサイトでも紹介されています。
    メリットは、計算過程がわかりやすいことです。
    デメリットは、二項分布の極限がポアソン分布となり、分布の極限って何?と疑問に残ることです。

    ●二項分布からポアソン分布を導出します。
    二項分布
    P(X=k)=\( {}_nC_kp^k(1-p)^{n-k}\)
    ここで、p=\(\frac{λ}{n}\)を代入します。
    =\( {}_nC_k(\frac{λ}{n})^k(1-\frac{λ}{n})^{n-k}\)
    =\( \frac{n(n-1)…(n-k+1)}{k!} (\frac{λ}{n})^k (1-\frac{λ}{n})^n (1-\frac{λ}{n})^{-k}\)
    =\(\frac{λ^k}{k!}\)\(\frac{n(n-1)…(n-k+1)}{n・n…n}\)\((1-\frac{λ}{n})^{\frac{n}{λ}}\)\((1-\frac{λ}{n})^{-k}\)
    n→∞に持っていくと
    → \(\frac{λ^k}{k!}・1・e^{-λ}\)=\(e^{-λ}\frac{λ^k}{k!}\)
    となり、ポアソン分布型に変形できました。
    でも、難しいですね。よく二項分布の極限値がポアソン分布だと気がつきますよね。

    一方、(B)はレアです。
    メリットは、モデルから方程式を立てて導出するので納得感がある。
    デメリットは、計算過程が難しいことです。

    本記事では(B)のレア版を解説します。詳細解説を見る前に概要を理解しましょう。何をやっているのかを先に理解してください。

    ポアソン分布の導出

    ●時刻0から時刻tまでに事象がn回起こる確率をPn(t)とします。
    ●時刻tから微小時間Δに事象が1回起こる確率λΔとおきます。
    ●時刻0から時刻t+Δまでに事象がn回起こる確率をPn(t+Δ)は、➀②の和になります。
    ●➀時刻tまで事象がn-1回で、時刻t以降1回発生する確率 Pn-1(t)(λΔ)
    ●②時刻tまで事象がn回で、時刻t以降0回発生する確率Pn(t)(1-λΔ)
    Pn(t+Δ)= Pn-1(t)(λΔ)+ Pn(t)(1-λΔ)
    と微分方程式が立てられます

    式の各項を説明しましたが、一読では「何を言っているのかわからない」と思います。数回読むと慣れてきます。この方程式がポアソン分布のモデル式です。

    Pn(t+Δ)= Pn-1(t)(λΔ)+ Pn(t)(1-λΔ)
    を解けばPn(t)の関数形が得られます。

    変形すると
    (Pn(t+Δ)-Pn(t))/Δ=λ(-Pn(t)+Pn-1(t))
    Δ→0にすると微分になりますから
    \( \frac{d}{dt} Pn(t)\)= λ(-Pn(t)+Pn-1(t))
    これを満たすPn(t)は
    Pn(t)= \(e^{-λt}\frac{{λt}^n}{n!}\)
    となり、ポアソン分布の関数になります。

    (A)の二項分布の極限よりは、(B)のモデル式から導出する方が納得感はあります。ポアソン分布は難しいため、わかりやすく解説しても、この難しさです。

    ③ポアソン分布の活用例

    具体例を見てみましょう。なお、期待値、分散の導出も重要ですが、詳細解説で説明するとして、ここでは、ポアソン分布を具体的な値を使って慣れる練習をしましょう。

    二項分布とポアソン分布の比較

    故障率1/20の部品から10個を抜き出す。故障した部品の数がxである確率を二項分布とポアソン分布でそれぞれ求めよ。

    二項分布とポアソン分布は別物ですが、
    割合の場合は二項分布、
    個数の場合はポアソン分布、
    を扱うだけで、上の問いはどちらの分布でも計算ができます。

    ●二項分布の場合
    \( P_x={}_nC_x p^r (1-p)^{n-x}\)
    =\(_{10}C_x (\frac{1}{20})^x (1-\frac{1}{20})^{10-x}\)

    ●ポアソン分布の場合
    \(P_x= e^{-λ}\frac{λ^x}{x!}\)
    =\( e^{-\frac{1}{20}}\)\(\frac{(\frac{1}{20})^x}{x!}\)

    エクセルで計算した結果と、両者の結果を比較します。xが小さいとほぼ値は等しいですが、徐々に値がずれていくのがわかります。

    ポアソン分布2

    ポアソン分布の正規分布近似

    全数200個で不良数が20個のサンプルがある。そこから、抜取り数を➀10②20③40④
    50⑤100とした場合、不良数がxである確率をPxとする。xとPxの関係をグラフにせよ。

    不良個数と来たら、ポアソン分布の公式を書きましょう。
    \(P_x= e^{-λ}\frac{λ^x}{x!}\)
    λが必要になります。
    λは不良数×抜取数÷全数とします。
    λ:➀1②2③4④5⑤10となります。グラフは次のようになります。

    ポアソン分布3

    ポアソン分布は、λが高くなるにつれて正規分布に近似できます。
    二項分布もポアソン分布も最初から正規分布で計算してもそれほど結果は変わらないということになりますが、試験では各々の分布に関する問題が出ますので勉強しましょう。実務は正規分布で良いでしょうね。

    ④ポアソン分布の式を理解する

    ポアソン分布の基本を復習

    ①②③と解説しました。再度重要なポイントを確認しましょう。

    \(e^{-λ} \frac{λ^x}{x!}\)という変な式を実際に変形するなどして、触ってみましょう。習うより慣れよ!です。1つ例題を出します。

    【問1】
    ポアソン分布 \(f(x)\)= \(e^{-λ} \frac{λ^x}{x!}\) (\(x\)は自然数)について、
    \(\sum_{x=0}^{∞} f(x)\)=1 を示せ。

    解法

    どうでしょうか?一見難しそうですが、 式を難しくしている\(\sum_{x=0}^{∞} \frac{λ^x}{x!}\)が意外な値になります。テイラー展開を思い出すと

    \(e^x\)=1+\(x\)+\(\frac{x^2}{2!}\)+ \(\frac{x^3}{3!}\)+…
    をまとめると、
    \(e^x\)=\(\sum_{x=0}^{∞} \frac{λ^x}{x!}\)

    この式を問題文の式に代入すると
    \(\sum_{x=0}^{∞} f(x)\)
    =\( e^{-λ} \sum_{x=0}^{∞} \frac{λ^x}{x!}\)
    =\( e^{-λ} e^λ \)
    =1

    となりますね。扱いにくい\(\frac{λ^x}{x!}\)が少し身近に感じていただける例題で確認しました。

    ポアソン分布の式は複雑で、変形して使う場合が少ないので理解が難しい式となってしまいますね。

    ⑤ポアソンの期待値と分散の導出

    問題

    【問2】
    ポアソン分布 \(f(x)\)= \(e^{-λ} \frac{λ^x}{x!}\) (\(x\)は自然数)について、
    (1) 期待値E[X]
    (2) 分散V[X]を求めよ。

    ポアソン分布の期待値E、分散Vも共にλになります。式が複雑なわりに期待値と分散は分布関数の中で最もシンプルになるので、不思議です。

    期待値

    (1)を解きます。

    期待値E[X]≡xf(x)という意識で式を作ります。
    E[X]= \(\sum_{k=0}^{∞}\)\(k\) ×\(\frac{λ^k}{k!} e^{-λ}\)
    と式を書いて、変形していきます。

    E[X]= \(\sum_{k=0}^{∞} k\frac{λ^k}{k!} e^{-λ}\)
    (k=0の場合、\( 0 \frac{λ^0}{0!} e^{-λ}\)=0より、)
    = \(\sum_{k=1}^{∞} k\frac{λ^k}{k!} e^{-λ}\)
    = \( λe^{-λ} \sum_{k=1}^{∞} \frac{λ^{k-1}}{(k-1)!} \)
    (\(\frac{λ^{k-1}}{(k-1)!} e^{-λ}\)をセットで考えると)
    = \( λe^{-λ} e^{-λ}\)

    となります。

    【問1】(さっきの例題)
    ポアソン分布 \(f(x)\)= \(e^{-λ} \frac{λ^x}{x!}\) (\(x\)は自然数)について、
    \(\sum_{x=0}^{∞} f(x)\)=1 を示せ。
    はさくっと解けるようになったはずです。

    分散

    (2)を解きます。ここで、テクニックですが、
    E[X2]ではなく、E[X(X-1)]を求めます。

    期待値E[X(X-1)]≡x(x-1)f(x)という意識で式を作ります。
    E[X(X-1)]= \(\sum_{k=0}^{∞}\)\(k(k-1)\) ×\(\frac{λ^k}{k!} e^{-λ}\)
    と式を書いて、変形していきます。

    E[X(X-1)]= \(\sum_{k=0}^{∞} k(k-1) \frac{λ^k}{k!} e^{-λ}\)
    (k=0,1の場合、\( k(k-1) \frac{λ^k}{k!} e^{-λ}\)=0より)
    = \(\sum_{k=2}^{∞} k(k-1) \frac{λ^k}{k!} e^{-λ}\)
    =\( e^{-λ} λ^2 \sum_{k=2}^{∞} \frac{λ^{k-2}}{(k-2)!} \)
    =\( e^{-λ} λ^2 e^λ \)
    (\(\frac{λ^{k-2}}{(k-2)!} e^{-λ}\)をセットで考えると)
    =\(λ^2\)

    ここで、
    V[X]=E[X(X-1)]+E[X]-E[X]2
    =\(λ^2\)+\(λ\)-\(λ^2\)
    =\(λ\)
    となります。

    少しずつでいいので、ポアソン分布に慣れましょう。

    ポアソン分布は、二項定理、指数分布から変形して解けるので、他の分布関数と関連づけながら身につけましょう。すべてQCプラネッツの記事で解説しています!

    まとめ

    苦手意識が強い、ポアソン分布についてわかりやすく解説しました。

    • ➀ポアソン分布の式の覚え方
    • ②ポアソン分布のわかりやすい導出
    • ③ポアソン分布の活用例
    • ④ポアソン分布の式を理解する
    • ⑤ポアソンの期待値と分散の導出
  • 【簡単】高校数学で十分できる二項分布【初心者向け】

    【簡単】高校数学で十分できる二項分布【初心者向け】

    本記事のテーマ

    【簡単】高校数学で十分できる二項分布【初心者向け】
    • ➀高校数学の確率を復習
    • ②二項分布の期待値・分散は暗記
    • ③二項分布の正規分布化を実例で体験
    • ④OC曲線に二項分布が必須
    • ⑤二項分布の式がマスターできる!
    • ⑥二項分布の期待値・分散の導出(その1)
    • ⑦二項分布の期待値・分散の導出(その2)
    「正規分布、二項分布、ポアソン分布の公式を覚えるのが大変」、「二項分布って何?」、「正規分布がなぜ出てくるの?」、「OC曲線にも二項分布が出てくるけど何で?」など困っていませんか?

    記事の信頼性

    記事を書いている私は、QC検定®1級合格し、つまずきやすいQC検定®2級挑戦者に難解な確率密度関数をわかりやすく解説しています。

    ●商標使用について、
    ①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
    ➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
    ➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

    理解を深めるための関連記事を紹介

    基本統計量をマスターするために必要な関連記事を紹介します。ご確認ください。
    【1】分散、平方和、確率変数に慣れる


    【2】正規分布、二項分布、ポアソン分布に慣れる



    さっそく見ていきましょう。

    ➀高校数学の確率を復習

    統計学や品質管理を勉強しているあなたは、高校数学をすでに勉強しているはずです。確率の良問を見ながら、二項分布に入っていきましょう。

    問:1から6まで等確率で出るサイコロ1個を600回投げる。
    1がr回出る確率をPrとする。
    (1) Prをrの式で表せ。
    (2) Prが最大になるrはいくらか。

    (1)は組み合わせの確率問題ですね。
    600回のうち、n回1(確率1/6)が出て、600-n回はそれ以外(確率5/6)が出ます。
    どのn回に1が出るかは組み合わせで求めましたよね。式でまとめます。
    Pr=\( _nC_r p^r (1-p)^{n-r} \)
    を使いますね。わからない場合は高校数学確率の章に戻って復習しましょう。

    n=600,p=\(\frac{1}{6}\)を代入すればよいです。
    よって、
    Pr=\( {}_{600}C_r (\frac{1}{6})^r (\frac{5}{6})^{600-r} \)

    (2)は解いてみてください。詳細は解説集に載せています。ご覧下さい。答えはr=100のときです。
    確率\(\frac{1}{6}\)で600回振るから100回になるのも納得できます。

    (1)の式を見ると、二項分布の式そのものですね。
    高校数学を学んでいれば二項分布の式は書けるはずです。大学の難しい数学ではありませんね。

    ②二項分布の期待値・分散は暗記

    ●期待値E[X]=np
    ●分散V[X]=np(1-p)

    高校数学で期待値と分散は証明できるのですが、意外と難しいです。
    しかし、計数値の検定・推定(母不適合品率がある場合の検定・推定)
    計数値管理図(pn管理図、p管理図)に二項分布が使われます。
    検定や管理図を使いこなせるレベル(資格でいうとQC検定®2級合格レベル)までは
    期待値と分散は公式暗記でよい
    です。

    なお、期待値E[X]=np、分散V[X]=np(1-p)の証明はここに記載しています。

    ➀の例題で、サイコロ1個をn=600回、確率p=\(\frac{1}{6}\)ですか、np=100が期待値となります。

    ③二項分布の正規分布化を実例で体験

    実際にやってみましょう。

    1から6まで等確率のサイコロを1個から6個までそれぞれ1回振って、出た目の合計をxとし、xが出る確率をPxとする。
    サイコロ1個から6個についてxとPxの関係をグラフに図示せよ。

    サイコロが1個2個の場合

    ●サイコロが1個の場合

    1 2 3 4 5 6
    回数 1 1 1 1 1 1

    回数を6で割ると確率Pになりますね。

    ●サイコロが2個の場合

    2 3 4 5 6 7 8 9 10 11 12
    回数 1 2 3 4 5 6 5 4 3 2 1

    回数を36で割ると確率Pになりますね。

    サイコロ1個,2個の場合についてグラフを描くと、次のとおりです。二項分布とはいえ、直線で角々していますね。

    二項分布1

    サイコロが3個以上の場合

    同様にサイコロの数を増やしていきます。その結果、滑らかな曲線になっていき、正規分布に近い形になっていますね。サイコロの数の目の出方は一見、正規分布とは関係がありませんが、データが増えるにつれて正規分布近似できるようになります。これが科学・社会データも同じことが言えます。不思議ですね。

    二項分布2

    ここで大事なのは、二項分布に従うデータも数が増えると正規分布に近づくことを実例で理解することです。教科書暗記せず、体感することが大切です。なお、サイコロの場合、たったn=3で正規分布に従う形になります。
    最初から二項分布を使わずに正規分布で考えても良いかもしれませんね。

    二項分布の理解を深める演習問題を解きましょう

    理解度のアップと、QC検定®2級の合格と一石二鳥です。

    ④OC曲線に二項分布が必須

    抜取検査で必須なOC曲線(Operating Characteristic curve)に二項分布の式が必須です。
    OC曲線は丸暗記する人が多いので、式で理解しましょう。解説します。

    OC曲線の目的

    一定の不良率pをもつサンプルを抜取検査する。不良率pとそのサンプルの合格率L(p)の関係を明確するためにOC曲線を描く。

    OC曲線は合格率L(p)と不良率pの関係を見るわけですから、縦軸はL(p)、横軸はpですね。
    次にL(p)の式を作りましょう。

    検査合格条件は不良数c個以下とします。不良率pのサンプル(サンプル数n)を取り出した際、不良がr個ある確率を式化し、0≦r≦cの場合の確率を合計がL(p)になります。

    式で書くと
    \( \sum_{r=0}^{c} {}_nC_r p^r(1-p)^{n-r} \)
    と書けます。

    OC曲線は、不良率から消費者危険、生産者危険、(n,c)によるグラフの関係性を見ます。これは抜取検査の記事で詳細に解説します。
    大事なのは、OC曲線は二項分布の式で作ることです。グラフの性質を丸暗記せず、式で理解しましょう。式で理解した方が、応用が効くからです。

    なお、いろいろな(n,c)の場合のOC曲線を見ましょう。ここまでグラフ化した図は本記事以外にありません。エクセルとVBAを使ってグラフにしました。貴重なデータですよ。

    二項分布

    ここから先は、期待値、分散を導出します。もう少し見ていきましょう。

    ⑤二項分布の式がマスターできる!

    二項定理を理解する

    まず、 \((p+q)^n\)を展開すると、
    \((p+q)^n\)=\(p^n\)+…+\(q^n\)となりますね。

    これをまとめると

    \((p+q)^n\)=\(\sum_{r=0}^{n} {}_n C_r p^r q^{n-r}\)
    となります。これが二項定理ですね。
    特に、\(p+q=1\)の場合、
    ●\(\sum_{r=0}^{n} {}_n C_r p^r q^{n-r}\)=\((p+q)^n\)=1
    となるし、\(p+q=2\)の場合、
    ●\(\sum_{r=0}^{n} {}_n C_r p^r q^{n-r}\)=\((p+q)^n\)=\(2^n\)
    となりますね。これも高校数学でよく出題されたはずです。

    今回は、

    特に、\(p+q=1\)の場合、つまり、\(q=1^p\)の場合
    ●\(\sum_{r=0}^{n} {}_n C_r p^r q^{n-r}\)=\((p+q)^n\)=1
    を使うのが二項分布です!

    二項分布の式の構造を理解する

    \(\sum_{r=0}^{n} {}_n C_r p^r q^{n-r}\)
    の形が複雑すぎる!

    大丈夫です。構造体として式を理解すればOK。式の構造をいじらずに式変形するのが二項分布の式を扱うポイントです。

    二項定理

    固定と有るところは変えず、それ以外の値を計算する

    二項分布の式の基本形を維持して式変形する

    例を挙げます。

    【例題】
    ●\(\sum_{r=0}^{n} {}_n C_r p^r q^{n-r}\)=\((p+q)^n\)=1
    とする場合、
    ●\(\sum_{r=0}^{n} r {}_{n-1} C_{r-1} p^r q^{n-r}\)
    はいくらか?

    解いてみましょう。基本を変えないので、
    \(\sum_{r=0}^{n} {}_n C_r p^r q^{n-r}\)
    の式に持って行きます。

    ところで、
    \( {}_n C_r\)=\(\frac{n!}{r!(n-r)!}\)です。この式も重要です!
    なので、
    ●\({}_{n-1} C_{r-1}\)=\(\frac{(n-1)!}{(r-1)!(n-r)!}\)と機械的に公式代入すると、
    \(\frac{(n-1)!}{(r-1)!(n-r)!}\)= \(\frac{r}{n}\)× \(\frac{n!}{r!(n-r)!}\)
    = \(\frac{r}{n}\)× \( {}_n C_r\)
    となるので、

    問いの式は
    ●\(\sum_{r=0}^{n} r {}_{n-1} C_{r-1} p^r q^{n-r}\)
    =\(\sum_{r=0}^{n} r \frac{1}{n} {}_n C_r p^r q^{n-r}\)
    =\(\frac{1}{n} \)×\(\sum_{r=0}^{n} {}_n C_r p^r q^{n-r}\)
    =\(\frac{1}{n} \)×1
    =\(\frac{1}{n} \)
    と計算できます。

    二項分布の式の基本形を維持して式変形することが大事です。

    では、この式変形を活用して、二項分布の期待値npと分散np(1-p)を2通りの解法で解いてみましょう。

    ⑥二項分布の期待値・分散の導出(その1)

    問題

    【問1】
    確率変数Xが二項分布に従い、P(X=\(i\))=\( {}_n C_r p^r q^{n-r}\) (ただし、\(p+q=1\))に従うとき、期待値E(X)=\(np\)、分散V(X)=\(np(1-p)\)を以下のやり方で導出したい。
    (1) \(i {}_n C_i \)=\(n {}_{n-1} C_{i-1} \) (\(i\) ≥1)を示し、E(X)=\(np\)を導出せよ。
    (2) \(i (i-1) {}_n C_i \)=\(n(n-1) {}_{n-2} C_{i-2} \) (\(i\) ≥2)を示し、V(X)=\(npq\)を導出せよ。

    期待値

    (1)を解きます。

    ●\(i {}_n C_i \)=\(i \frac{n!}{i!(n-i)!}\)= \(\frac{n!}{(i-1)!(n-i)!}\)
    = \(n \frac{(n-1)!}{(i-1)!(n-i)!}\)= \(n {}_{n-1} C_{i-1} \)
    となります。

    ●期待値E(X)は
    E(X)= \(\sum_{i=1}^{n} \) \(i\)\({}_n C_i p^i q^{n-i}\)
    (E(X)なので、\(i\)を掛け算する必要がありますね。)

    =\(\sum_{i=1}^{n} \) \(i\)\({}_n C_i p^i q^{n-i}\)
    =\(\sum_{i=1}^{n} n {}_{n-1} C_{i-1} p^i q^{n-i}\)
    =\(np\)\(\sum_{i=1}^{n} {}_{n-1} C_{i-1} p^{n-1} q^{(n-1)-(i-1)}\)

    二項定理から
    \(\sum_{i=1}^{n} {}_{n-1} C_{i-1} p^{n-1} q^{(n-1)-(i-1)}\)=1
    なので、
    =\(np\)

    よって、
    E(X)= \(np\)
    となります。

    二項定理の式変形、少し慣れたでしょうか?

    分散

    (2)を解きます。

    ●\(i(i-1) {}_n C_i \)=\(i(i-1) \frac{n!}{i!(n-i)!}\)= \(n(n-1)\frac{(n-2)!}{(i-2)!(n-i)!}\)
    = \(n(n-1) {}_{n-2} C_{i-2} \)
    となります。

    まず、曲者であるE(X2)を計算します。
    E(X2)= \(\sum_{i=0}^{n} \) \(i^2\)\({}_n C_i p^i q^{n-i}\)
    (E(X2)なので、\(i^2\)を掛け算する必要がありますね。)

    =\(\sum_{i=0}^{n} \) \(i^2\)\({}_n C_i p^i q^{n-i}\)
    で、ここであえて、\(i^2=i(i-1)+i\)と分解します。ここはテクニックです。

    =\(\sum_{i=1}^{n} i(i-1) {}_n C_i p^i q^{n-i}\)+\(\sum_{i=0}^{n} i {}_n C_i p^i q^{n-i}\)
    =\(n(n-1)p^2 \sum_{i=2}^{n} {}_{n-2} C_{i-2} p^{i-2} q^{n-i}\)+\(np \sum_{i=1}^{n} {}_{n-1} C_{i-1} p^{i-1} q^{n-i}\)
    と二項定理の式の構造体を作る事ができます。

    よって、
    E(X2)=\(n(n-1)p^2+np\)
    となります。

    よって、分散V(X)は
    V(X)= E(X2)-E(X) =\(n(n-1)p^2+np-(np)^2\)
    =\(np(1-p)\)

    ⑦二項分布の期待値・分散の導出(その2)

    問題

    【問2】
    確率変数Xが二項分布に従い、P(X=\(i\))=\( {}_n C_r p^r q^{n-r}\) (ただし、\(p+q=1\))に従うとき、期待値E(X)=\(np\)、分散V(X)=\(np(1-p)\)を以下のやり方で導出したい。
    \(f(x)=(px+q)^n\)を使って、\(f^{‘}(x)\),\(f^{‘‘}(x)\)を導出して、E(X),V(X)を導出せよ。

    期待値

    (1)を解きます。

    \(f(x)\)= \(\sum_{i=0}^{n} {}_n C_i (px)^i q^{n-i}\)として微分すると、
    \(f^{‘}(x)\)=\(np(px+q)^{n-1}\)=\(\sum_{i=0}^{n} i {}_n C_i p^i x^{i-1} q^{n-i}\)
    となるので、
    \(f^{‘}(1)\)= \(\sum_{i=0}^{n} i {}_n C_i p^i 1^{i-1} q^{n-i}\)
    =\(\sum_{i=0}^{n} i {}_n C_i p^i q^{n-i}\)
    がまさに、 E(X)であり、
    \(f^{‘}(1)\)=\(np(p×1+q)^{n-1}\)=\(np(p+q)\)=\(np\) (\(p+q=1\)となります。
    あっさり解けましたね。

    分散

    (2)を解きます。

    さらに微分して、
    \(f^{‘‘}(x) \)=\(n(n-1)p^2 (px+q)^{n-2}\)= \(\sum_{i=0}^{n} i(i-1) {}_n C_i p^i x^{i-2} q^{n-i}\)
    \(f^{‘‘}(1) \)=\(n(n-1)p^2\)=\(\sum_{i=0}^{n} i(i-1) {}_n C_i p^i q^{n-i}\)は前問の計算経過からもよく見ると、

    \(f^{‘‘}(1) \)+\(np\)=E(X2)となるので、
    V(X)= E(X2)-E(X) =\(n(n-1)p^2+np-(np)^2\)
    =\(np(1-p)\)

    となります。2通りの解法で解けるので面白いですね!

    以上、
    ①二項定理の式に慣れる
    ➁二項定理の式の構造体を活用して期待値、分散を計算する
    をわかりやすく解説しました。

    まとめ

    二項分布は確率分布の一種と見ずに、高校数学の確率の延長にあるものです。二項分布は、正規分布に近づく不思議な性質があります。また、抜取検査のOC曲線のベースにもなります。高校数学で書ける易しい分布であると理解できます。

    • ➀高校数学の確率を復習
    • ②二項分布の期待値・分散は暗記
    • ③二項分布の正規分布化を実例で体験
    • ④OC曲線に二項分布が必須
    • ⑤二項分布の式がマスターできる!
    • ⑥二項分布の期待値・分散の導出(その1)
    • ⑦二項分布の期待値・分散の導出(その2)
  • 確率変数の期待値と分散が計算できる【初心者向け】

    確率変数の期待値と分散が計算できる【初心者向け】

    コインやサイコロの期待値は簡単ですよね。でも、確率変数や期待値の加法性を使って分散・標準偏差を計算するあたりから急に難しくなり、理解しないまま公式暗記して試験を乗り切ろうとしていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    【簡単】期待値の公式アレルギーが無くなる【初心者向け】

    期待値の公式アレルギーが無くなるポイント

    • ➀コイン・サイコロの期待値が解ければOK
    • ②期待値の計算式を一般化する過程に慣れる
    • ③期待値E[X]と分散V[X]の関係式がわかればOK

    さっそく見ていきましょう。

    [themoneytizer id=”105233-2″]

    ●You tube動画もあります。ご確認ください。

    確率変数の期待値と分散が計算できる【初心者向け】

    ●You tube動画ご覧ください。

    ➀コイン・サイコロの期待値が解ければOK

    いきなり、

    • E[X]=\(\int x_ip_i dx\)
    • E[aX+b]=aE[X]+b
    • V[X]=E[\(X^2\)]-E\([X]^2\)

    に入らずに、中学・高校数学の出た期待値問題から始めましょう。上の式から入ると、数学アレルギー反応が出ますよね!算数の簡単な問題で使った式を一般化すると徐々に上の難解な式がすぐわかります

    【問】等確率なサイコロ(1から6の目)が1個ある。
    (1) サイコロを1回振って出る目の期待値はいくらか?
    (2) サイコロを2回振って出る目の期待値はいくらか?

    期待値の計算方法は、確率×出る目の合計ですよね。
    (1)期待値E=\(\frac{1+2+3+4+5+6}{6}\)=\(\frac{21}{6}\)=3.5
    (2)出る目と確率を整理しましょう。

    2 3 4 5 6 7 8 9 10 11 12
    確率 \(\frac{1}{12}\) \(\frac{1}{12}\) \(\frac{1}{12}\) \(\frac{1}{12}\) \(\frac{1}{12}\) \(\frac{1}{12}\) \(\frac{1}{12}\) \(\frac{1}{12}\) \(\frac{1}{12}\) \(\frac{1}{12}\) \(\frac{1}{12}\)

    期待値E=\(\frac{2×1+3×2+・・・+12×1}{12}\)
    =7
    また、1個の目の期待値の倍としてもよいですね。

    ②期待値の計算式を一般化する過程に慣れる

    期待値の計算方法を一般化する

    統計の難解な数式に早く慣れる方法を提案します。数学の得意・不得意関係なく、数式の意味を読み取るには結構時間がかかります。よく使う方法が2つあります。

    難しい数式の読み方

    ・式を言葉で読んでみて意味を理解する
    ・簡単な例で式を作ってから、式を一般化する

    先の、サイコロ1との出る目の期待値の計算は中高生でもできます。算出式をよく見ましょう。
    E=1×\(\frac{1}{6}\)+2×\(\frac{1}{6}\)+・・・+6×\(\frac{1}{6}\)
    =\(\frac{21}{6}\)=3.5
    ですね。数字1から6は「出る目」の値で、\(\frac{1}{6}\)は確率ですね。

    出る目を\(x_i\)、出る目\(x_i\)の確率を\(p_i\)、和をΣで書き直します。

    E=\(\sum_{i=1}^{n} x_i p_i\)
    が期待値の基本形です。必ずこの式から期待値はスタートします。

    ここで確率\(p_i\)を確率密度関数f(x)に変えて定義することもあります。その場合、2つ定義を変えます。

    ・確率\(p_i\)を確率密度関数f(x)に変える
    ・数列Σを積分∫に変える

    期待値Eは
    E=\(\int xf(x) dx\)
    となります。∫も関数も出てきましたが、基本は
    E=\(\sum_{i=1}^{n} x_i p_i\)
    です。見た目は違いますが、サイコロの出る目の期待値を求める式と同じです。

    期待値の加法性を理解する

    期待値の加法性

    a,bは定数、X,Yは変数とする。
    ・\(E[aX+bY]=aE[X]+bE[Y]\)
    ・\(E[aX+b]=aE[X]+b\)

    加法性の証明を教科書やwebサイトでは数式を使って導出しますが、「何をやっているのか?」「具体的なイメージがつかない」ですよね。

    具体的な例で理解しましょう。期待値の基本はサイコロの出た目の計算ですね。

    ➀等確率で出るサイコロA(1から6)を1個1回振り、その出た目を3倍にする。
    ②等確率で出るサイコロB(1から4)を1個1回振り、その出た目を2倍にする。
    ➀と②を足してさらに5を足した場合の期待値を求めよ。

    ➀は(\(1×\frac{1}{6}\)+・・・+\(6×\frac{1}{6}\))=\(\frac{21}{6}\)=3.5
    を3倍しますから、3.5×3=10.5です。

    ②は(\(1×\frac{1}{4}\)+・・・+\(4×\frac{1}{4}\))=\(\frac{10}{4}\)=2.5
    を2倍しますから、2.5×2=5です。

    さらに5を足すので、期待値は10.5+5+5=21.5です

    一方、期待値の加法性を使うと、
    E=E[aX+bY+c]
    に、a=3,b=2,c=5,E[X]=3.5,E[Y]=2.5を代入します。
    E[aX+bY+c]=aE[X]+bE[Y]+c=3×3.5+2×2.5+5=21.5
    と結果が一致します。

    期待値の加法性の公式を使ってもよいし、サイコロの出る目の式のまま解いてもよいのです。
    公式の方が一般性があるので説得力があります。しかし、慣れないうちはサイコロの出る目の計算で期待値を理解しましょう。慣れたら一般化の式を理解していきましょう。

    期待値の加法性がわかるポイント

    3つの式がイメージできること。(サイコロの例で理解しましょう)
    ➀E[aX]=aE[X]  「例:その出た目を3倍にする」
    ②E[X+Y]=E[X]+E[Y]  「例:2種類のサイコロの出た目を足した」
    ③E[X+a]=E[X]+a 「例:さらに5を足した」

    期待値E[X]のXにいろいろ値を入れて慣れる

    期待値の加法性に少し慣れたら、次の計算をしてみましょう。

    ➀E[3X+2]
    ②E[\(X^2\)]

    ➀は加法性で出たE[aX+bY+c]=aE[X]+bE[Y]+cを使えばよいです。でも、E[\(X^2\)]はどうしましょうか?

    基本に戻りましょう。サイコロの出る目の期待値の計算でOKです。サイコロの例で計算しましょう。

    等確率で出るサイコロ(X=1から6)の期待値を求めよ。
    ➀サイコロを1個1回振ったときの出る目の期待値E[X]
    ②サイコロを1個1回振ったときの出る目を2乗にした期待値E[\(X^2\)]

    ➀は(\(1×\frac{1}{6}\)+・・・+\(6×\frac{1}{6}\))=\(\frac{21}{6}\)=3.5ですね。
    ②は機械的にそのまま2乗を式に入れます

    E[\(X^2\)]=(\(1^2×\frac{1}{6}\)+・・・+\(6^2)×\frac{1}{6}\)
    =\(\frac{(1+4+9+16+25+36)}{6}\)
    =\(\frac{91}{6}\)ですね。

    \(x^2\)の期待値とはどういう意味か?が気になりますが、あまり気にしないで代入してください

    いい加減な意見ですが、私は長年E[\(X^2\)]の意味を考えましたが機械的に代入するものでよいと結論に至ったからです。

    ですから、E[\(X^3\)]を求めようとすると、
    E[\(X^3\)]=(\(1^3×\frac{1}{6}\)+・・・+\(6^3×\frac{1}{6}\))となります。

    出る目Xを変数にして、いろいろな変数を代入することに慣れてください。ここが分散の導出に必要です。期待値Eはサイコロの出る目の計算であることは変わりませんが、E[X]に変数Xをいろいろ代入するように慣れていきましょう。

    ③期待値E[X]と分散V[X]の関係式がわかればOK

    分散の定義を理解する

    分散の定義

    V[X]=E[\((X-E[X])^2\)]=E[\(X^2\)]-\(E[X]^2\)

    上の式が理解するための3つのポイントを解説します。

    分散の定義で理解したポイント

    (A)E\([(X-E[X])^2]\)の意味?
    (B)\(E[X^2]-E[X]^2\)になる理由
    (C)\(E[X^2] \)の値の算出方法(先ほどやりましたね)

    (A)E\((X-E[X])^2\)の意味

    分散の定義は、各データと平均との差を2乗した和を個数で割る値ですね。式で書くと、
    \(V=\frac{(x_i-μ)^2}{n}\)
    になります。

    ここで、
    (あ)\(x_i\)をX
    (い)μをE[X]に変え、
    (う)全体の\(\frac{1}{n}\)は平均Eとすると、
    \(V=\frac{(x_i-μ)^2}{n}\)
    =\(\frac{(X-E[X])^2}{n}\)
    =E[\((X-E[X])^2\)]
    に変えることができます。

    (あ)(い)は文字を変えるだけで理解しやすいです。(う)は理解しづらいので解説します。

    個数nで割るは、全体を平均値とすると同じですね。なので、全体に期待値E[]をつけることになります。

    (B)\(E[X^2]-E[X]^2\)になる理由

    次で解説します。

    分散の式を展開してE[X]に慣れる

    E[X]に慣れるために、教科書やwebサイトのように途中経過を省かずに計算します。

    V[X]
    =E[\((X-E[X])^2\)]
    =E[\(X^2-2XE[X]+E[X]^2\)]
    ここは、\((x+y)^2=x^2+2xy+y^2\)です。
    =E[\(X^2\)]-E[2XE[X]]+E[\(E[X]^2\)]

    各項をばらばらにしました。
    さて、ここでE[X]は平均値μで、変数ではなく定数ですよね。
    =E[\(X^2\)]-E[2Xμ]+E[\(μ^2\)]
    =E[\(X^2\)]-2μE[X]+\(μ^2\)
    平均値μは定数なので、E[]の外に出せます。

    さらに、定数μ=E[X]に戻します。ここの変形が強引ですけど。
    =E[\(X^2\)]-2 E[X]E[X]+\( E[X]^2\)
    = E[\(X^2\)]-\( E[X]^2\)
    よって、
    V[X]= \(E[X^2]-E[X]^2\)

    分散の導出過程をよく見て、期待値E[X]、E[\(X^2\)]アレルギーを無くしていきましょう。ここがクリアーすれば、回帰分析、分散分析、検定などの理解が早くなります。

    まとめ

    期待値は、確率×出る目の合計です。これを一般化すると期待値の加法性や分散の公式まで導出ができました。他に期待値を使った複雑な式を見たら、アレルギー反応する前にこの記事に戻りましょう。期待値は確率×出る目の合計から始まります。

    • ➀コイン・サイコロの期待値が解ければOK
    • ②期待値の計算式を一般化する過程に慣れる
    • ③期待値E[X]と分散V[X]の関係式がわかればOK

  • error: Content is protected !!