カテゴリー: 手法

  • 【本記事限定】実験計画法では実験回数を減らすために直交性が必須

    【本記事限定】実験計画法では実験回数を減らすために直交性が必須

    「直交表にある直交って何?」、「直交性がなぜ必要なのか?」、「直交性があればなぜ、実験回数が減らせるの?」などが説明できずに困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    【本記事限定】実験計画法では実験回数を減らすために直交性が必須

    実験計画法の直交性がすぐわかる

    • ➀実験回数が減らせる配置実験
    • ②水準の数が持つ3種類の表記方法
    • ③直交性とは他の因子の効果を見せなくすること

    さっそく見ていきましょう。

    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】実験計画法問題集を販売します!

    QC検定®1級合格したい方におススメです。
    QC検定®1級、過去全回分の問題と実験計画法参考書を研究して、作り上げたオリジナル良問30題を1500円で提供します。ぜひご購入、学習して合格しましょう。

    究める!実験計画法 演習問題を販売します!

    実験計画法を究めた方におススメです。
    実験計画法をマスターしたい方に、必須な演習問題集(2500円)を作成しました。しっかり勉強して究めましょう。

    ➀実験回数が減らせる配置実験

    実験回数が減らせる配置方法

    例に、3因子(A,B,C)、3水準の実験を考えます。

    単純に全パターンを実験すると、実験回数は\(3^3\)=27回ですね。

    実は、うまく配置すると27回が9回で済みます。実験計画法は、実験回数が減らせると言われる理由です。

    実験回数を減らせる立体イメージ

    実験を立方体でイメージします。因子A-Bの面、因子A-Cの面、因子B-Cの面の3面で水準数がそれぞれ3ですから、1面あたり9個のブロックがある立方体を考えます。

    平面図、側面図と正面図を下図に書いてみます。
    すべての実験を実施するのですべてのブロックは青色で詰まっていますね

    直交

    しかし、この平面図、側面図と正面図を満たす立体は
    すべてブロックが詰まっている場合(完全配置実験)
    一部のブロックだけが詰まっている場合(部分配置実験)
    両方があります。図を見れば一目瞭然ですね。

    配置実験

    立体図の右側の青いブロックは全部で9個しかありませんが、平面、側面、正面から見るとすべて詰まった27個のブロックからなる立方体と同じに見えます。

    実験回数が減らせる場合のデータの構造式

    27回の実験が9回に減らせる場合を紹介しましたが、データの構造式を比較します。

    直交性

    どの主効果α、β、γの合計が0になっています。
    これが最も重要です。

    例えば、9回の実験の例で\(α_1\)の効果を見るために、
    \( x_{111}+x_{122}+x_{133}\)を計算します。すると、β、γの合計は0です。
    つまり、因子Aの効果だけ取り出すことができます。
    同様に、\(β_1\)の効果や\(γ_1\)の効果も確認できますね。

    データの構造式

    実験回数が減らせるポイント

    調べたい因子以外を、合計0にすれば実験回数を減らしてもよい。

    ②水準の数が持つ3種類の表記方法

    実験回数を減らせるのは、調べたい因子以外を、合計0にすればよいと解説しました。
    実験回数を減らせるのと直交性にはどういう関係があるかを解説します。

    その前に!

    水準の数が持つ3種類の表記方法

    (i)データ構造式。
    (ii)直交表の成分を算出する場合
    (iii)直交性を確認する場合

    まとめると、下の表になります。

    場合 表示例
    (i) データの構造式 1,2,3,・・・,n
    (ii) 直交表の成分を
    算出する場合
    0,1,2,・・・,(n-1)
    (iii) 直交性を確認
    する場合
    偶数: -n,-(n-1),・・・,-1,1,・・・,(n-1),n
    奇数:-(n-1),・・・,-1,0,1,・・・,(n-1)

    上の表の詳細を下の表で説明します。

    場合 表示ルール
    (i) データの構造式 1から開始
    (ii) 直交表の成分を
    算出する場合
    0から開始
    (➀から1引く)
    (iii) 直交性を確認
    する場合
    ・合計が0になるように正負に数字を入れる
    ・偶数個の場合は中間に0を入れない
    ・奇数個の場合は中間に0を入れる

    (i)のデータの構造式では、添字に該当し、1から数えていきますね。
    (ii)の直交表の成分を算出する場合とは、直交表の交互作用列のベクトル成分を求めるときに、(i)の値を1引いて、0スタート表示に変えます。交互作用列のベクトル成分のつくり方はここを見てください。
    (iii)は直交性(内積=0かどうか)を調べるために表示を変えます。

    実験計画法の教科書は(i)~(iii)の表示方法を使い分けていますが、ルールが規定されていないので、本記事ではルールを紹介しました。

    水準の数が持つ3種類の表記方法の例

    具体例を挙げます。

    水準の数が5の場合

    (i)データ構造式: 「1,2,3,4,5」
    (ii)直交表の成分を算出する場合: 「0,1,2,3,4」
    (iii)直交性を確認する場合: 「-2,-1,0,1,2」

    水準の数が6の場合

    (i)データ構造式: 「1,2,3,4,5,6」
    (ii)直交表の成分を算出する場合: 「0,1,2,3,4,5」
    (iii)直交性を確認する場合: 「-3,-2,-1,1,2,3」

    具体例をみれば、簡単ですね。

    ③直交性とは他の因子の効果を見せなくすること

    直交といえば、内積が0ですね。大学受験で条件反射的に解きましたよね。

    でも、
    直交性と内積0は必要条件であるが、十分条件ではありません。
    直交性と「他の因子の効果を見せなくすること」が必要十分条件になります。

    なお、「他の因子の効果を見せなくすること」ができれば、内積0は満たせます。

    解説します!

    直交性は内積=0でまずチェック

    例として、直交表\(L_9 (3^4) \)を挙げます。

    直交表 直交表成分
    A B A×B1 A×B2 A B A×B1 A×B2
    1 1 1 1 1 -1 -1 -1 -1
    2 1 2 2 2 -1 0 0 0
    3 1 3 3 3 -1 1 1 1
    4 2 1 2 3 0 -1 0 1
    5 2 2 3 1 0 0 1 -1
    6 2 3 1 2 0 1 -1 0
    7 3 1 3 2 1 -1 1 0
    8 3 2 1 3 1 0 -1 1
    9 3 3 2 1 1 1 0 -1

    成分AとB、AとA×Bの内積を計算しましょう。

    • 内積(AとB)=-1(-1+0+1)+0(-1+0+1)+1(-1+0+1)=0
    • 内積(AとA×B1)=-1(-1+0+1)+0(0+1-1)+1(1-1+0)=0

    内積0ですから、直交性があると言いたいですね。
    なお、直交表の各列どうしを直交性成分に直して、内積を計算すると0になります。

    直交性は内積=0では不十分な理由

     直交性はあっても直交表に割当られない場合を考えましょう。つまり、内積は0であるが、他因子効果の相殺しない場合が該当します。下図に一例を紹介します。

     (a)(b)共に、各水準数が同じ3個ずつ用意して、内積が0であることがわかります。続いて、直交表の水準の表記に変えます。

    直交表

    図から、\(a_1\)を算出すると下図になります。下図の左側は(a)のケースでβの効果が相殺されていますが、(b)のケースはβの効果が相殺されていないことがわかります。

    直交表

    よって内積0で「直交性」があっても、「調べる要因以外の効果が相殺されて」いなければ、実験回数を減らすなどの実験計画法として活用することができません。

    これが、内積0は必要であるが、不十分である理由です

    他の因子の効果を見せなくすることが直交性である

    内積0だけでは、不十分です。他の因子の効果を見せなくすることが必要です。

    つまり、直交表割当が可能な場合は、「ある因子の水準に対して、他の因子の全水準があること」です。
    下図にイメージ図に示します。

    データの構造式

    内積を計算すると、
    内積
    =\(α_1(β_1+β_2+…+βn)\)+\(α_2(β_1+β_2+…+βn)\)+…+\(α_n(β_1+β_2+…+βn)\)
    =\((α_1+α_2+…+αn)(β_1+β_2+…+βn)\)
    =0×0
    =0

    つまり、他の因子の効果を見せなくすることができたら、内積0も担保されます。
    「内積0」より「他の因子の効果を見せなくすること」を意識しましょう。

    直交性→内積 OK(必要条件)
    直交性←内積 NG(十分条件)

    直交性→他の因子効果を相殺 OK(必要条件)
    直交性←他の因子効果を相殺 OK(十分条件)

    まとめ

    実験回数を減らすための直交性について、解説しました。

    • ➀実験回数が減らせる配置実験
    • ②水準の数が持つ3種類の表記方法
    • ③直交性とは他の因子の効果を見せなくすること

  • 【簡単】データの構造式から母平均の点推定が導出できる

    【簡単】データの構造式から母平均の点推定が導出できる

    「母平均の点推定値を計算公式が複雑で覚えられない」、「有効反復数、田口の式や伊奈の式がうまく使いこなせない」などで困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    【簡単】データの構造式から母平均の点推定が導出できる

    データの構造式から母平均の点推定が導出できる

    • ➀データの構造式から母平均の点推定を求める方法は1つ
    • ②多元配置実験の母平均の点推定の導出方法
    • ③直交表を使った多因子実験の母平均の点推定の導出方法

    読んでおくべき関連記事

    データの構造式から実験計画法はすべて解けます。
    【1】まとめの関連記事

    【2】なぜ、データの構造式からすべて解けるかがわかる関連記事

    さっそく見ていきましょう。

    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】実験計画法問題集を販売します!

    QC検定®1級合格したい方におススメです。
    QC検定®1級、過去全回分の問題と実験計画法参考書を研究して、作り上げたオリジナル良問30題を1500円で提供します。ぜひご購入、学習して合格しましょう。

    究める!実験計画法 演習問題を販売します!

    実験計画法を究めた方におススメです。
    実験計画法をマスターしたい方に、必須な演習問題集(2500円)を作成しました。しっかり勉強して究めましょう。

    ➀データの構造式から母平均の点推定を求める方法は1つ

    【重要】母平均の点推定の導出方法

    (A)データの構造式を用意する。
    (B)(左辺)に調べたい効果の平均μを、(右辺)に調べたい効果を含む項をデータの構造式から残す。
    (C)(B)の式の主効果・交互作用の項をすべて\(x\)についての項に直す。
    (D)残った項を\(\widehat{μ+●}\) の項に変える。

    二元配置実験の場合

    (A)データの構造式を用意します。
    \(x_{ijk} =μ+α_i+β_j+(αβ)_{ij}\)+\(e_{ijk}\)

    とします。

    (B)最適条件\(μ(A_i B_j)\)の点推定値を求めましょう。
    データ構造式のうち、ABを含む項だけ残します。
    \(μ(A_i B_j)\)=\(μ+α_i+β_j+ (αβ)_{ij}\)

    (C) 主効果・交互作用の項をすべて\(x\)についての項に直します。
    \(μ\)=\(\bar{\bar{x}}\)
    \(α_i\)=\(\bar{x_{i‥}}-\bar{\bar{x}}\)
    \(β_j\)=\(\bar{x_{・j・}}-\bar{\bar{x}}\)
    \( (αβ)_{ij}\)=\(\bar{x_{ij・}}\)-\(\bar{x_{i‥}}\)-\(\bar{x_{・j・}}\)+\(\bar{\bar{x}}\)
    を代入します。

    \(μ(A_i B_j)\)
    =\(μ+α_i+β_j+ (αβ)_{ij}\)
    =\(\bar{\bar{x}}\)+(\(\bar{x_{i‥}}-\bar{\bar{x}}\))+(\(\bar{x_{・j・}}-\bar{\bar{x}}\))+(\(\bar{x_{ij・}}\)-\(\bar{x_{i‥}}\)-\(\bar{x_{・j・}}\)+\(\bar{\bar{x}}\))
    =\(\bar{x_{ij・}}\)

    (D)残った項を\(\widehat{μ+●}\) の項に変えます。
    \(\bar{x_{ij・}}\)=\(\widehat{μ+a_i+b_j+(ab)_{ij}}\)
    を代入します。

    \(μ(A_i B_j)\)
    =\(\bar{x_{ij・}}\)
    =(\(\widehat{μ+a_i+b_j+(ab)_{ij}}\))

    初めて見ると難しそうと思いますが、この(A)から(D)の方法で、全実験パターンで使えます。

    以下応用事例を挙げますが、同じ方法で解説します。

    ②多元配置実験の母平均の点推定の導出方法

    【重要】母平均の点推定の導出方法

    (A)データの構造式を用意する。
    (B)(左辺)に調べたい効果の平均μを、(右辺)に調べたい効果を含む項をデータの構造式から残す。
    (C)(B)の式の主効果・交互作用の項をすべて\(x\)についての項に直す。
    (D)残った項を\(\widehat{μ+●}\) の項に変える。

    三元配置実験の場合

    (A)データの構造式を用意します。
    \(x_{ijk} =μ+α_i+β_j+γ_k\)+\(e_{ijk}\)

    とします。

    (B)最適条件\(μ(A_i B_j C_k)\)の点推定値を求めましょう。
    データ構造式のうち、ABCを含む項だけ残します。
    \(μ(A_i B_j C_k)\)=\(μ+α_i+β_j+γ_k\)

    (C) 主効果・交互作用の項をすべて\(x\)についての項に直します。
    \(μ\)=\(\bar{\bar{x}}\)
    \(α_i\)=\(\bar{x_{i‥}}-\bar{\bar{x}}\)
    \(β_j\)=\(\bar{x_{・j・}}-\bar{\bar{x}}\)
    \(γ_k\)=\(\bar{x_{‥k}}-\bar{\bar{x}}\)
    を代入します。

    \(μ(A_i B_j C_k)\)
    =\(μ+α_i+β_j+γ_k\)
    =\(\bar{\bar{x}}\)+(\(\bar{x_{i‥}}-\bar{\bar{x}}\))+(\(\bar{x_{・j・}}-\bar{\bar{x}}\))+(\(\bar{x_{‥k}}-\bar{\bar{x}}\))
    =\(\bar{x_{i‥}}+\bar{x_{・j・}}\)+\(\bar{x_{‥k}}-2\bar{\bar{x}}\)

    (D)残った項を\(\widehat{μ+●}\) の項に変えます。
    \(\bar{x_{i‥}}=\widehat{μ+a_i}\)
    \(\bar{x_{・j・}}=\widehat{μ+b_j}\)
    \(\bar{x_{‥k}}=\widehat{μ+c_k}\)
    \(\bar{\bar{x}}=\widehat{μ}\)
    を代入します。

    \(μ(A_i B_j C_k)\)
    =\(\bar{x_{i‥}}\)+\(\bar{x_{・j・}}\)+\(\bar{x_{‥k}}\)-2\(\bar{\bar{x}}\)
    =(\(\widehat{μ+a_i}\))+(\(\widehat{μ+b_j}\))+(\(\widehat{μ+c_k}\))-2\(\widehat{μ}\)

    演習問題(解説は解説書をご覧ください。)
    問:次のような、データの構造式を定義した場合、母平均の点推定を導出せよ。
    \(x_{ijk} =μ+α_i+β_j+(αβ)_{ij}\)+\((βγ)_{jk}+e_{ijk}\)

    母平均の点推定 \(μ(A_i B_j)\)

    詳細な解説は、演習問題集にあります。

    【まとめ9】実験計画法を究める演習問題集を販売します
    実験計画法をマスターしたい方に、必須な演習問題集を作成しました。是非本記事を読んで、勉強しましょう。

    ③直交表を使った多因子実験の母平均の点推定の導出方法

    どんどん、複雑なデータの構造式にしますが、導出方法は同じです。

    【重要】母平均の点推定の導出方法

    (A)データの構造式を用意する。
    (B)(左辺)に調べたい効果の平均μを、(右辺)に調べたい効果を含む項をデータの構造式から残す。
    (C)(B)の式の主効果・交互作用の項をすべて\(x\)についての項に直す。
    (D)残った項を\(\widehat{μ+●}\) の項に変える。
    直交表L16(215)に因子A,B,C,D,Fと交互作用A×B,C×Dを割り付けた。
    データの構造式は
    x=μ+a+b+c+d+f+(ab)+(cd)+e (eは誤差)
    とする。この時、ABCDFの水準組み合わせで母平均を推定する。
    \( \widehat{μ(ABCDF)}\)を導出せよ。

    (A)から(D)の方法で導出します。全く同じ方法で攻略できるので大丈夫です。

    (A)データの構造式を用意します。
    x=μ+a+b+c+d+f+(ab)+(cd)+e

    (B)最適条件μ(ABCDF)の点推定値を求めましょう。
    直交表に多因子を割り付けているので、添字は簡略化します。
    データ構造式のうち、ABCDFを含む項だけ残します。
    μ(ABCDF)= μ+a+b+c+d+f+(ab)+(cd)

    (C) 主効果・交互作用の項をすべて\(x\)についての項に直します。
    ここで、直交表に多因子を割り付けているので、添字は簡略化します。
    \(μ\)=\(\bar{\bar{x}}\)
    a=\(\bar{x_a}-\bar{\bar{x}}\)
    b=\(\bar{x_b}-\bar{\bar{x}}\)
    c=\(\bar{x_c}-\bar{\bar{x}}\)
    d=\(\bar{x_d}-\bar{\bar{x}}\)
    f=\(\bar{x_f}-\bar{\bar{x}}\)
    ab=\(\bar{x_{ab}}-\bar{x_a}-\bar{x_b}+\bar{\bar{x}}\)
    cd=\(\bar{x_{cd}}-\bar{x_c}-\bar{x_d}+\bar{\bar{x}}\)
    を代入します。

    μ(ABCDF)
    =μ+a+b+c+d+f+(ab)+(cd)
    =\(\bar{\bar{x}}\)+(\(\bar{x_a}-\bar{\bar{x}}\))+(\(\bar{x_b}-\bar{\bar{x}}\))+(\(\bar{x_c}-\bar{\bar{x}}\))+(\(\bar{x_d}-\bar{\bar{x}}\))+(\(\bar{x_f}-\bar{\bar{x}}\))+(\(\bar{x_{ab}}-\bar{x_a}-\bar{x_b}+\bar{\bar{x}}\))+(\(\bar{x_{cd}}-\bar{x_c}-\bar{x_d}+\bar{\bar{x}}\))
    =\(\bar{x_{ab}}\)+\(\bar{x_{cd}}\)+\(\bar{x_f}\)-2\(\bar{\bar{x}}\)

    (D)残った項を\(\widehat{μ+●}\) の項に変えます。
    \(\bar{x_{ab}}=\widehat{μ+a+b+(ab)}\)
    \(\bar{x_{cd}}=\widehat{μ+c+d+(cd)}\)
    \(\bar{x_f}=\widehat{μ+f}\)
    \(\bar{\bar{x}}=\widehat{μ}\)
    を代入します。

    μ(ABCDF)
    =\(\bar{x_{ab}}\)+\(\bar{x_{cd}}\)+\(\bar{x_f}\)-2\(\bar{\bar{x}}\)
    =(\(\widehat{μ+a+b+(ab)}\))+(\( \widehat{μ+c+d+(cd)}\))+(\( \widehat{μ+f}\))-2\(\widehat{μ}\)

    以下の演習問題もちょっと考えてみてください。

    演習問題(解説は解説書をご覧ください。)
    問:次のデータの構造式において、母平均の点推定を導出せよ。
    直交表L16(215)に因子R(反復),A,B,D,Fと交互作用A×D,eを割り付けた。
    分割法を適用しており、1次単位がR,A,B、2次単位がD,F,A×Dである。
    (1)データの構造式を作れ。
    (2)最適条件の母平均の点推定μ(ABDF)を導出せよ。

    最強に難しいですが、データの構造式をたてて、(A)から(D)の流れで解けば必ず導出できます。

    答えだけ書いておきます。
    (1) x=μ+r+a+b+\(e_{(1)}\)+d+f+\(e_{(2)}\)
    (2) μ(ABDF)=(\(\widehat{μ+a+d+(ad)}\))+(\(\widehat{μ+b}\))+(\(\widehat{μ+f}\))-2\(\widehat{μ}\)

    詳細な解説は、演習問題集にあります。

    【まとめ9】実験計画法を究める演習問題集を販売します
    実験計画法をマスターしたい方に、必須な演習問題集を作成しました。是非本記事を読んで、勉強しましょう。

    まとめ

    データの構造式から母平均の点推定の導出ができます。導出方法は1つだけなので、何度も読んで確実に身につけてください。

    • ➀データの構造式から母平均の点推定を求める方法は1つ
    • ②多元配置実験の母平均の点推定の導出方法
    • ③直交表を使った多因子実験の母平均の点推定の導出方法

    読んでおくべき関連記事

    データの構造式から実験計画法はすべて解けます。
    【1】まとめの関連記事

    【2】なぜ、データの構造式からすべて解けるかがわかる関連記事

  • 【簡単】実験計画法の交絡(別名)とはキャラがかぶっていること

    【簡単】実験計画法の交絡(別名)とはキャラがかぶっていること

    「交絡(こうらく)って何?」、「交絡しているといいの?悪いの?」など、実験計画法の交絡がわからず、困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    【簡単】実験計画法の交絡(別名)がわかる

    交絡を理解する3つのポイント

    • ➀交絡(別名)はキャラがかぶっていること
    • ②交絡を回避する方法は因子数を増やすこと
    • ③直交表など実験回数が減らせるのは交絡があるから

    さっそく見ていきましょう。

    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】実験計画法問題集を販売します!

    QC検定®1級合格したい方におススメです。
    QC検定®1級、過去全回分の問題と実験計画法参考書を研究して、作り上げたオリジナル良問30題を1500円で提供します。ぜひご購入、学習して合格しましょう。

    究める!実験計画法 演習問題を販売します!

    実験計画法を究めた方におススメです。
    実験計画法をマスターしたい方に、必須な演習問題集(2500円)を作成しました。しっかり勉強して究めましょう。

    ➀交絡(別名)はキャラがかぶっていること

    データの構造式の添字が同じなら交絡している

    一元配置実験 \( x_i=μ+α_i+e_i\)があります。
    でも、\(α_i\)と\(e_i\)が交絡しています。

    「交絡」は「別名」と書く教科書もあります。

    に書いたとおり、反復が必要なのは、主効果と交絡するからでしたね。

    他の例も見てみましょう。

    二元配置実験 \( x_{ij}=μ+α_i+β_j+(αβ)_{ij}+e_{ij}\)
    分割法 \(x_{ij}=μ+α_i+e_{(1)i}+β_j\)+\((αβ)_{ij}+e_{(2)ij}\)

    添字を見ればわかります。データの構造式だけ見ても意外と交絡に気がつきません。平方和を算出して、平方和が0になって「おかしい」となり、交絡に気が付くことがよくあります。

    二元配置実験: \((αβ)_{ij}\)と\( e_{ij}\)が交絡
    分割法: \(α_i\)と\( e_{(1)i}\)、\((αβ)_{ij}\)と\( e_{(2)ij}\)がそれぞれ交絡

    ②交絡を回避する方法は因子数を増やすこと

    に書いたとおり、反復が必要なのは、主効果と交絡するからでしたね。

    反復して交絡を回避するのは、因子数を増やすことで回避しているのです。

    一元配置実験 \( x_i=μ+α_i+e_i\)

    一元配置実験 \( x_{ij}=μ+α_i+e_{ij}\)
    と、添字jを追加して、\(α_i\)と\(e_{ij}\)を別々にしました。

    他の例も交絡を回避してみましょう。

    二元配置実験 \( x_{ij}=μ+α_i+β_j+(αβ)_{ij}+e_{ij}\)
    分割法 \(x_{ij}=μ+α_i+e_{(1)i}+β_j\)+\((αβ)_{ij}+e_{(2)ij}\)

    添字を追加(因子数増加)して、交絡を回避します。

    二元配置実験 \(x_{ij}=μ+α_i+β_j+(αβ)_{ij}+e_{ij}\)

    二元配置実験 \(x_{ijk}=μ+α_i+β_j+(αβ)_{ij}+e_{ijk}\)
    と、添字kを追加して、\((αβ)_{ij}\)と\(e_{ijk}\)を別々にしました。

    分割法 \(x_{ij}=μ+α_i+e_{(1)i}+β_j\)+\((αβ)_{ij}+e_{(2)ij}\)

    分割法 \(x_{ij}=μ+α_i+e_{(1)ik}+β_j\)+\((αβ)_{ij}+e_{(2)ijk}\)
    と、添字kを追加して、\(α_i\)と\(e_{(1)ik}\)、\((αβ)_{ij}\)と\(e_{(2)ijk}\)を別々にしました。

    分割法の式で、1次単位にあたる式を取り出します。
    \( x_{ij}=μ+α_i+e_{(1)ik}\)
    です。よく見ると、添字kだけの主効果が抜けていますね
    ここによく乱塊法から \(γ_k\)を入れて
    \( x_{ij}=μ+γ_k+α_i+e_{(1)ik}\)
    とすることが多いです。これが、分割法に乱塊法がよく使われる理由です。

    また、上の分割法を交絡回避したいなら、
    分割法 \(x_{ij}=μ+α_i+e_{(1)ik}\)+\(β_j+(αβ)_{ij}+e_{(2)ijk}\)
    または、
    分割法 \(x_{ij}=μ+α_i+e_{(1)ik}\)+\(β_j+(αβ)_{ij}+e_{(2)ijl}\)
    と2次単位の誤差の添字をijkでなく、ijlとして4種類の添字にしてもよいです。ただ、添字は少ない方がシンプルでよいです。

    ③直交表など実験回数が減らせるのは交絡があるから

    直交表は交絡が前提で活用するものです。

    例として、直交表\(L_8(2^7)\)を挙げます。下の図のように5因子A,B,C,D,Fと交互作用A×Bと誤差Eを7列に割り当てます。

    一見良さそうし、実際使っても良いです。しかし、主効果D,Fに割り当てた[5]列,[6]列は、交絡しています。
    [5]列の成分はa×cですから交互作用A×Cと主効果Dは交絡しています。
    これを許容してよいとして使うのが実験回数が減らせる直交表です。
    ですから、交絡しても構わないと割り切っているのです。

    割付 A B A×B C D F e
    [1] [2] [3] [4] [5] [6] [7]
    1 1 1 1 1 1 1 1
    2 1 1 1 2 2 2 2
    3 1 2 2 1 1 2 2
    4 1 2 2 2 2 1 1
    5 2 1 2 1 2 1 2
    6 2 1 2 2 1 2 1
    7 2 2 1 1 2 2 1
    8 2 2 1 2 1 1 2
    成分 a a a
    b b b b
    c c c c

    割付 A B A×B C A×C B×C e
    [1] [2] [3] [4] [5] [6] [7]
    1 1 1 1 1 1 1 1
    2 1 1 1 2 2 2 2
    3 1 2 2 1 1 2 2
    4 1 2 2 2 2 1 1
    5 2 1 2 1 2 1 2
    6 2 1 2 2 1 2 1
    7 2 2 1 1 2 2 1
    8 2 2 1 2 1 1 2

    a a a
    b b b b
    c c c c

    直交表は割り当てた成分に従って、列に割り当てるべきと私は考えます。

    直交表は実験回数が減らせるメリットをうたう分、交絡するリスクを承知であることをよく理解してください。

    交絡を回避して1つずつの要素を確実に実験したいならば、実験回数は相応しい回数で行うべきです。

    2水準系で5因子なら \(2^5\)=32回は実験しましょう。

    そもそも、計算機が未熟だった昭和の時代では、実験もシミュレーションも手間・コストがかかるため、何とか安く・早く・それなりの結果が出る手法が必要でした。それが実験計画法だったわけです。交絡を承知で実験回数を32回から8回で済み、結果もそこそこな直交表が有効でした。

    時代背景は、教科書には書いていない内容なので、直交表は実験回数が減らせる都合のよい方法と一方的に入ってきます。しかし、よく考えると交絡のデメリットがあります。そこをよく考えた上で直交表を活用しましょう。

    まとめ

    本記事では、交絡(別名)について解説し、直交表の活用の注意点まで述べました。

    • ➀交絡(別名)はキャラがかぶっていること
    • ②交絡を回避する方法は因子数を増やすこと
    • ③直交表など実験回数が減らせるのは交絡があるから

  • 【簡単】データの構造式で実験計画法がわかる(必読)

    【簡単】データの構造式で実験計画法がわかる(必読)

    「多元配置実験、乱塊法、分割法といっぱい手法があってわからない」、「解き方を1つ1つ覚えていくのが大変」、ど、実験計画法を習得するのにいろいろ困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    【簡単】データの構造式で実験計画法がわかる

    データの構造式からわかる実験計画法

    • ➀データの構造式は誤差項を機械的に書き出す
    • ②乱塊法、分割法等はデータの構造式の誤差項を書き換えただけ
    • ③データの構造式の項から自由度がわかる
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】実験計画法問題集を販売します!

    QC検定®1級合格したい方におススメです。
    QC検定®1級、過去全回分の問題と実験計画法参考書を研究して、作り上げたオリジナル良問30題を1500円で提供します。ぜひご購入、学習して合格しましょう。

    究める!実験計画法 演習問題を販売します!

    実験計画法を究めた方におススメです。
    実験計画法をマスターしたい方に、必須な演習問題集(2500円)を作成しました。しっかり勉強して究めましょう。

    さっそく見ていきましょう。

    ➀データの構造式は誤差項を機械的に書き出す

    実験計画法のポイント2つだけ

    (A)データを平均と誤差に分離する。
    (B)誤差を要因ごとに分解し、誤差の大きさを比較する。

    に書いたとおり、(A)(B)の2つだけでOKです。

    ここで、最も重要になるのが、データの構造式です。どの教科書にも書いていますが、分散分析や平方和に目が行くので、データの構造式は脇役になりがちです

    しかし、データの構造式がわかれば、多元配置実験、乱塊法、分割法、枝分れ実験、直交表をそれぞれ理解する必要もありませんし、自由度もデータの構造式からすべてわかります。

    例えば、3つの因子を使ったデータの構造式を書きましょう。

    \(x_{ijk} =μ+α_i+β_j+γ_k\)+\((αβ)_{ij}+(αγ)_{ik}+(βγ)_{jk}\)+\(e_{ijk}\)
    と書けます。平均と、3因子の総組み合わせ6通りと誤差1つの計8項から構成されますね。
    なお、3因子交互作用\((αβγ)_{ijk}\)と誤差\(e_{ijk}\)は交絡しますが、これは交絡のところで話をします。

    データの構造式は機械的にすべての項を一旦書く事が重要です。
    プーリングや調べない主効果・交互作用があれば誤差に含めればよいのです。

    \(x_{ijk} =μ+α_i+β_j+γ_k\)+\((αβ)_{ij}+(αγ)_{ik}+(βγ)_{jk}\)+\(e_{ijk}\)
    例えば、\((αγ)_{ik}\)は誤差に含め、\((βγ)_{jk}\)は確認対象外とすると、
    \(x_{ijk} =μ+α_i+β_j+γ_k\)+\((αβ)_{ij}\)+\(e_{ijk}\)
    \(e_{ijk}\)は\(e_{ijk}+(αγ)_{ik}+(βγ)_{jk}\)になります。

    機械的に書き出すだけなので、簡単ですね。

    ②乱塊法、分割法はデータの構造式の誤差項を書き換えただけ

    3つの因子を使ったデータの構造式
    \(x_{ijk} =μ+α_i+β_j+γ_k\)+\((αβ)_{ij}+(αγ)_{ik}+(βγ)_{jk}\)+e_{ijk}\)
    は三元配置実験のデータの構造式ですね。
    これを乱塊法、乱塊法+分割法の式に変えましょう。下図になります。

    データの構造式

    乱塊法のデータの構造式は三元配置実験から\(γ_k\)を反復因子に変えて、
    γを含む項をすべて誤差\(e_{ijk}\)に移せば完成です。

    分割法はよく乱塊法と組み合わせて出てきます。これが初めて習う時に、
    「分割法だけでもしんどいのに、何でさらにわからない乱塊法がくっついてくるの?」
    とため息が出ますよね。この理由も、ここで話しますが、
    分割法+乱塊法の方が、データの構造式が書きやすく、平方和が計算しやすいからです。

    分割法+乱塊法のデータの構造式は三元配置実験から\(γ_k\)を反復因子に変えて、
    \((αγ)_{ik}\)を\(e_{(1)ik}\)に変えて、\((βγ)_{jk}\)を誤差\(e_{ijk}\)に移せば完成です。
    γが反復因子と特別な因子に設定したので、γを含む交互作用に意味がなくなるため、誤差に入れました。
    ただし、γを含む交互作用をそのまま項にして平方和を計算することはできます。

    多くの参考書は、乱塊法、分割法をそれぞれの章で取り上げるため、個別に解き方を暗記しようとします。
    しかし、多元配置実験のシンプルなデータの構造式を書き換えているだけにすぎません
    なぜなら、多元配置実験のデータの構造式はすべての場合を書き出しているため、乱塊法、分割法などの応用手法はその構造式の項の組み合わせを変えているだけだからです。

    データの構造式がベースとなる多元配置実験を組み合わせて応用したものが、乱塊法・分割法などの応用手法だとわかれば、難しいと思わなくなるはずです。

    ③データの構造式の項から自由度がわかる

    データの構造式の項から自由度がわかる最重要ポイント

    自由度の表を提案します!是非活用ください。

    データの構造式の項まとめ

    \(x_{ijk} =μ+α_i+β_j+γ_k\)+\((αβ)_{ij}+(αγ)_{ik}+(βγ)_{jk}\)+\(e_{ijk}\)
    の各項を別表現します。自由度の算出や分散分析の期待値導出に必須です。

    ・μ=\(\bar{\bar{x}}\)
    ・\(α_i\)=\( \bar{x_{i‥}}-\bar{\bar{x}}\)
    ・\(β_j\)=\( \bar{x_{・j・}}-\bar{\bar{x}}\)
    ・\(γ_k\)=\( \bar{x_{・・k}}-\bar{\bar{x}}\)
    ・\((αβ)_{ij}\)=\(\bar{x_{ij・}}-\bar{x_{i‥}}-\bar{x_{・j・}}+\bar{\bar{x}}\)
    ・\((βγ)_{jk}\)=\(\bar{x_{・jk}}-\bar{x_{・j・}}-\bar{x_{・・k}}+\bar{\bar{x}}\)
    ・\((αγ)_{ik}\)=\(\bar{x_{i・k}}-\bar{x_{i‥}}-\bar{x_{・・k}}+\bar{\bar{x}}\)
    ・\(e_{ijk}\)=?? (書けますか?)
    と2因子の交互作用までなら暗記してもよいですが、3因子の交互作用以上になると式を求めるのが大変です。

    ここで、自由度の表を提案します!

    自由度の表を提案します!

    (A)縦軸に主効果、交互作用、合計Tを入れ、横軸に項を入れる。
    (B)主効果、2因子交互作用を構成する項の係数を入れる
    (C)合計Tの係数に合うように、誤差eを構成する項の係数を求める。

    自由度の表を作ると多因子のどんな場合でも簡単に自由度や係数を求めることができます。とても便利なので活用ください。

    i・・ ・j・ ・・k ij・ ・jk i・k ijk μ
    A 1 -1
    B 1 -1
    C 1 -1
    A×B -1 -1 1 1
    A×C -1 -1 1 1
    B×C -1 -1 1 1
    e(A×B×C) 1 1 1 -1 -1 -1 1 -1
    T 0 0 0 0 0 0 1 -1

    表を見ながら、誤差eを構成する式が書けますね。結構長い式ですが。
    ・\(e_{ijk}\)=\(x_{ijk}+(\bar{x_{i‥}}+\bar{x_{・j・}}+\bar{x_{・・k}})\)-\((\bar{x_{ij・}}+\bar{x_{・jk}}+\bar{x_{i・k}})\)-\(\bar{\bar{x}}\)

    まとめると、
    ・μ=\(\bar{\bar{x}}\)
    ・\(α_i\)=\( \bar{x_{i‥}}-\bar{\bar{x}}\)
    ・\(β_j\)=\( \bar{x_{・j・}}-\bar{\bar{x}}\)
    ・\(γ_k\)=\( \bar{x_{・・k}}-\bar{\bar{x}}\)
    ・\(αβ_{ij}\)=\(\bar{x_{ij・}}-\bar{x_{i‥}}-\bar{x_{・j・}}+\bar{\bar{x}}\)
    ・\(βγ_{jk}\)=\(\bar{x_{・jk}}-\bar{x_{・j・}}-\bar{x_{・・k}}+\bar{\bar{x}}\)
    ・\(αγ_{ik}\)=\(\bar{x_{i・k}}-\bar{x_{i‥}}-\bar{x_{・・k}}+\bar{\bar{x}}\)
    ・\(e_{ijk}\)=\(x_{ijk}+(\bar{x_{i‥}}+\bar{x_{・j・}}+\bar{x_{・・k}})\)-\((\bar{x_{ij・}}+\bar{x_{・jk}}+\bar{x_{i・k}})\)-\(\bar{\bar{x}}\)

    データの構造式から自由度がわかる

    因子1個ならa-1、因子2個の交互作用なら(a-1)(b-1)、
    因子3個の交互作用なら(a-1)(b-1)(c-1)と暗記していませんか?なぜ自由度がそうなるのか、説明できますか?

    自由度はデータの構造式からすべてわかりますし、自由度から各主効果、交互作用の構造式の形が書けます。

    平均μの自由度は1

    ・μ=\(\bar{\bar{x}}\)
    ですが、平均は1つに決まるので、自由度は1です。

    主効果の自由度はn-1

    ・\(α_i\)=\( \bar{x_{i‥}}-\bar{\bar{x}}\)
    \( \bar{x_{i‥}}\)において、主効果Aの水準はaとすると、自由度はaです。
    \(\bar{\bar{x}}\)は、自由度1の平均です。
    引くので、自由度はa-1となります。

    2因子交互作用の自由度は(n-1)(m-1)

    ・\((αβ)_{ij}\)=\(\bar{x_{ij・}}-\bar{x_{i‥}}-\bar{x_{・j・}}+\bar{\bar{x}}\)
    因子Aはa水準、因子Bはb水準としましょう。
    \(\bar{x_{ij・}}\):自由度ab
    \(\bar{x_{i‥}}\): 自由度a
    \(\bar{x_{・j・}}\): 自由度b
    \(\bar{\bar{x}}\): 自由度1
    まとめると、自由度はab-a-b+1=(a-1)(b-1)です。

    多因子交互作用や、複数の項を加算した誤差の自由度もデータ構造式から求めることができます。

    ここまで、読むと次のことも気がつきませんか?

    自由度がわかればデータの構造式も書ける

    2因子交互作用の自由度は(a-1)(b-1)=ab-a-b+1から、
    ・\(αβ_{ij}\)=\(\bar{x_{ij・}}-\bar{x_{i‥}}-\bar{x_{・j・}}+\bar{\bar{x}}\)
    にデータの構造式が書けますよね!

    3因子交互作用の自由度は公式暗記から(a-1)(b-1)(c-1)ですから、展開して
    (a-1)(b-1)(c-1)=abc-ab-ac-bc+a+b+c-1
    \( (αβγ)_{ijk}\)=\( x_{ijk}\)-\(x_{ij・}\)・・・ と書けますよね。

    多因子交互作用や、複数の項を加算した誤差の自由度もデータ構造式から求めることができます。

    では、次の問いを考えてみましょう。本記事を読めば同様に解けるはずです。なお、解説は解説集にありますので、ご覧下さい。

    問:次のデータ構造式において、[ ]にある項を\(x\)を使った式で表現し、その自由度を求めよ。
    (1) \(x_{ijk} =μ+γ_k+α_i+β_j\)+\((αβ)_{ij}+e_{ijk}\) :[\(e_{ijk}\)] (乱塊法)
    (2) \(x_{ijk} =μ+γ_k+α_i+e_{(1)ik}\)+\(β_j+(αβ)_{ij}\)+\(e_{(2)ijk}\) :[\(e_{(2)ijk}\)] (乱塊法+分割法)

    まとめ

    教科書ではあまりスポットライトが当たらない、データの構造式ですが、データの構造式だけで実験計画法がほぼわかることを解説しました。

    • ➀データの構造式は誤差項を機械的に書き出す
    • ②乱塊法、分割法はデータの構造式の誤差項を書き換えただけ
    • ③データの構造式の項から自由度がわかる

  • 【簡単】実験計画法とは何かがすぐわかる【初心者向け】

    【簡単】実験計画法とは何かがすぐわかる【初心者向け】

    「実験計画法が何をやっているのかがわからない」、「実験計画法や分散分析の計算が難しい」など、実験計画法が理解できずにいろいろ困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    【簡単】実験計画法とは何かがすぐわかる【初心者向け】

    最初に理解してほしい実験計画法

    • ➀実験計画法はデータを平均と誤差に分離する
    • ②実験計画法は計画の良し悪しを平方和から評価する
    • ③高校数学だけで実験計画法はできる
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】実験計画法問題集を販売します!

    QC検定®1級合格したい方におススメです。
    QC検定®1級、過去全回分の問題と実験計画法参考書を研究して、作り上げたオリジナル良問30題を1500円で提供します。ぜひご購入、学習して合格しましょう。

    究める!実験計画法 演習問題を販売します!

    実験計画法を究めた方におススメです。
    実験計画法をマスターしたい方に、必須な演習問題集(2500円)を作成しました。しっかり勉強して究めましょう。

    実験計画法を勉強始めたばかりで、よくわからないことが多いですね。
    初心者の方がつまづきやすいポイントを関連記事にまとめています。

    ★実験計画法のまとめトップページ。初心者から究めたい方までどうぞ!

    ★実験計画法のフィッシャーの3原則がなぜ必要なのかがすぐわかるページ

    ★実験計画法はなんで分散分析するのか?、帰無仮説・対立仮説は何かが分かるように解説したページ。

    ★実験計画法のプーリングって何?がわかるページ

    ★実験計画法の交絡がわかるページ

    ●You tubeにも解説しています。ご確認ください。(前編)

    QC模試受験しよう!

    QC模試で、腕試ししましょう!
    QC模試(品質技量の腕試し&QC検定®対策)
    品質技量の実力を試したい! QC検定®合格対策に活用したい! 1,000円で提供します! 公式、暗記で終わらず、自分のものにできているかを試すオリジナル試験問題です!

    品質力が鍛えられる「QC塾」を是非ご利用ください。

    品質のリーダーを育成する「QC塾」
    ブログでは、品質の勉強、実務、QC検定®に役立つ情報をアップして 「わかる」価値を提供していますが、「わかる」を「できる」に変える トレーニング塾「QC塾」を是非ご利用ください。 難解な品質が、すっきりわかり、指導できるレベルまで上達できます!

    ●商標使用について、
    ①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
    ➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
    ➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。

    さっそく見ていきましょう。

    [themoneytizer id=”105233-2″]

    ➀実験計画法はデータを平均と誤差に分離する

    実験計画法のポイント2つだけ

    (A)データを平均と誤差に分離する。
    (B)誤差を要因ごとに分解し、誤差の大きさを比較する。

    実験計画法は上の(A)(B)の2つだけしかやりません。とてもシンプルです。 

    事例をあげます。

    8個のデータがあります。このデータはどれも2水準な3つの要因A,B,Cと誤差Eから成り立っています。
    データ: 17,16,15,14,9,6,3,0
    個々のデータの値の違いはどの要因が影響しているかを考えましょう。

    実験計画法の基本となる考え方を解説します。上の事例は次の2つに分解します。
    (A)データを平均と誤差に分離する。
    (B)誤差を要因ごとに分解し、誤差の大きさを比較する。

    (A)の平均値は、要因と誤差に影響しない全データがもつ共通の値です。平均値からは要因と誤差の影響の強さは求めることはできません。平均値は先に取り出します。

    次に(B)を考えます。
    (B)の要素、誤差の組み合わせをすべて書き出しましょう。
    三元配置実験で効果をプーリングするなどは考えません。まずは、全部の組み合わせを書き出してください

    ・Aだけ
    ・Bだけ
    ・Cだけ
    ・AとBの組み合わせ
    ・AとCの組み合わせ
    ・BとCの組み合わせ
    ・AとBとCの組み合わせ
    ・Eだけ
    機械的に8通りの分けることができますね。

    実験計画法はまず、平均と誤差に分離すること

    多くの実験計画法の本が、一元配置実験、二元配置実験(繰返し無し&繰返し有り)、多元配置実験、直交表、乱塊法、分割法と進みます。でも個別の手法ごとに理解しても実験計画法が何をやるものかは、理解できません。

    そこで、本記事は手法や因子の数に気にせず、実験計画法はまず、平均と誤差に分離することから始まることを解説します。

    上の事例では、平均と7つの要因と1つの誤差に分けました。これを式に書いてみましょう。

    \(x_{ijk} =μ+α_i+β_j+γ_k\)+\((αβ)_{ij}+(αγ)_{ik}+(βγ)_{jk}\)+\((αβγ)_{ijk}+e_{ijk}\)
    と書けます。これは実験計画法でよく見るデータの構造式ですね。平均をμ,A→α,B→β,C→γ,添え字をそれぞれi,j,k(i,j,k=1,2)と付けました。データの構造式はいったん全パターンを書き出しましょう。

    なお、データの構造式において各項の値の算出方法は、ここを見てください。各項の値とその値から平方和を導出する過程を紹介します。

    \(x_{ijk} =μ+α_i+β_j+γ_k\)+\((αβ)_{ij}+(αγ)_{ik}+(βγ)_{jk}\)+\((αβγ)_{ijk}+e_{ijk}\)
    は平方和を使うと、
    \( S_T=S_A+S_B+S_C\)+\(S_{AB}+S_{AC}+S_{BC}\)+\(S_{ABC}+S_e\)
    が成り立ち、分散分析ができる流れとなります。

    多元配置実験でも平均と誤差全パターンに分解

    上は3要因である三元配置実験を例に取り上げました。では四元配置実験、五元配置実験とどんどん要因が増えたらどうしますか? 慌てずに、データの構造式はいったん全パターンを書き出しましょう。

    四元配置実験なら、平均μ、誤差15種類になります。五元配置実験なら平均μ、誤差は31種類あります。

    ②実験計画法は計画の良し悪しを平方和から評価する

    実験計画法から何が分かるのか?

    計画の良し悪しがわかるだけ
    ●重回帰分析のようなデータ分析手法ではない。

    実験の計画を評価するだけの実験計画法がなぜ、今も学んでいるのでしょうか?
    実験計画法を習得するメリットは何でしょうか?

    実験計画法を習得するメリット

    ●計画の良し悪しがわかれば筋のよい実験・分析ができる
    ●平方和の計算だけで、良い実験が設計できる。
    ●AIのような大型計算機は不要で、最小限のデータで考える。

    大型計算機で力技に解析する方法と、人間が頭で考えて分析する方法があり、
    実験計画法は後者を手助けする手法です。

    ③高校数学だけで実験計画法はできる

    実験計画法は誰でも使えます!

    ●高校数学でほぼできる
    ●多項式、二項定理、数列の展開と高2レベルの数学で十分
    ●難しい数学はF分布の関数だけ。これは数学者に任せたらいい

    大学入試に出てもよい内容です。大学以上のカリキュラムになっているから、実験計画法は難しいと思われます。高校数学の微積分の方が難しいです。

    実験計画法マスターに必要な数学3問

    3問紹介しますが、今は解けなくてもOKです。
    必要な高校数学がどれかを眺めるだけで十分です。
    関連記事をたくさん眺めると、徐々にこう解けばできる!
    感触が体感できます。
    問1 次の式を証明せよ。
    abc-1=(a-1)+(b-1)+(c-1)+(ab-1)+(ac-1)+(bc-1)+(a-1)(b-1)(c-1)

    関連記事に導出方法を詳細に解説しています。

    問2 三元配置実験において取り出せる誤差の種類は8種類である。一般にn元配置実験において、取り出せる誤差の種類は\(2^n-1\)になる。この理由を説明せよ。

    関連記事に導出方法を詳細に解説しています。

    問3 一元配置実験のデータの構造式を定義する。
    \( (x_{ij}-\bar{\bar{x}})\)=\((\bar{x_{i・}}-\bar{\bar{x}})\)+\((x_{ij}-\bar{x_{i・}})\)
    このとき、
    \(\sum^{a}_{i=1}\sum^{b}_{j=1}(\bar{x_{i・}}-\bar{\bar{x}})\)\((x_{ij}-\bar{x_{i・}})\)=0を示せ。

    関連記事に導出方法を詳細に解説しています。

    問1は多項式の展開、問2は二項定理、問3は数列です。

    問1は自由度の計算、問2は直交表の配列数、問3は分散分析の期待値導出に必要な高校数学です。

    詳細な解説は解説集で確認ください。

    【まとめ9】実験計画法を究める演習問題集を販売します
    実験計画法をマスターしたい方に、必須な演習問題集を作成しました。是非本記事を読んで、勉強しましょう。

    ●You tubeにも解説しています。ご確認ください。(後編)

    まとめ

    実験計画法の入り口をわかりやすく解説しました。本記事で実験計画法の概要を理解して、それぞれの手法を学んで行きましょう。

    • ➀実験計画法はデータを平均と誤差に分離する
    • ②実験計画法は計画の良し悪しを平方和から評価する
    • ③高校数学だけで実験計画法はできる
    実験計画法を勉強始めたばかりで、よくわからないことが多いですね。
    初心者の方がつまづきやすいポイントを関連記事にまとめています。

    ★実験計画法のまとめトップページ。初心者から究めたい方までどうぞ!

    ★実験計画法のフィッシャーの3原則がなぜ必要なのかがすぐわかるページ

    ★実験計画法はなんで分散分析するのか?、帰無仮説・対立仮説は何かが分かるように解説したページ。

    ★実験計画法のプーリングって何?がわかるページ

    ★実験計画法の交絡がわかるページ

  • 【簡単】F分布がすぐ使いこなせる【初心者向け】

    【簡単】F分布がすぐ使いこなせる【初心者向け】

    本記事のテーマ

    【簡単】F分布がすぐ使いこなせる【初心者向け】
    「F分布を使った検定方法がよくわからない」、「F分布とt分布・χ2乗分布・正規分布の関係がよくわからない」、「F分布表の注意点がわからない」など、実際に分散比の検定や分散分析を計算するときにいろいろ困っていませんか?

    こういう疑問に答えます。

    • ➀F分布の導出がわかる
    • ②F分布とt分布・χ2乗分布・正規分布の関係
    • ③F分布表の注意点

    さっそく見ていきましょう。

    ➀F分布の導出がわかる

    F分布の導出のポイント

    詳細は、をご覧下さい。まとめると次の3点ですね。

    (A) F分布は2つのχ2乗分布の比。
    (B)F分布のχ2乗分布の比なので。確率密度関数はx≧0のみ。

    ②F分布とt分布・χ2乗分布・正規分布の関係

    Xが自由度tのt分布に従うなら、\(X^2\)は自由度(1,n)のF分布に従う

    F分布とt分布・χ2乗分布・正規分布と4つの分布関数の関係を使って確かめてみましょう。

    ● Z: 正規分布に従う
    ●X: 自由度nのt分布に従う
    ●\(Y^2\)/n: 自由度nのχ2乗分布に従う

    と定義します。

    t分布は
    t分布 = 正規分布 / \( \sqrt{χ2乗分布}\)
    ですね。X,Y,Z,nを代入します。
    \( X=\frac{Z}{1}\)/\({\sqrt{\frac{Y^2}{n}}}\)

    両辺を2乗します。
    \( X^2 = \frac{Z^2}{1}\)/\(\frac{Y^2}{n}\)

     右辺は\(\frac{Z^2}{1}\)と\(\frac{Y^2}{n}\)の比、つまり
    自由度1のχ2乗分布\(Z^2\)と、
    自由度nのχ2乗分布\(Y^2\)の比
    ですから、
    これが自由度(1,n)のF分布に従うことを意味しています。

    \(X^2\)は自由度(1,n)のF分布に従います。

    まとめると、

    t分布 = 正規分布 / \(\sqrt{χ2乗分布}\)
    を2乗すると
    (1,n)F分布 =(自由度1のχ2乗分布)/(自由度nのχ2乗分布)

    となることが言えます。

    ③F分布表の注意点

    自由度(m,n)はどちらを先頭にするか?

    自由度の順番

    比較する対象を前に、比較される対象が後ろにします。
    順番が逆になるとF値は逆数になります。

    例題を見ましょう。

    A,Bにおいて
    (1)Aの分散について調べたいとき: F(\(φ_A,φ_B,α\))とします。
    (1) Bの分散について調べたいとき: F(\(φ_B,φ_A,α\))とします。
    F(\(φ_A,φ_B,α\))=\(\frac{1}{F(φ_A,φ_B,α)}\)

    自由度の順番が変わるとF値が逆数になる理由

    (1,n)F分布 =(自由度1のχ2乗分布)/(自由度nのχ2乗分布)
    を拡張します。つまり、
    \( X^2 = \frac{Z^2}{1}\)/\(\frac{Y^2}{n}\)

    \( X^2(m,n)= \frac{Z^2}{m}\)/\(\frac{Y^2}{n}\)
    とします。両辺を逆数にします。
    \( X’^2(n,m)= \frac{1}{ X^2(m,n)}\)=\(\frac{Y^2}{n}\)/\(\frac{Z^2}{m}\)
    より、自由度が入れ替わるとF値が逆数に変わりますね。

    分散分析して、F値が予定より乖離がある場合は、自由度が入れ替わっている可能性があることがわかります。

    直交表を使った実験計画法での注意点

    F分布において、自由度1の場合、F値が大きすぎる。
    分散分析結果で自由度1のF値をそのまま使って良いかよく考える必要がある。

    F表を見ましょう。自由度がφ1、φ2ともに1の色枠部を見てください。
    色のない値に比べて、色がついた値は高いですよね。
    特にφ2の自由度1の場合は3桁です。

    F表(α=0.05)
    φ2/φ1 1 2 3 4 5 ・・・
    1 161 200 216 225 230 ・・・
    2 18.5 19 19.2 19.2 19.3 ・・・
    3 10.1 9.55 9.28 9.12 9.01 ・・・
    4 7.71 6.94 6.59 6.39 6.26 ・・・
    5 6.61 5.79 5.41 5.19 5.05 ・・・
    ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・

    直交表の多因子実験で残差の自由度が1の場合は、F値が3桁になるので、ほぼすべての実験が有意でない結果となってしまいます。実際は、F値が高すぎないように、残差の自由度は2または3以上にしています。これも注意点として知っておいてください。

    まとめ

    F分布について実務や試験に活かせるようにわかりやすく解説しました。かなりイメージがついて、検定・推定、分散分析の解法に自信がついたでしょう。

    • ➀F分布の導出がわかる
    • ②F分布とt分布・χ2乗分布・正規分布の関係
    • ③F分布表の注意点
  • 【簡単】t分布がすぐ使いこなせる【初心者向け】

    【簡単】t分布がすぐ使いこなせる【初心者向け】

    本記事のテーマ

    【簡単】t分布がすぐ使いこなせる【初心者向け】
    • ➀t分布の導出がわかる
    • ②t分布表の使い方
    • ③t分布と正規分布の違い
    「t分布を使った検定方法がわからない」、「正規分布とt分布の違いがよくわからない」、「片側検定、両側検定のときのt分布表の見方がわからない」など、実際に計算するときにいろいろ困っていませんか?

    さっそく見ていきましょう。

    ➀t分布の導出がわかる

    t分布の導出の導出のポイント

    詳細は、をご覧下さい。まとめると次の3点ですね。

    (A) t分布は理想的な正規分布に対する現実版。
    (B)正規分布関数×割合/全体からt分布を算出。割合/全体の比にχ2乗分布を活用。
    (C)t分布は分散ではなく、自由度から確率を算出。

    ②t分布表の使い方

    t分布の分布関数をざっくり理解する方がわかりやすい

    t分布表に載っているグラフの関数

    \( f(x)= \frac{Γ(\frac{φ+1}{2})}{\sqrt{φπ}Γ(\frac{φ}{2})}(1+\frac{t^2}{φ})^{-\frac{φ+1}{2}}\)

    よくわからない関数ですが、自由度φとtを代入してf(x)を計算します。手計算は大変なので、エクセルを使って計算します。

    t分布関数をざっくり書くと、
    f(x)= B(φ) \(\frac{1}{(1+t^2)^{C(φ)}}\)
    です。
    関数 \(\frac{1}{1+t^2}\)に自由度φからなる関数B(φ)、C(φ)がくっついてきます。
    関数 \(\frac{1}{1+t^2}\)の区間[-∞,∞]の∫は∞に発散しますが、関数B(φ)、C(φ)がくっついているおかげで有限値になるというイメージです。

    また、t分布の関数形は、
    関数 \(\frac{1}{1+t^2}\)
    なので、y軸に対称になります。
    よって、正規分布と似たグラフになるのが特徴です。

    t分布

    エクセルを使う場合は、
    tと自由度φを用意して、t分布関数を
    「= T.DIST (C6,D3,false)」
    として代入します。C6はtのセル、D3は自由度φのセルです。

    χ2乗分布表の見方

    t分布関数の特徴

    (A)y軸に対称である。
    (B) t分布関数(確率密度関数)は、区間[-∞.∞]で積分すると1。
    (C)正規分布表と同様に確率P/2からt値を読み取る場合は、確率P/2は区間[t,∞]とする。確率PではなくP/2と運用しているので注意。

    片側検定、両側検定の場合のt分布表の見方を図で確認しましょう。

    t分布でよく試験で間違えるところなので、注意しましょう。

    片側検定の場合

    確率P/2=0.05つまり、P=0.1(有意水準)に相当するtを読み取ります。

    t分布

    Φ=10,P=0.1のときは、t分布表からt=1.812とわかります。

    両側検定の場合

    確率 P/2=0.05/2つまり、P=0.05 (有意水準)に相当するtを読み取ります。

    t分布

    Φ=10,P=0.05のときは、t分布表からt=2.228とわかります。

    ③t分布と正規分布の違い

    t分布と正規分布の違い

    数学的には違う分布関数。
    でも、値はほぼ同じなので実務上は同じと考えてもよい。

    試験、資格ではt分布と正規分布は別物として勉強しましょう。
    これはt分布、正規分布をそれぞれ理解しているかを確認するためです。
    一方、実務上は下図のようにデータ数n=10個程度で、
    t分布と正規分布N(0,\(1^2\))は同じグラフですね。

    10個以下のデータ数なら、分析としては不十分なので、
    もっと多くのデータ数を用いて分析しますよね。
    つまり、最初から正規分布と過程しても実務上問題がないと言えます。

    t分布の関数の形が少ない自由度で、
    正規分布に重なるようになっているのが現状
    です。
    私が思うあるべきt分布とは、データ数が100個くらいでも正規分布とずれているが、データ数が10000個以上になってようやく正規分布に接近してくるイメージです。

    t分布

    まとめ

    t分布について実務や試験に活かせるようにわかりやすく解説しました。かなりイメージがついて、検定・推定、分散分析の解法に自信がついたでしょう。

    • ➀t分布の導出がわかる
    • ②t分布表の使い方
    • ③t分布と正規分布の違い
  • 【簡単】χ2乗分布がすぐ使いこなせる【初心者向け】

    【簡単】χ2乗分布がすぐ使いこなせる【初心者向け】

    本記事のテーマ

    【簡単】\(χ^2\)乗分布がすぐ使いこなせる【初心者向け】
    • ➀\(χ^2\)乗分布の導出がわかる
    • ②よく使う\(χ^2\)乗分布関数と標準偏差sの関係
    • ③\(χ^2\)乗分布表の使い方
    「\(χ^2\)乗分布を使った検定方法がわからない」、「標準偏差、平方和と\(χ^2\)乗分布関数の関係がわからない」、「片側検定、両側検定のときの\(χ^2\)乗分布表の見方がわからない」など、実際に計算するときにいろいろ困っていませんか?

    さっそく見ていきましょう。

    ➀\(χ^2\)乗分布の導出がわかる

    \(χ^2\)乗分布の導出のポイント

    【簡単】\(χ^2\)乗分布がすぐ使いこなせる【初心者向け】

    詳細は、をご覧下さい。まとめると次の3点ですね。

    (A) \(χ^2\)乗分布は分散の検定のために正規分布から作られた関数
    (B)難しい式の導出より、(\(χ^2\)乗分布関数)=Σ(正規分布関数)^2で理解
    (C)\( χ^2=\sum_{i} (\frac{x_i-\bar{x}}{σ})^2\)=\(\frac{S(平方和)}{σ^2}\)

    ②よく使う\(χ^2\)乗分布関数と標準偏差sの関係

    よく見かけるので、解説します。

    \(χ^2\)乗分布と平方和S(大文字)との関係

    \( χ^2=\frac{S}{σ^2}\)

    \(χ^2\)乗分布と標準偏差s(小文字)との関係

    \( χ^2=\frac{s^2}{σ^2}(n-1)\)

    これは簡単に導出できます。
    (i)平方和Sと分散(不偏分散)Vの関係は
    \( V=\frac{S}{n-1}\)

    ですね。
    (ii)分散Vと標準偏差sの関係は
    \( V=s^2\)
    ですね。よって、
    \(S=V(n-1)=s^2(n-1)\)
    になります。

    まとめると、
    ●\(χ^2=\frac{S}{σ^2}\)
    ●\(χ^2=\frac{ s^2(n-1)}{σ^2}\)
    ●\(χ^2=\frac{s^2}{σ^2}(n-1)\)
    ●\(χ^2=(\frac{s}{σ})^2(n-1)\)

    標準偏差sと母分散σの比とデータ数nから\(χ^2\)を算出する場合
    \(χ^2\)と標準偏差sから母分散\(σ^2\)を推定することがよくあります。

    ③\(χ^2\)乗分布表の使い方

    片側検定、両側検定において、\(χ^2\)乗分布表の見方を確認しましょう。

    いろいろな自由度のχ2乗分布

    \(χ^2\)乗分布表に載っているグラフの関数

    \( f(x)= \frac{1}{2^{\frac{k}{2}}}\)\(Γ(\frac{k}{2}) \)\(x^{\frac{k}{2}-1}\)\(e^{\frac{x}{2}} \)

    よくわからない関数ですが、自由度kとx(χ2)を代入してf(x)を計算します。手計算は大変なので、エクセルを使って計算します。

    χ2乗分布

    エクセルを使う場合は、
    xと自由度φを用意して、\(χ^2\)乗分布関数を
    「=CHISQ.DIST(C6,D3,false)」
    として代入します。C6はxのセル、D3は自由度φのセルです。

    χ2乗分布表の見方

    \(χ^2\)乗分布関数の特徴

    (A)χ2乗なので、\(χ^2\)乗分布関数にx<0の範囲は無い。
    (B) \(χ^2\)乗分布関数(確率密度関数)は、区間[0.∞]で積分すると1。
    (C)正規分布表と同様に確率Pから\(χ^2\)値を読み取る場合は、確率Pは区間[\(χ^2\),∞]とする。

    片側検定、両側検定の場合の\(χ^2\)乗分布表の見方を図で確認しましょう。

    片側検定の場合

    確率P=0.05(有意水準)に相当する\(χ^2\)を読み取ります。

    χ2乗分布

    自由度φ=8の場合P=0.05に相当する\(χ^2\)は15.51になります。

    両側検定の場合

    母分散の推定区間を求めるために、両側検定をよく使います。

    両側検定の場合は、有意水準が0.05のとき、P=0.025とP=0.975に相当する\(χ^2\)を読み取ります。

    χ2乗分布

    χ2乗分布

    ここで注意なのは、P=0.025の\(χ^2\)値方がP=0.975の\(χ^2\)値より大きいことです。

    まとめ

    \(χ^2\)乗分布について、実務や試験に活かせるようにわかりやすく解説しました。かなりイメージがついて、検定・推定、分散分析の解法に自信がついたでしょう。

    • ➀\(χ^2\)乗分布の導出がわかる
    • ②よく使う\(χ^2\)乗分布関数と標準偏差sの関係
    • ③\(χ^2\)乗分布表の使い方
  • 【簡単】χ2乗分布とt分布とF分布がすぐわかる【初心者向け】

    【簡単】χ2乗分布とt分布とF分布がすぐわかる【初心者向け】

    本記事のテーマ

    【簡単】χ2乗分布とt分布とF分布の関係がわかる【初心者向け】
    「χ2乗分布とt分布とF分布の式は複雑でわからない」、「χ2乗分布とt分布とF分布の関係がわからない」、「解き方は暗記したけど本質がわからない」など、分布の特性や利用目的を理解しないまま、検定や推定、分散分析していませんか?

    こういう疑問に答えます。

    • ➀χ2乗分布→t分布→F分布の順で学ぶ
    • ②分布関数は導出イメージが理解できる
    • ③正規分布、χ2乗分布、t分布とF分布の関係

    さっそく見ていきましょう。

    ➀χ2乗分布→t分布→F分布の順で学ぶ

    教科書あるある

    正規分布→t分布→χ2乗分布→F分布

    教科書は、母平均の検定に使う正規分布とt分布を先に、分散の検定に使うχ2乗分布とF分布を後に紹介します。
    確かに、この順番でもOKですが、
    本記事はt分布よりχ2乗分布を先に解説します。

    本記事

    正規分布→χ2乗分布→t分布→F分布

    ②分布関数は導出イメージが理解できる

    それぞれの分布関数の使い方は個別の記事で紹介しますが、全体像を本記事で理解してください。
    ・正規分布
    ・χ2乗分布
    ・t分布
    ・F分布

    χ2乗分布は分散の検定のために作られた関数

    χ2乗分布の定義を見ましょう。

    N個の確率変数\(X_1\)、…、\(X_n\)が互いに独立に同一の平均μ、分散\(σ^2\)の正規分布に従う。このとき統計量
    \(χ^2=\frac{(X_1-\bar{X})^2+(X_2-\bar{X})^2+…+(X_n-\bar{X})^2}{σ^2}\)
    は、自由度N-1のχ2乗分布になる。

    正しいですが、わかりませんよね。簡単にわかるよう解説します。

    統計量の最重要な確認事項

    基本中の基本ですが、データ分析は、
    平均
    ・ばらつき

    しか使いません。まず、これだけ理解してください。

    ●平均を扱うのが、正規分布、t分布です。
    ●母集合の母分散が既知で理想的な分布な正規分布
    ●母集合の母分散が未知で現実的な分布なt分布
    と、平均を扱う分布は2種類あります。

    次にばらつき(分散)用の分布も必要になりますね。

    χ2乗分布は分散の検定のために作られた関数で
    正規分布から出発します。

    平均\(\bar{x}\)、分散\(σ^2\)の正規分布に従う変数\(x_i\)の分散を考えます。
    まず、変数\(x_i\)を標準化します。標準化についてはここを見てください。
    \( \frac{x_i-\bar{x}}{σ}\)
    そして、この2乗和が平方和であり、分散を考えるχ2乗分布関数の基本形になります。

    χ2乗分布関数

    \( Z=\sum_{i} (\frac{x_i-\bar{x}}{σ})^2\)
    関数のイメージ:(χ2乗分布関数)=Σ(正規分布関数)^2

    (χ2乗分布関数)
    \( f(x)= \frac{1}{2^{\frac{k}{2}}}\)\(Γ(\frac{k}{2}) \)\(x^{\frac{k}{2}-1}\)\(e^{\frac{x}{2}} \) (A)
    (正規分布関数)
    \( f(x)=\frac{1}{\sqrt{2π}}exp(-\frac{x^2}{2}) \)(B)
    と超難解な式です。ですが、
    (A)=Σ(B)^2で計算できる
    の理解で十分です。あとの難解な計算や式は、数学者にお願いしましょう。

    実務で統計学を早く理解するポイント

    ・難解な式を厳密に解くより、「何をやっている式なのか」をざっくりでよいので早く理解する!
    ・数学的な正しさより、相手にわかりやすい説明ができることが重要!

    χ2乗分布関数は、ざっくり書くと
    \( Z=\sum_{i} (\frac{x_i-\bar{x}}{σ})^2\)
    ですね。よく見ると、
    \(\sum_{i} (x_i-\bar{x})^2\)
    は平方和Sですよね。
    つまり、
    $$ χ^2 = \frac{S}{σ^2} $$
    の関係があります。よく教科書にありますが、本記事を読めば、暗記する必要はありません。

    χ2乗分布のさらなる特徴については、χ2乗分布を読んでください。

    t分布は正規分布の一部を取り出した分布

    t分布の定義を見ましょう。

    2つの確率変数X,Yが独立で、Yが自由度nのχ2乗分布、Zが正規分布N(0,\(1^2\))に従うとき、
    \(X=\frac{Z}{\sqrt{Y/n}}\)
    は自由度n-1のt分布に従う。

    正しいですが、全然意味がわからないですね。簡単にわかるよう解説します。

    本記事で先に、χ2乗分布関数を説明した理由は、
    t分布の導出にχ2乗分布関数が必要だからです。

    平均を扱うのが、正規分布、t分布です。
    母集合の母分散が既知で理想的な分布な正規分布
    母集合の母分散が未知で現実的な分布なt分布

    ですね。

    正規分布は、理想・全体、無限のイメージですが、
    t分布は、現実・一部・有限のイメージがあります。

    t分布のイメージ

    ・正規分布 × 一部/全体 = t分布
    ・一部/全体についてはχ2乗分布関数を使う。
    ・正規分布、t分布は平均\(x\)、χ2乗分布は分散\(x^2\)なため、χ2乗分布の平方根を使う
    t分布 X = 正規分布 Z / √ χ2乗分布Y になっていますね!

    正規分布はσを、t分布はσではなく自由度nを使う理由

    t分布 X = 正規分布 Z / √χ2乗分布Y
    をよく見ると、
    正規分布 Z のσ/√χ2乗分布(σ^2/n)
    → σ/√(σ^2/n)=nとざっくり計算できますね。
    σ→nに変わっていますよね。これが、
    正規分布はσを、t分布はσではなく自由度nを使う
    わかりやすい理由です。

    数学的な証明ではないため、厳密さは欠けますが、
    慣れないうちはこの程度の説明で十分です。

    私がわかりやすい説明を考え抜いた結果、この説明にたどり着きました。

    t分布のさらなる特徴については、t分布を読んでください。

    F分布は分散比の検定のために作られた関数

    F分布の定義を見ましょう。

    2つの独立な確率変数Y,Zがあり、確率変数Yは自由度mのχ2乗分布、確率変数Zは自由度nのχ2乗分布に従うとき、
    \( X=\frac{\frac{Y}{m}}{\frac{Z}{n}}\)
    は自由度(m,n)のF分布に従う。

    正しいですが、わかりにくいですね。簡単にわかるよう解説します。

    F分布の目的

    ・分散比の検定が欲しいからF分布ができた。
    ・分散比だから、χ2乗分布関数の比になる。
    ・F分布によって、分散分析ができる。

    分散比だから、χ2乗分布関数の比になるわけですから、
    F分布関数= χ2乗分布関数1/ χ2乗分布関数2

    となりますよね。
    χ2乗分布関数1 と χ2乗分布関数2は自由度が異なるため、
    F分布は両方の自由度が必要
    となるのも理解できますね。

    F分布はこれだけわかれば十分です。

    F分布のさらなる特徴については、F分布を読んでください。

    ③正規分布、χ2乗分布、t分布とF分布の関係

    4つの分布関数の関係をざっくり書くと下の図のようになります。まずはこれだけわかれば十分実務に活かせます。

    分布関数

    それぞれの関係と、利用目的が理解しやすいですね。活用できる良いイメージ図です。

    なお、厳密に書くと下図になります。でも、わかりにくいですね。

    分布関数

    まとめ

    正規分布、χ2乗分布、t分布、F分布の順で、実務や試験に活かせるようにわかりやすく解説しました。かなりイメージがついて、検定・推定、分散分析の解法に自信がついたでしょう。

    • ➀χ2乗分布→t分布→F分布の順で学ぶ
    • 分布関数は導出イメージが理解できる
    • ③正規分布、χ2乗分布、t分布とF分布の関係
  • 【簡単】わかりやすく理解できるポアソン分布

    【簡単】わかりやすく理解できるポアソン分布

    本記事のテーマ

    【簡単】わかりやすくできるポアソン分布【初心者向け】
    「ポアソン分布の式がわからない」、 「ポアソン分布を使い方がイメージできない」などとポアソン分布は、二項分布や正規分布よりわかりくいですよね。
    • ➀ポアソン分布の式の覚え方
    • ②ポアソン分布のわかりやすい導出
    • ③ポアソン分布の活用例
    • ④ポアソン分布の式を理解する
    • ⑤ポアソンの期待値と分散の導出

    本記事を読んでいるあなたは、平方和、確率分布関数など統計学の基礎をマスターしたいはずです。理解度アップのための必須な関連記事がありますので、関連記事も読んでください。

    ★統計学で最初に悩む関門! 平方和が簡単にマスターできるページ

    確率分布関数の作り方や確率・期待値を積分で計算する理由が簡単にわかるページ

    ★品質管理・統計に頻出な分布関数をわかりやすく解説したページ



    さっそく見ていきましょう。

    ●You tube動画もご覧下さい

    ➀ポアソン分布の式の覚え方

    ポアソン分布の関数

    $$ f(x)= e^{-λ}\frac{λ^x}{x!} $$

    見た瞬間、「何じゃこりゃ?」ですね。
    \( e^{-λ}\)と\(λ^x \)と\( x!\)とややこしい項ばかりですね。
    式見てもグラフのイメージがつきません。
    どうやってこの式ができたのか?イメージつきません
    あなただけではありません。みんなイメージできません。

    ポアソン分布の関数の覚え方

    この式は何回使っても忘れます。忘れにくい方法があります

    • (A)\( e^{-λ}\)と\(λ^x \)と\( x!\)の書く順番を決める
    • (B)変数が変わったときに要注意
    • (C)覚え方

    (A)\( e^{-λ}\)と\(λ^x \)と\( x!\)の書く順番を決める

    \( e^{-λ}\)→\(λ^x \)→\( x!\)としましょう。入れ替わると私も式がわからなくなります。

    (B)変数が変わったときに要注意

    本記事では、λ、xとしています。教科書によってはλ→m,x→kに変えていることがあります。要注意です。

    (C)覚え方

    下図のように、λ,xの変数を一箇所に集めれば、間違いなく公式暗記できます。

    ポアソン分布1

    ②ポアソン分布のわかりやすい導出

    ポアソン分布の導出は、基本わかりにくいです。
    2つ導出方法があります。概要を解説します。詳細はここを参照ください。

    (A)二項分布の式で個数nをn→∞に発散させるとポアソン分布の式になる。
    (B) モデルから方程式を立てて導出する。

    (A)はいろいろな教科書やwebサイトでも紹介されています。
    メリットは、計算過程がわかりやすいことです。
    デメリットは、二項分布の極限がポアソン分布となり、分布の極限って何?と疑問に残ることです。

    ●二項分布からポアソン分布を導出します。
    二項分布
    P(X=k)=\( {}_nC_kp^k(1-p)^{n-k}\)
    ここで、p=\(\frac{λ}{n}\)を代入します。
    =\( {}_nC_k(\frac{λ}{n})^k(1-\frac{λ}{n})^{n-k}\)
    =\( \frac{n(n-1)…(n-k+1)}{k!} (\frac{λ}{n})^k (1-\frac{λ}{n})^n (1-\frac{λ}{n})^{-k}\)
    =\(\frac{λ^k}{k!}\)\(\frac{n(n-1)…(n-k+1)}{n・n…n}\)\((1-\frac{λ}{n})^{\frac{n}{λ}}\)\((1-\frac{λ}{n})^{-k}\)
    n→∞に持っていくと
    → \(\frac{λ^k}{k!}・1・e^{-λ}\)=\(e^{-λ}\frac{λ^k}{k!}\)
    となり、ポアソン分布型に変形できました。
    でも、難しいですね。よく二項分布の極限値がポアソン分布だと気がつきますよね。

    一方、(B)はレアです。
    メリットは、モデルから方程式を立てて導出するので納得感がある。
    デメリットは、計算過程が難しいことです。

    本記事では(B)のレア版を解説します。詳細解説を見る前に概要を理解しましょう。何をやっているのかを先に理解してください。

    ポアソン分布の導出

    ●時刻0から時刻tまでに事象がn回起こる確率をPn(t)とします。
    ●時刻tから微小時間Δに事象が1回起こる確率λΔとおきます。
    ●時刻0から時刻t+Δまでに事象がn回起こる確率をPn(t+Δ)は、➀②の和になります。
    ●➀時刻tまで事象がn-1回で、時刻t以降1回発生する確率 Pn-1(t)(λΔ)
    ●②時刻tまで事象がn回で、時刻t以降0回発生する確率Pn(t)(1-λΔ)
    Pn(t+Δ)= Pn-1(t)(λΔ)+ Pn(t)(1-λΔ)
    と微分方程式が立てられます

    式の各項を説明しましたが、一読では「何を言っているのかわからない」と思います。数回読むと慣れてきます。この方程式がポアソン分布のモデル式です。

    Pn(t+Δ)= Pn-1(t)(λΔ)+ Pn(t)(1-λΔ)
    を解けばPn(t)の関数形が得られます。

    変形すると
    (Pn(t+Δ)-Pn(t))/Δ=λ(-Pn(t)+Pn-1(t))
    Δ→0にすると微分になりますから
    \( \frac{d}{dt} Pn(t)\)= λ(-Pn(t)+Pn-1(t))
    これを満たすPn(t)は
    Pn(t)= \(e^{-λt}\frac{{λt}^n}{n!}\)
    となり、ポアソン分布の関数になります。

    (A)の二項分布の極限よりは、(B)のモデル式から導出する方が納得感はあります。ポアソン分布は難しいため、わかりやすく解説しても、この難しさです。

    ③ポアソン分布の活用例

    具体例を見てみましょう。なお、期待値、分散の導出も重要ですが、詳細解説で説明するとして、ここでは、ポアソン分布を具体的な値を使って慣れる練習をしましょう。

    二項分布とポアソン分布の比較

    故障率1/20の部品から10個を抜き出す。故障した部品の数がxである確率を二項分布とポアソン分布でそれぞれ求めよ。

    二項分布とポアソン分布は別物ですが、
    割合の場合は二項分布、
    個数の場合はポアソン分布、
    を扱うだけで、上の問いはどちらの分布でも計算ができます。

    ●二項分布の場合
    \( P_x={}_nC_x p^r (1-p)^{n-x}\)
    =\(_{10}C_x (\frac{1}{20})^x (1-\frac{1}{20})^{10-x}\)

    ●ポアソン分布の場合
    \(P_x= e^{-λ}\frac{λ^x}{x!}\)
    =\( e^{-\frac{1}{20}}\)\(\frac{(\frac{1}{20})^x}{x!}\)

    エクセルで計算した結果と、両者の結果を比較します。xが小さいとほぼ値は等しいですが、徐々に値がずれていくのがわかります。

    ポアソン分布2

    ポアソン分布の正規分布近似

    全数200個で不良数が20個のサンプルがある。そこから、抜取り数を➀10②20③40④
    50⑤100とした場合、不良数がxである確率をPxとする。xとPxの関係をグラフにせよ。

    不良個数と来たら、ポアソン分布の公式を書きましょう。
    \(P_x= e^{-λ}\frac{λ^x}{x!}\)
    λが必要になります。
    λは不良数×抜取数÷全数とします。
    λ:➀1②2③4④5⑤10となります。グラフは次のようになります。

    ポアソン分布3

    ポアソン分布は、λが高くなるにつれて正規分布に近似できます。
    二項分布もポアソン分布も最初から正規分布で計算してもそれほど結果は変わらないということになりますが、試験では各々の分布に関する問題が出ますので勉強しましょう。実務は正規分布で良いでしょうね。

    ④ポアソン分布の式を理解する

    ポアソン分布の基本を復習

    ①②③と解説しました。再度重要なポイントを確認しましょう。

    \(e^{-λ} \frac{λ^x}{x!}\)という変な式を実際に変形するなどして、触ってみましょう。習うより慣れよ!です。1つ例題を出します。

    【問1】
    ポアソン分布 \(f(x)\)= \(e^{-λ} \frac{λ^x}{x!}\) (\(x\)は自然数)について、
    \(\sum_{x=0}^{∞} f(x)\)=1 を示せ。

    解法

    どうでしょうか?一見難しそうですが、 式を難しくしている\(\sum_{x=0}^{∞} \frac{λ^x}{x!}\)が意外な値になります。テイラー展開を思い出すと

    \(e^x\)=1+\(x\)+\(\frac{x^2}{2!}\)+ \(\frac{x^3}{3!}\)+…
    をまとめると、
    \(e^x\)=\(\sum_{x=0}^{∞} \frac{λ^x}{x!}\)

    この式を問題文の式に代入すると
    \(\sum_{x=0}^{∞} f(x)\)
    =\( e^{-λ} \sum_{x=0}^{∞} \frac{λ^x}{x!}\)
    =\( e^{-λ} e^λ \)
    =1

    となりますね。扱いにくい\(\frac{λ^x}{x!}\)が少し身近に感じていただける例題で確認しました。

    ポアソン分布の式は複雑で、変形して使う場合が少ないので理解が難しい式となってしまいますね。

    ⑤ポアソンの期待値と分散の導出

    問題

    【問2】
    ポアソン分布 \(f(x)\)= \(e^{-λ} \frac{λ^x}{x!}\) (\(x\)は自然数)について、
    (1) 期待値E[X]
    (2) 分散V[X]を求めよ。

    ポアソン分布の期待値E、分散Vも共にλになります。式が複雑なわりに期待値と分散は分布関数の中で最もシンプルになるので、不思議です。

    期待値

    (1)を解きます。

    期待値E[X]≡xf(x)という意識で式を作ります。
    E[X]= \(\sum_{k=0}^{∞}\)\(k\) ×\(\frac{λ^k}{k!} e^{-λ}\)
    と式を書いて、変形していきます。

    E[X]= \(\sum_{k=0}^{∞} k\frac{λ^k}{k!} e^{-λ}\)
    (k=0の場合、\( 0 \frac{λ^0}{0!} e^{-λ}\)=0より、)
    = \(\sum_{k=1}^{∞} k\frac{λ^k}{k!} e^{-λ}\)
    = \( λe^{-λ} \sum_{k=1}^{∞} \frac{λ^{k-1}}{(k-1)!} \)
    (\(\frac{λ^{k-1}}{(k-1)!} e^{-λ}\)をセットで考えると)
    = \( λe^{-λ} e^{-λ}\)

    となります。

    【問1】(さっきの例題)
    ポアソン分布 \(f(x)\)= \(e^{-λ} \frac{λ^x}{x!}\) (\(x\)は自然数)について、
    \(\sum_{x=0}^{∞} f(x)\)=1 を示せ。
    はさくっと解けるようになったはずです。

    分散

    (2)を解きます。ここで、テクニックですが、
    E[X2]ではなく、E[X(X-1)]を求めます。

    期待値E[X(X-1)]≡x(x-1)f(x)という意識で式を作ります。
    E[X(X-1)]= \(\sum_{k=0}^{∞}\)\(k(k-1)\) ×\(\frac{λ^k}{k!} e^{-λ}\)
    と式を書いて、変形していきます。

    E[X(X-1)]= \(\sum_{k=0}^{∞} k(k-1) \frac{λ^k}{k!} e^{-λ}\)
    (k=0,1の場合、\( k(k-1) \frac{λ^k}{k!} e^{-λ}\)=0より)
    = \(\sum_{k=2}^{∞} k(k-1) \frac{λ^k}{k!} e^{-λ}\)
    =\( e^{-λ} λ^2 \sum_{k=2}^{∞} \frac{λ^{k-2}}{(k-2)!} \)
    =\( e^{-λ} λ^2 e^λ \)
    (\(\frac{λ^{k-2}}{(k-2)!} e^{-λ}\)をセットで考えると)
    =\(λ^2\)

    ここで、
    V[X]=E[X(X-1)]+E[X]-E[X]2
    =\(λ^2\)+\(λ\)-\(λ^2\)
    =\(λ\)
    となります。

    少しずつでいいので、ポアソン分布に慣れましょう。

    ポアソン分布は、二項定理、指数分布から変形して解けるので、他の分布関数と関連づけながら身につけましょう。すべてQCプラネッツの記事で解説しています!

    まとめ

    苦手意識が強い、ポアソン分布についてわかりやすく解説しました。

    • ➀ポアソン分布の式の覚え方
    • ②ポアソン分布のわかりやすい導出
    • ③ポアソン分布の活用例
    • ④ポアソン分布の式を理解する
    • ⑤ポアソンの期待値と分散の導出
  • error: Content is protected !!