カテゴリー: 手法

  • 重回帰分析のテコ比がよくわかる

    重回帰分析のテコ比がよくわかる

    本記事のテーマ

    重回帰分析のテコ比がよくわかる
    • ①重回帰分析を解く
    • ➁\(β_k\)の導出式を行列表記する
    • ➂ハット行列\(H\)を導出する
    • ➃ハット行列とテコ比を導出する
    • ➄ハット行列とテコ比を実際に計算する
    • ⑥テコ比がわかる

    【QC検定®1級合格】回帰分析問題集を販売します!

    QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。
    ①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用、の5章全41題を演習できる問題集です。

    テコ比、ハット行列を実際に計算するところまで解説するのはQCプラネッツだけ!
    苦手な行列表記も丁寧に解説していきます。
    QCプラネッツも行列は苦手です(笑)

    ①重回帰分析を解く

    データの構造式を作る

    次のようなデータを重回帰分析することを考えます。
    添え字の\(i,j,k\)は
    ●\(i\)=1,2,…,\(n\)
    ●\(j\)=1,2,…,\(p\)
    ●\(k\)=1,2,…,\(p\)
    である点に注意してください。

    データ
    \(i\)⇊ \(j,k\)⇒
    \(x_{1i}\) \(x_{2i}\) \(x_{ji}\) \(x_{pi}\) \(y_i\)
    1 \(x_{11}\) \(x_{21}\) \(x_{j1}\) \(x_{p1}\) \(y_1\)
    2 \(x_{12}\) \(x_{22}\) \(x_{j2}\) \(x_{p2}\) \(y_2\)
    \(i\) \(x_{1i}\) \(x_{2i}\) \(x_{ji}\) \(x_{pi}\) \(y_i\)
    \(n\) \(x_{1n}\) \(x_{2n}\) \(x_{jn}\) \(x_{pn}\) \(y_p\)

    最小二乗法から正規方程式を作る

    上の表をデータの構造式で表現すると、
    \(\hat{y_i}-\bar{y}\)=\(\sum_{k=1}^{p}β_k(x_{ki}-\bar{x_k})\) (式1)
    ですね。添え字の\(i,j,k\)は
    ●\(i\)=1,2,…,\(n\)
    ●\(j\)=1,2,…,\(p\)
    ●\(k\)=1,2,…,\(p\)
    である点に注意してください。

    (式1)を書き出すと、
    \(\hat{y_i}-\bar{y}\)=\(β_1(x_{1i}-\bar{x_1})\)+\(β_2(x_{2i}-\bar{x_2})\)+…+\(β_p(x_{pi}-\bar{x_p})\)
    ですね。

    行列表記は抽象的なので
    なるべく具体的な式を書きながら
    理解していきましょう!

    最小二乗法から正規方程式を作って、回帰直線の傾き\(β_k\)を求める式を作ります。これは、関連記事で詳細に解説しているので、ご確認ください。

    「【まとめ】重回帰分析がよくわかる」記事の中に、プレミアム冊子PDFがあり、そこで詳細に解説しています。ご覧ください。

    回帰直線の傾き\(β_k\)を求める式は

    \(\left(
    \begin{array}{cccc}
    S_{11} & S_{12} & \ldots & S_{1p} \\
    S_{21} & S_{22} & \ldots & S_{2p} \\
    \vdots & \vdots & \ddots & \vdots \\
    S_{p1} & S_{p2} & \ldots & S_{pp}
    \end{array}
    \right)
    \)\(
    \left(
    \begin{array}{c}
    β_1 \\
    β_2 \\
    \vdots \\
    β_p
    \end{array}
    \right)
    \)=\(
    \left(
    \begin{array}{c}
    S_{1y} \\
    S_{2y} \\
    \vdots \\
    S_{py}
    \end{array}
    \right)
    \)

    ですね。Sは各成分の平方和で、逆行列を使って、\(β_i\)の各値を計算します。

    回帰直線の傾き\(β_k\)を導出する式を作る

    回帰直線の傾き\(β_k\)は、次の行列の式から計算できますね。

    \(
    \left(
    \begin{array}{c}
    β_1 \\
    β_2 \\
    \vdots \\
    β_p
    \end{array}
    \right)
    \)=\(\left(
    \begin{array}{cccc}
    S^{11} & S^{12} & \ldots & S^{1p} \\
    S^{21} & S^{22} & \ldots & S^{2p} \\
    \vdots & \vdots & \ddots & \vdots \\
    S^{p1} & S^{p2} & \ldots & S^{pp}
    \end{array}
    \right)
    \)\(
    \left(
    \begin{array}{c}
    S_{1y} \\
    S_{2y} \\
    \vdots \\
    S_{py}
    \end{array}
    \right)
    \)

    となります。

    ここで、\(S^{jk}\)は逆行列のj行k列目の値で、添え字を上側とします。

    さあ、ここからが本記事の本題になります。

    最終的には、行列(太文字で表記)を使って
    \(\hat{y}\)=\(X(X^T X)^{-1} X^T y\)=\(Hy\)
    として、
    \(H\)=\(X(X^T X)^{-1} X^T \)
    とハット行列\(H\)を導出することです。

    行列を使って式変形するのは、理解が難しいので、なるべく具体的な式を書きながらわかりやすく解説します!

    そのために、結構大事なのが、

    平方和Sを行列表記して解ける事

    例えば、
    S=\(\sum_{i=1}^{n}(x_i-\bar{x})^2\)=\(X^T X\)
    \(X\)=\(\begin{pmatrix}
    x_1-\bar{x}\\
    x_2-\bar{x}\\
    …\\
    x_n-\bar{x}
    \end{pmatrix}
    \)

    がすっと理解できることが大事なのですが、最初は難しいので、丁寧に解説していきます。

    ➁\(β_k\)の導出式を行列表記する

    平方和\(S_{jk}\)の導出式を行列表記する

    先ほど紹介しましたが、
    S=\(\sum_{i=1}^{n}(x_i-\bar{x})^2\)=\(X^T X\)
    が難しいので、丁寧に解説していきます。

    平方和Sを書き出すと
    S=\((x_1-\bar{x})^2\)+\((x_2-\bar{x})^2\)+…+\((x_i-\bar{x})^2\)+…+\((x_n-\bar{x})^2\)
    ですね。

    この各項の\((x_i-\bar{x})^2\)を
    \((x_i-\bar{x})^2\)=\((x_i-\bar{x})\)×\((x_i-\bar{x})\)として、行列の積に当てはめていきます。下図をご覧ください。

    テコ比

    上図は\(i\)=1,2についてですが、これを\(i\)=1,2,…,\(n\)まで拡大しても行列の積の式は同じように書けます。

    \(\begin{pmatrix}
    x_1-\bar{x} & x_2-\bar{x} & … & x_n-\bar{x} \end{pmatrix}\)\(\begin{pmatrix}
    x_1-\bar{x}\\
    x_2-\bar{x}\\
    …\\
    x_n-\bar{x}
    \end{pmatrix}
    \)
    を計算すると
    =\((x_1-\bar{x})^2\)+\((x_2-\bar{x})^2\)+…+\((x_i-\bar{x})^2\)+…+\((x_n-\bar{x})^2\)
    =S(平方和)になりますね。

    つまり、
    S=\(\sum_{i=1}^{n}(x_i-\bar{x})^2\)=\(X^T X\)
    がよくわかりますね。

    次に、同様に考えると平方和\(S_{jk}\)は
    \(S_{jk}\)=\(\sum_{i=1}^{n}(x_{ji}-\bar{x_j})(x_{ki}-\bar{x_k})\)より、行列表記すると

    \(\begin{pmatrix}
    x_{j1}-\bar{x_j} & x_{j2}-\bar{x_j} & … & x_{jn}-\bar{x_j} \end{pmatrix}\)\(\begin{pmatrix}
    x_{k1}-\bar{x_k}\\
    x_{k2}-\bar{x_k}\\
    …\\
    x_{kn}-\bar{x_k}
    \end{pmatrix}
    \)
    となるがわかりますね。

    つまり、
    \(S_{jk}\)=\(X_j^T X_k\)
    と書けることもわかりますね。

    \(j,k\)をすべての場合についての平方和を行列表記する

    \(j,k\)は共に1~\(p\)までありますから、すべての\(j,k\)における平方和を行列表記すると下図のようになります。

    平方和Sを行列表記して解ける事

    \(\left(
    \begin{array}{cccc}
    S_{11} & S_{12} & \ldots & S_{1k} & \ldots& S_{1p} \\
    S_{21} & S_{22} & \ldots & S_{2k} & \ldots & S_{2p} \\
    \vdots & \vdots & \vdots & \vdots & \ddots & \vdots \\
    S_{j1} & S_{j2} & \ldots & S_{jk} & \ldots & S_{jp} \\
    \vdots & \vdots & \vdots &\vdots & \ddots & \vdots \\
    S_{p1} & S_{p2} & \ldots & S_{pk} & \ldots & S_{pp}
    \end{array}
    \right)
    \)

    =\(\left(
    \begin{array}{cccc}
    x_{11}-\bar{x_1} & x_{12}-\bar{x_1} & \ldots & x_{1i}-\bar{x_1} & \ldots& x_{1n}-\bar{x_1} \\
    x_{21}-\bar{x_2} & x_{22}-\bar{x_2} & \ldots & x_{2i}-\bar{x_2} & \ldots& x_{2n}-\bar{x_2} \\
    \vdots & \vdots & \vdots & \vdots & \ddots & \vdots \\
    x_{j1}-\bar{x_j} & x_{j2}-\bar{x_j} & \ldots & x_{ji}-\bar{x_j} & \ldots& x_{jn}-\bar{x_j} \\
    \vdots & \vdots & \vdots &\vdots & \ddots & \vdots \\
    x_{p1}-\bar{x_p} & x_{p2}-\bar{x_p} & \ldots & x_{pi}-\bar{x_p} & \ldots& x_{pn}-\bar{x_p} \\
    \end{array}
    \right)
    \)

    \(\left(
    \begin{array}{cccc}
    x_{11}-\bar{x_1} & x_{21}-\bar{x_2} & \ldots & x_{ki}-\bar{x_k} & \ldots& x_{p1}-\bar{x_p} \\
    x_{12}-\bar{x_1} & x_{22}-\bar{x_2} & \ldots & x_{ki}-\bar{x_k} & \ldots& x_{p2}-\bar{x_p} \\
    \vdots & \vdots & \vdots & \vdots & \ddots & \vdots \\
    x_{1i}-\bar{x_1} & x_{2i}-\bar{x_2} & \ldots & x_{ki}-\bar{x_k} & \ldots& x_{pk}-\bar{x_p} \\
    \vdots & \vdots & \vdots &\vdots & \ddots & \vdots \\
    x_{1n}-\bar{x_1} & x_{2n}-\bar{x_2} & \ldots & x_{kn}-\bar{x_k} & \ldots& x_{pn}-\bar{x_p} \\
    \end{array}
    \right)
    \)

    ここで注意なのは、

    (左辺)はp×pの行列で
    (右辺)はn×p行列と、p×n行列の積であること
    (右辺)は2つとも正方行列ではない点に注意!

    図で描くと下のイメージです。

    テコ比

    確かに行列を式で表記すると
    S=\(X^T X\)
    と書くのでSもXも同じp×p行列と思いがちです。
    行列はシンプルに式が書けるけど、中身をちゃんと追わないと
    間違えやすいので難しいですね。

    【結論】平方和\(S_{jk}\)を行列表記

    \(S\)=\(X^T X\)
    となります。

    平方和\(S_{jy}\)の導出式を行列表記する

    平方和\(S_{jk}\)の行列表記を丁寧に解説しました。同様に、平方和\(S_{jy}\)の導出式を行列表記します。

    平方和\(S_{xx}\)を書き出すと
    \(S_{xx}\)=\((x_1-\bar{x})^2\)+\((x_2-\bar{x})^2\)+…+\((x_i-\bar{x})^2\)+…+\((x_n-\bar{x})^2\)
    ですね。

    平方和Sを書き出すと
    S=\((x_1-\bar{x})^2\)+\((x_2-\bar{x})^2\)+…+\((x_i-\bar{x})^2\)+…+\((x_n-\bar{x})^2\)
    =\(\begin{pmatrix}
    x_1-\bar{x} & x_2-\bar{x} & … & x_n-\bar{x} \end{pmatrix}\)\(\begin{pmatrix}
    x_1-\bar{x}\\
    x_2-\bar{x}\\
    …\\
    x_n-\bar{x}
    \end{pmatrix}
    \)
    でしたね。

    ここで、\((x_i-\bar{x})^2\)を\((x_i-\bar{x})(y_i-\bar{y})\)に変えても同様に行列表記できます。

    \(S_{1y}\)=\((x_{j1}-\bar{x_j})(y_1-\bar{y})\)+\((x_{j2}-\bar{x_j})(y_2-\bar{y})\)+…+\((x_{jn}-\bar{x_j})(y_n-\bar{y})\)
    =\(\begin{pmatrix}
    x_{j1}-\bar{x_j} & x_{j2}-\bar{x_j} & … & x_{jn}-\bar{x_j} \end{pmatrix}\)\(\begin{pmatrix}
    y_1-\bar{y}\\
    y_2-\bar{y}\\
    …\\
    y_n-\bar{y}
    \end{pmatrix}
    \)
    とかけるので、
    \(S_{1y}\)=\(X^T Y\)と
    行列表記できますね。

    また、\(S_{1y}\),\(S_{2y}\),…,\(S_{py}\)も同様にして、まとめて行列表記できます。

    \(\left(
    \begin{array}{cccc}
    x_{11}-\bar{x_1} & x_{12}-\bar{x_1} & \ldots & x_{1n}-\bar{x_1}\\
    x_{21}-\bar{x_2} & x_{22}-\bar{x_2} & \ldots & x_{2n}-\bar{x_2}\\
    \vdots & \vdots & \ddots & \vdots \\
    x_{p1}-\bar{x_p} & x_{p2}-\bar{x_p} & \ldots & x_{pn}-\bar{x_p}\\
    \end{array}
    \right)
    \)\(\begin{pmatrix}
    y_{1}-\bar{y}\\
    y_{2}-\bar{y}\\
    …\\
    y_{n}-\bar{y}
    \end{pmatrix}
    \)=\(\begin{pmatrix}
    S_{1y}\\
    S_{2y}\\
    …\\
    S_{py}
    \end{pmatrix}
    \)

    ここで注意なのは、

    (左辺)はn×pの行列とnのベクトルの積で
    (右辺)はpのベクトルであること
    n,p混同しないよう注意!

    図で描くと下のイメージです。

    テコ比

    【結論】平方和\(S_{jy}\)を行列表記

    \(S_{xy}\)=\(X^T Y\)
    となります。

    \(β_k\)の導出式を行列表記する

    さて、回帰直線の傾きを導出する式を再掲します。

    \(\left(
    \begin{array}{cccc}
    S_{11} & S_{12} & \ldots & S_{1p} \\
    S_{21} & S_{22} & \ldots & S_{2p} \\
    \vdots & \vdots & \ddots & \vdots \\
    S_{p1} & S_{p2} & \ldots & S_{pp}
    \end{array}
    \right)
    \)\(
    \left(
    \begin{array}{c}
    β_1 \\
    β_2 \\
    \vdots \\
    β_p
    \end{array}
    \right)
    \)=\(
    \left(
    \begin{array}{c}
    S_{1y} \\
    S_{2y} \\
    \vdots \\
    S_{py}
    \end{array}
    \right)
    \)

    この式を行列表記すると下図のように

    テコ比

    \(X^T X\)\(β\)=\(X^T Y\)
    とシンプルに書けますね。

    また、(左辺)は\(β\)のみにしたいので、\(X^T X\)の逆行列を両辺にかけます。すると、

    \(β\)=\((X^T X)^{-1}\)\(X^T Y\)
    とシンプルに書けますね。
    \(β\)について行列表記できました!
    ハット行列までもう少しです!

    ➂ハット行列\(H\)を導出する

    回帰\(\hat{Y}\)の導出式を行列表記する

    回帰直線を行列表記すると
    \(\hat{Y}=Xβ\)
    とXが前に、βが後ろに来ます。これをちゃんと理解しましょう!

    回帰直線はn個のデータにおいて、次のn個の式が書けますね。
    ●\(\hat{y_1}-\bar{y}\)=\(β_1 (x_{11}-\bar{x_1})\)+\(β_2 (x_{21}-\bar{x_2})\)+…+\(β_p (x_{p1}-\bar{x_p})\)
    ●\(\hat{y_2}-\bar{y}\)=\(β_1 (x_{12}-\bar{x_1})\)+\(β_2 (x_{22}-\bar{x_2})\)+…+\(β_p (x_{p2}-\bar{x_p})\)

    ●\(\hat{y_n}-\bar{y}\)=\(β_1 (x_{1n}-\bar{x_1})\)+\(β_2 (x_{2n}-\bar{x_2})\)+…+\(β_p (x_{pn}-\bar{x_p})\)
    ですね。これを行列表記すると、下の式になります。じっくり確認してください。

    \(\begin{pmatrix}
    \hat{y_{1}}-\bar{y}\\
    \hat{y_{2}}-\bar{y}\\
    …\\
    \hat{y_{n}}-\bar{y}
    \end{pmatrix}
    \)=\(\left(
    \begin{array}{cccc}
    x_{11}-\bar{x_1} & x_{21}-\bar{x_2} & \ldots & x_{p1}-\bar{x_p}\\
    x_{12}-\bar{x_1} & x_{22}-\bar{x_2} & \ldots & x_{p2}-\bar{x_p}\\
    \vdots & \vdots & \ddots & \vdots \\
    x_{1n}-\bar{x_1} & x_{2n}-\bar{x_2} & \ldots & x_{pn}-\bar{x_p}\\
    \end{array}
    \right)
    \)\(\begin{pmatrix}
    β_1\\
    β_2\\
    …\\
    β_p
    \end{pmatrix}
    \)

    確かに\(\hat{Y}=Xβ\)ですよね。
    逆の\(βX\)の行列計算はできません。

    ハット行列\(H\)を導出する

    さあ、ようやくまとめに入ります。

    回帰直線は\(\hat{Y}\)=\(Xβ\)
    で\(β\)=\((X^T X)^{-1}\)\(X^T Y\)を代入すると
    \(\hat{Y}\)=\(X\)\((X^T X)^{-1}\)\(X^T\)\( Y\)
    となります。

    \(\hat{Y}\)=\(X\)\((X^T X)^{-1}\)\(X^T\)\( Y\)
    の関係式から\(\hat{Y}\)と\( Y\)の比をテコ比と考えて
    ハット行列\(H\)=\(X\)\((X^T X)^{-1}\)\(X^T\)
    が導出できます。

    ちゃんと導出できました!

    ➃ハット行列とテコ比を導出する

    ハット行列の性質

    ハット行列は、

    \(\hat{Y}\)=\(X\)\((X^T X)^{-1}\)\(X^T\)\( Y\)
    の関係式から\(\hat{Y}\)と\( Y\)の比をテコ比と考えて
    ハット行列\(H\)=\(X\)\((X^T X)^{-1}\)\(X^T\)

    でしたね。

    実は、ハット行列\(H\)は面白い性質があります。

    \(H^2\)=\(H\)
    です。つまり、
    \(H^3\)=\(H×H^2\)=\(H^2\)=\(H\)

    \(H^n\)=…=\(H\)
    と何乗しても同じ行列です。不思議!

    証明

    証明しましょう。
    \(H^2\)=[\(X\)\((X^T X)^{-1}\)\(X^T\)][\(X\)\((X^T X)^{-1}\)\(X^T\)]
    =\(X\)\((X^T X)^{-1}\)(\(X^T\)\(X\))\((X^T X)^{-1}\)\(X^T\)
    (黄色マーカー部は単位行列\(E\)になるので、)
    =\(X\)\((X^T X)^{-1}\)\(X^T\)
    =\(H\)
    となりますね。

    ハット行列はn×n行列(n:データ数)

    ハット行列は式で書くと、\(X\)\((X^T X)^{-1}\)\(X^T\)ですが、
    X、Hの行数、列数がいくらになるかはちゃんと確認しておきましょう。

    例として\(X\)行列がn行×p列とします。
    (nはデータ数、pは説明変数の数で、基本は n > pです。)
    下図で行列の積に注意して、\(X\)\((X^T X)^{-1}\)\(X^T\)が
    n×n行列になる流れを理解しましょう!

    図ではp=3,n=6で説明しました。

    となると、ハット行列\(H\)は次のように表現できます。

    \(H\)=\(\left(
    \begin{array}{cccc}
    h_{11} & h_{12} & \ldots & h_{1n} \\
    h_{21} & h_{22} & \ldots & h_{2n} \\
    \vdots & \vdots & \ddots & \vdots \\
    h_{n1} & h_{n2} & \ldots & h_{nn}
    \end{array}
    \right)
    \)

    もともと\(\hat{Y}\)=\(HY\)の関係でしたから、行列表記すると

    \(
    \left(
    \begin{array}{c}
    \hat{y_1} \\
    \hat{y_2} \\
    \vdots \\
    \hat{y_n}
    \end{array}
    \right)
    \)=\(\left(
    \begin{array}{cccc}
    h_{11} & h_{12} & \ldots & h_{1n} \\
    h_{21} & h_{22} & \ldots & h_{2n} \\
    \vdots & \vdots & \ddots & \vdots \\
    h_{n1} & h_{n2} & \ldots & h_{nn}
    \end{array}
    \right)
    \)\(
    \left(
    \begin{array}{c}
    y_1 \\
    y_2 \\
    \vdots \\
    y_n
    \end{array}
    \right)
    \)

    となりますね。

    テコ比を導出

    次に、テコ比を導出します。

    上の行列の式から\(\hat{y_i}\)成分だけ取り出すと、次の関係式ができます。
    \(\hat{y_i}\)=\(h_{i1} y_1\)+\(h_{i2} y_2\)+…+\(h_{ij} y_j\)+\(h_{in} y_n\)

    この式からテコ比\(h_{ii}\)を定義します。

    ●テコ比\(h_{ii}\)
    \(h_{ii}\)=\(\displaystyle \frac{\partial \hat{y_i}}{\partial y_i}\)

    ここまで、ハット行列とテコ比の導出を解説してきました。
    次に具体的な値で実際計算してみましょう。

    行列計算で行数、列数に意識して読んでください。結構大事!

    ➄ハット行列とテコ比を実際に計算する

    データを用意

    data x1 x2 y
    1 8 3 3
    2 11 2 4
    3 9 4 4
    4 12 4 7
    5 11 5 7
    6 9 6 5
    合計 60 24 30
    平均 10 4 5

    【問題】
    ハット行列\(H\)とテコ比\(h_{ii}\)を求めよ。

    ではやってみましょう。

    各行列を計算

    まず、行列\(X\)を定義します。説明変数p=2、データ数n=6の行列ですね。正方行列ではない点に注意です。

    最も大事な注意点

    行列に代入する\(x, \hat{y},y\)はそのまま代入ではなく
    ●\(x_{ij}-\bar{x_i}\)
    ●\(\hat{y_i}-\bar{y}\)
    ●\(y_i-\bar{y}\)
    とそれぞれ平均で差分した値を代入すること。

    行列\(X\)

    \(x_{ij}-\bar{x_i}\)は下表を参考に行列を作ります。

    data x1 x2 \(x_1-\bar{x_1}\) \(x_2-\bar{x_2}\)
    1 8 3 -2 -1
    2 11 2 1 -2
    3 9 4 -1 0
    4 12 4 2 0
    5 11 5 1 1
    6 9 6 -1 2
    合計 60 24
    平均 10 4

    黄色マーカ部分から行列\(X\)を作ります。

    \(X\)=\(\left(
    \begin{array}{cccc}
    -2 & -1 \\
    1 & -2 \\
    -1 & 0 \\
    2 & 0 \\
    1 & 1 \\
    -1 & 2 \\
    \end{array}
    \right)
    \)

    行列\(X^T X\)の計算

    転置行列\(X^T\)との\(X\)の積なので、\(X^T X\)=\(\left(
    \begin{array}{cccc}
    -2 & 1 & -1 & 2 & 1 & -1 \\
    -1 & -2 & 0 & 0 & 1 & 2 \\
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{cccc}
    -2 & -1 \\
    1 & -2 \\
    -1 & 0 \\
    2 & 0 \\
    1 & 1 \\
    -1 & 2 \\
    \end{array}
    \right)
    \)
    =\(\left(
    \begin{array}{cccc}
    12 & -1 \\
    -1 & 10 \\
    \end{array}
    \right)
    \)

    確かに計算結果は
    \(X^T X\)=\(\left(
    \begin{array}{cccc}
    12 & -1 \\
    -1 & 10 \\
    \end{array}
    \right)
    \)=\(\left(
    \begin{array}{cccc}
    S_{11} & S_{12} \\
    S_{12} & S_{22} \\
    \end{array}
    \right)
    \)
    で\(X\)の積は確かに平方和になっていますね。

    逆行列\((X^T X)^{-1}\)の計算

    逆行列を計算します。2×2の行列なので簡単ですね。規模が大きくなる場合はExcelのMINVERSE関数で計算しましょう。

    \((X^T X)^{-1}\)=\(\left(
    \begin{array}{cccc}
    0.084 & 0.0084 \\
    0.0084 & 0.1008 \\
    \end{array}
    \right)
    \)

    \(X(X^T X)^{-1}\)の計算

    どんどん計算しましょう。

    \(X(X^T X)^{-1}\)
    =\(\left(
    \begin{array}{cccc}
    -2 & -1 \\
    1 & -2 \\
    -1 & 0 \\
    2 & 0 \\
    1 & 1 \\
    -1 & 2 \\
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{cccc}
    0.084 & 0.0084 \\
    0.0084 & 0.1008 \\
    \end{array}
    \right)
    \)
    =\(\left(
    \begin{array}{cccc}
    -0.176 & -0.118 \\
    0.067 & -0.193 \\
    -0.084 & -0.008 \\
    0.168 & 0.017 \\
    0.092 & 0.109 \\
    -0.067 & 0.193 \\
    \end{array}
    \right)
    \)

    確かに 6×2行列になっていますね。

    ハット行列\(H\)の計算

    \(H\)=\(X(X^T X)^{-1} X^T\)
    =\(\left(
    \begin{array}{cccc}
    -0.176 & -0.118 \\
    0.067 & -0.193 \\
    -0.084 & -0.008 \\
    0.168 & 0.017 \\
    0.092 & 0.109 \\
    -0.067 & 0.193 \\
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{cccc}
    -2 & 1 & -1 & 2 & 1 & -1 \\
    -1 & -2 & 0 & 0 & 1 & 2 \\
    \end{array}
    \right)
    \)
    =\(\left(
    \begin{array}{cccc}
    0.471 & 0.059 & 0.176 & -0.353 & -0.294 & -0.059 \\
    0.059 & 0.454 & -0.067 & 0.134 & -0.126 & -0.454 \\
    0.176 & -0.067 & 0.084 & -0.168 & -0.092 & 0.067 \\
    -0.353 & 0.134 & -0.168 & 0.336 & 0.185 & -0.134 \\
    -0.294 & -0.126 & -0.092 & 0.185 & 0.202 & 0.126 \\
    -0.059 & -0.454 & 0.067 &-0.134 & 0.126 & 0.454 \\
    \end{array}
    \right)
    \)

    とデータ数n=6の6×6行列がでました。

    テコ比を計算

    テコ比は

    ●テコ比\(h_{ii}\)
    \(h_{ii}\)=\(\displaystyle \frac{\partial \hat{y_i}}{\partial y_i}\)

    より、
    ●\(h_{11}\)=0.471
    ●\(h_{22}\)=0.454
    ●\(h_{33}\)=0.084
    ●\(h_{44}\)=0.336
    ●\(h_{55}\)=0.202
    ●\(h_{66}\)=0.454

    と計算ができました。

    重回帰分析の結果を比較

    先ほどのデータを重回帰分析すると下表の結果になります。実際手を動かして計算してみてください。

    \(x_{1i}\) \(x_{2i}\) \(y_i\) \(\hat{y_i}\) \(y_i-\bar{y}\) \(\hat{y_i}-\bar{y}\)
    1 8 3 3 2.529 -2 -2.471
    2 11 2 4 4.513 -1 -0.487
    3 9 4 4 4.109 -1 -0.891
    4 12 4 7 6.782 2 1.782
    5 11 5 7 6.58 2 1.580
    6 9 6 5 5.487 0 0.487
    合計 60 24 30
    平均 10 4 5(=\(\bar{y}\))

    平方和 回帰直線
    \(S_{11}\) 12 y切片\(β_0\) -6.664
    \(S_{12}\) -1(=\(S_{21}\)) 傾き\(β_1\) 0.891
    \(S_{22}\) 10 傾き\(β_2\) 0.689
    \(S_{1y}\) 10
    \(S_{2y}\) 6
    \(S_{yy}\) 14

    なお、回帰直線上の点\(\hat{y_i}\)は
    \(\hat{y_i}\)=\(β_0\)+\(β_1 x_1\)+\(β_2 x_2\)
    \(\hat{y_i}\)=-6.664+0.891\( x_1\)+0.689\(x_2\)
    で計算できます。

    ここで、

    \(\hat{Y}\)=\(\left(
    \begin{array}{cccc}
    \hat{y_1}-\bar{y} \\
    \hat{y_2}-\bar{y} \\
    \hat{y_3}-\bar{y} \\
    \hat{y_4}-\bar{y} \\
    \hat{y_5}-\bar{y} \\
    \hat{y_6}-\bar{y} \\
    \end{array}
    \right)
    \)=\(\left(
    \begin{array}{cccc}
    -2.471 \\
    -0.487 \\
    -0.891 \\
    1.782 \\
    1.580 \\
    0.487 \\
    \end{array}
    \right)
    \)

    \(Y\)=\(\left(
    \begin{array}{cccc}
    y_1-\bar{y} \\
    y_2-\bar{y} \\
    y_3-\bar{y} \\
    y_4-\bar{y} \\
    y_5-\bar{y} \\
    y_6-\bar{y} \\
    \end{array}
    \right)
    \)=\(\left(
    \begin{array}{cccc}
    -2\\
    -1 \\
    -1 \\
    2 \\
    2 \\
    0 \\
    \end{array}
    \right)
    \)

    \(H\)=\(\left(
    \begin{array}{cccc}
    0.471 & 0.059 & 0.176 & -0.353 & -0.294 & -0.059 \\
    0.059 & 0.454 & -0.067 & 0.134 & -0.126 & -0.454 \\
    0.176 & -0.067 & 0.084 & -0.168 & -0.092 & 0.067 \\
    -0.353 & 0.134 & -0.168 & 0.336 & 0.185 & -0.134 \\
    -0.294 & -0.126 & -0.092 & 0.185 & 0.202 & 0.126 \\
    -0.059 & -0.454 & 0.067 &-0.134 & 0.126 & 0.454 \\
    \end{array}
    \right)
    \)

    を使って、実際に行列\(\hat{y}=HY\)かを確かめましょう。

    \(HY\)=\(\left(
    \begin{array}{cccc}
    0.471 & 0.059 & 0.176 & -0.353 & -0.294 & -0.059 \\
    0.059 & 0.454 & -0.067 & 0.134 & -0.126 & -0.454 \\
    0.176 & -0.067 & 0.084 & -0.168 & -0.092 & 0.067 \\
    -0.353 & 0.134 & -0.168 & 0.336 & 0.185 & -0.134 \\
    -0.294 & -0.126 & -0.092 & 0.185 & 0.202 & 0.126 \\
    -0.059 & -0.454 & 0.067 &-0.134 & 0.126 & 0.454 \\
    \end{array}
    \right)
    \)\(\left(
    \begin{array}{cccc}
    -2\\
    -1 \\
    -1 \\
    2 \\
    2 \\
    0 \\
    \end{array}
    \right)
    \)=\(\left(
    \begin{array}{cccc}
    -2.471 \\
    -0.487 \\
    -0.891 \\
    1.782 \\
    1.580 \\
    0.487 \\
    \end{array}
    \right)
    \)=\(\hat{Y}\)
    と確かに一致します!

    重回帰分析の結果とハット行列の計算が一致しました!

    ⑥テコ比がわかる

    テコ比の性質

    テコ比は

    ●テコ比\(h_{ii}\)
    \(h_{ii}\)=\(\displaystyle \frac{\partial \hat{y_i}}{\partial y_i}\)

    より、
    ●\(h_{11}\)=0.471
    ●\(h_{22}\)=0.454
    ●\(h_{33}\)=0.084
    ●\(h_{44}\)=0.336
    ●\(h_{55}\)=0.202
    ●\(h_{66}\)=0.454

    と計算ができましたが、全部足すと
    \(h_{11}\)+\(h_{22}\)+\(h_{33}\)+\(h_{44}\)+\(h_{55}\)+\(h_{66}\)
    =2
    と説明変数の数p=2に一致します。

    なぜ\(\sum_{i=1}^{n}h_{ii}=p\)なのかは、
    今後の研究テーマとします。わかり次第報告します。

    まとめ

    「重回帰分析のテコ比がよくわかる」を解説しました。

    • ①重回帰分析を解く
    • ➁\(β_k\)の導出式を行列表記する
    • ➂ハット行列\(H\)を導出する
    • ➃ハット行列とテコ比を導出する
    • ➄ハット行列とテコ比を実際に計算する
    • ⑥テコ比がわかる
  • 重回帰分析のダミー変数の使い方がよくわかる

    重回帰分析のダミー変数の使い方がよくわかる

    「ダミー変数の入れ方・値によって重回帰分析の結果にどう影響が出るか心配!」と困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    重回帰分析のダミー変数の使い方がよくわかる

    おさえておきたいポイント

    • ①ダミー変数とは
    • ➁説明変数を変換すると重回帰分析がどう変化するかを理解する
    • ➂ダミー変数の入れ方と重回帰分析の変化を理解する
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】回帰分析問題集を販売します!

    QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。
    【QC検定®合格】「回帰分析(単回帰分析・重回帰分析)」問題集を販売します! 内容は、①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用、の5章全41題を演習できる問題集です。

    ダミー変数の値が変わると
    ●ダミー変数の回帰直線の傾きの値は変化し、
    ●回帰直線y切片の値も変化するが、
    ●他の説明変数の回帰直線の傾きの値は変化しないし、
    ●平方和(総平方和、回帰平方和、残差平方和)は変化しない
    ことを本記事で解説します!
    ダミー変数の値の入れ方は
    ルールが確定していたら、値は何でもいいけど
    回帰直線、平方和、分散分析にどう影響するかを
    理解しよう!

    では、解説します。

    ①ダミー変数とは

    ダミー変数とは

    重回帰分析では、0か1のどちらかの値を取る変数などの「計数値」を変数として使う場合があります。この計数値のことをダミー変数と呼びます。

    ダミー変数の入れ方は3パターンある

    ダミー変数の入れ方はいろいろなニーズがあります。例えば、
    ●0と1とか
    ●0と2とか
    ●1と2とか
    ●5と10とか
    ●-1と1とか
    の2値データとか、
    たくさんパターンが出ますよね!

    ●0,1,2,3,…と1ずつ増やしていく多値データとか

    いろいろあります。

    2値データの応用が多値データなので、2値データで考えましょう。

    再掲すると
    ●0と1とか
    ●0と2とか
    ●1と2とか
    ●5と10とか
    ●-1と1とか
    の2値データとか、
    は数式で書くと、3つのパターンに分ける事ができます。

    1. 0,1が基本パターンで定数倍したもの(x⇒ax)
    2. 0,1が基本パターンで定数値を加減したもの(x⇒x+a)
    3. 0,1が基本パターンで定数倍と定数値の加減を組み合わせたもの(x⇒ax+b)

    3つに分けてもイマイチ理解できませんよね!
    なので、実際に解いてみると下表になります。

    パターン 0,1との比較 数式
    0,2のパターン 0,1に対して2倍 2x
    1,2のパターン 0,1に対して1加算 x+1
    5,10のパターン 0,1に対して5倍して5加算 5(x+1)
    -1,1のパターン 0,1に対して2倍して1引く 2x-1

    いろいろな2値データのパターンがありますが、数式で書くと3つしかないことがわかりますよね。

    1. x
    2. ax (a:定数)
    3. ax+b(a,b:定数)
    重回帰分析のダミー変数の使い方がわかるには、
    ●0,1のパターン
    ●0,1に定数倍したパタン
    ●0,1に定数倍と定数値を加減したパターン
    の3つの違いを理解すればOK
    ですね。

    ➁説明変数を変換すると重回帰分析がどう変化するかを理解する

    結論は、

    (その1)は \(x_1’\)=\(ax_1\)の場合
    ●\(x_1’\)の回帰直線の傾き\(β_1’\)が\(\frac{1}{a}β_1\)に変化する。
    ●\(x_2\)の回帰直線の傾きは変わらない。
    ●総平方和\(S_T\)、回帰平方和\(S_R\)、残差平方和\(S_e\)は変わらない。

    となります。

    詳細は、関連記事で解説しています。ご確認ください。

    重回帰分析は単位に影響されない理由がわかる
    重回帰分析で説明変数の単位を変更すると何が変化するか、しないかは説明できますか? 本記事では、数式で丁寧に導出して説明変数の単位の変化による重回帰分析の影響を解説します。多変量解析を学ぶ人は必読です。

    (その2)は \(x_1’\)=\(ax_1+b\)の場合
    ●\(x_1’\)の回帰直線の傾き\(β_1’\)が\(\frac{1}{a}β_1\)に変化する。
    ●\(x_2\)の回帰直線の傾きは変わらない。
    ●\(x_1’\)の回帰直線のy切片\(β_0’\)が\(β_0-\frac{b}{a}β_0\)に変化する。
    ●総平方和、回帰平方和、残差平方和は変わらない。

    となっていますね。

    詳細は、関連記事で解説しています。ご確認ください。

    重回帰分析は単位に影響されない理由がわかる(その2)
    重回帰分析で説明変数の単位を変更すると何が変化するか、しないかは説明できますか?本記事では、数式で丁寧に導出して説明変数の単位の変化による重回帰分析の影響を解説します。(その1)はx’=axの場合、今回(その2)はx’=ax+bの場合について解説します。ダミー変数導入に必要な記事なので、多変量解析を学ぶ人は必読です。

    まとめると、

    (その2)は \(x_1’\)=\(ax_1+b\)の場合
    ●\(x_1’\)の回帰直線の傾き\(β_1’\)が\(\frac{1}{a}β_1\)に変化する。
    ●\(x_2\)の回帰直線の傾きは変わらない。
    ●\(x_1’\)の回帰直線のy切片\(β_0’\)が\(β_0-\frac{b}{a}β_0\)に変化する。
    ●総平方和、回帰平方和、残差平方和は変わらない。

    となっていますね。

    ダミー変数の入れ方によって回帰直線のダミー変数が関わる所は変化するが、それ以外は変わらないと理解しておきましょう。

    説明変数を変換すると、
    回帰直線の傾き、y切片が変化する理由や
    平方和は不変である理由を関連記事で解説しています。
    数式を使った証明は関連記事で確認ください。
    本記事は具体的な解説例で確認していきます。

    本当かどうか、実例を挙げて確認します。

    ➂ダミー変数の入れ方と重回帰分析の変化を理解する

    データを用意

    以下のデータを用意します。

    x1 x2 y
    ?? 3 3
    ?? 2 4
    ?? 4 4
    ?? 4 7
    ?? 5 7
    ?? 6 5

    \(x_1\)の「??」にダミー変数をいれて、2つの説明変数からなる重回帰分析をやってみましょう。

    ダミー変数を代入

    次の3種類のダミー変数を用意します。

    (i-1)x (i-2)5x (i-3)2x-1
    0 0 -1
    0 0 -1
    0 0 -1
    1 5 1
    1 5 1
    1 5 1

    データ表をまとめます。

    (i-1)x (i-2)5x (i-3)2x-1 x2 y
    0 0 -1 3 3
    0 0 -1 2 4
    0 0 -1 4 4
    1 5 1 4 7
    1 5 1 5 7
    1 5 1 6 5

    では、解析しましょう。

    重回帰分析の実施結果

    回帰直線\(y=β_0+β_1 x_1+β_2 x_2\)と平方和の解析結果を比較しましょう。
    黄色マーカが変化したところです。

    (i-1)x (i-2)5x (i-3)2x-1
    回帰直線 (y切片)\(β_0\) 5.167 5.167 7
    回帰直線 (x1傾き)\(β_1\) 3.677 0.733 1.833
    回帰直線 (x2傾き)\(β_2\) -0.5 -0.5 -0.5
    平方和 \(S_R\) 10.667 10.667 10.667
    平方和 \(S_e\) 3.333 3.333 3.333
    平方和 \(S_T\) 14 14 14

    確かに、

    (その1)は \(x_1’\)=\(ax_1\)の場合
    ●\(x_1’\)の回帰直線の傾き\(β_1’\)が\(\frac{1}{a}β_1\)に変化する。
    ●\(x_2\)の回帰直線の傾きは変わらない。
    ●総平方和\(S_T\)、回帰平方和\(S_R\)、残差平方和\(S_e\)は変わらない。

    となります。
    (その2)は \(x_1’\)=\(ax_1+b\)の場合
    ●\(x_1’\)の回帰直線の傾き\(β_1’\)が\(\frac{1}{a}β_1\)に変化する。
    ●\(x_2\)の回帰直線の傾きは変わらない。
    ●\(x_1’\)の回帰直線のy切片\(β_0’\)が\(β_0-\frac{b}{a}β_0\)に変化する。
    ●総平方和、回帰平方和、残差平方和は変わらない。

    となっていますね。

    となっていますね。

    ダミー変数の値が変わると
    ●ダミー変数の回帰直線の傾きの値は変化し、
    ●回帰直線y切片の値も変化するが、
    ●他の説明変数の回帰直線の傾きの値は変化しないし、
    ●平方和(総平方和、回帰平方和、残差平方和)は変化しない
    ことがわかりましたね!

    理由が気になったら関連記事で確認しましょう。数式で理由をわかりやすく解説しています。

    まとめ

    「重回帰分析のダミー変数の使い方がよくわかる」を解説しました。

    • ①ダミー変数とは
    • ➁説明変数を変換すると重回帰分析がどう変化するかを理解する
    • ➂ダミー変数の入れ方と重回帰分析の変化を理解する

  • 平方和の分解と分散分析ができる(重回帰分析)

    平方和の分解と分散分析ができる(重回帰分析)

    本記事のテーマ

    平方和の分解と分散分析ができる(重回帰分析)

    おさえておきたいポイント

    • ①重回帰分析のデータの構造式
    • ➁平方和の分解
    • ➂中間積和項が0になる導出過程をすべて見せます!
    • ➃重回帰分析の分散分析

    【QC検定®1級合格】回帰分析問題集を販売します!

    QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。
    【内容】①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用、の5章全41題。

    多変量解析はすべて数式で導出できます。導出過程から本質を理解しましょう。

    重回帰分析の基礎である、回帰式の導出については関連記事に書いています。この関連記事をベースに本記事を作っています。ご確認ください。

    重回帰分析の回帰式が導出できる
    本記事では公式暗記になりがちな重回帰分析の回帰式を途中経過を一切端折らず丁寧に解説します。

    本記事は、暗記しがちな、重回帰分析の分散分析に必要な導出過程を丁寧に解説します。

    ①重回帰分析のデータの構造式

    データの構造式を作る

    下図のように、実測値\(y_i\)に対して、回帰直線上にある予測値\(\hat{y_i}\)と平均値\(\bar{y}\)を使って、差を分割します。

    重回帰分析

    つまり、
    (\(y_i\)-\(\bar{y}\))=(\(\hat{y_i}\)-\(\bar{y}\))+(\(y_i\)-\(\hat{y_i}\))
    (誤差全体)=(回帰成分)+(残差成分)
    に分ける式(データの構造式)を作ります。

    誤差を一次式で分割する「データの構造式」は
    QCで扱う数学の中で一番大事且つ基本的な式で、
    分散分析を扱う
    ●実験計画法
    ●回帰分析
    ●多変量解析
    など、すべてに関わってきます。

    まず、データの構造式を作りましょう。

    ➁平方和の分解

    データの構造式の2乗和が肝

    データの構造式を作ったら、両辺の2乗和を計算します。
    すると、2乗項以外の積和がすべて0になるので、
    平方和が分解できて、
    分散分析ができる!

    これも、超基本ですが、超大事ですね! これを頭で覚えず、ちゃんと計算・導出できてから理解しましょう。自分で計算して平方和が分解できることがわかることが大事です!

    平方和の分解

    (\(y_i\)-\(\bar{y}\))=(\(\hat{y_i}\)-\(\bar{y}\))+(\(y_i\)-\(\hat{y_i}\))
    の両辺の2乗和を取ります。

    \(\sum_{i=1}^{n}\)\((y_i-\bar{y})^2\)
    =\(\sum_{i=1}^{n}\)(\((\hat{y_i}-\bar{y})\)+\((y_i-\hat{y_i}))^2\)
    とします。

    (右辺)を変形すると、
    \(\sum_{i=1}^{n}\)(\((\hat{y_i}-\bar{y})\)+\((y_i-\hat{y_i}))^2\)
    =\(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})^2\) →(1)
    +2\(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})\)\((y_i-\hat{y_i})\) →(2)
    +\(\sum_{i=1}^{n}\)\((y_i-\hat{y_i})^2\) →(3)
    と変形できます。

    実は、
    ●(1):\(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})^2\)=\(S_R\)(回帰平方和)
    ●(2):\(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})\)\((y_i-\hat{y_i})\)=0
    ●(3):\(\sum_{i=1}^{n}\)\((y_i-\hat{y_i})^2\)=\(S_{er}\)((回帰)残差平方和)
    となります。

    (左辺)の
    \(\sum_{i=1}^{n}\)\((y_i-\bar{y})^2\)は総平方和として、
    \(\sum_{i=1}^{n}\)\((y_i-\bar{y})^2\)=\(S_T\)(総平方和)
    となるので、

    まとめると、
    \(S_T\)=\(S_R\)+\(S_{er}\)
    (総平方和)=(回帰平方和)+ ((回帰)残差平方和)
    と平方和が分解できます。

    分散分析をやるので、
    \(S_T\)=\(S_R\)+\(S_{er}\)
    が当たり前に見えるけど
    ●(2):\(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})\)\((y_i-\hat{y_i})\)=0
    はちゃんと証明できる?

    中間積和項である、
    \(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})\)\((y_i-\hat{y_i})\)=0
    はちゃんと導出できますか?

    結構難しいのに、ちゃんと書いていない教科書やサイトが多いので、本記事でばっちり解説します!

    ➂中間積和項が0になる導出過程をすべて見せます!

    ポイントは2つあり、

    1. 回帰直線上の点である条件を活用する
    2. \((y_i-\hat{y_i})\)を\(((y_i-\bar{y})-(\hat{y_i}-\bar{y}))\)に分割する
    3. 回帰式の成立条件式を活用する

    では、丁寧に導出していきます。必ずなぞってください。いい勉強になります。

    回帰直線上の点である条件を活用する

    ここで、
    \(\hat{y_i}\)と\(\hat{y_i}\)は回帰直線\(y=a+bx_1 +cx_2\)上に乗るので
    ●\(\hat{y_i}\)=\(a+bx_{1i}+cx_{2i}\)
    ●\(\bar{y}\)=\(a+b \bar{x_1}+c \bar{x_2}\)
    が成り立ちます。代入しましょう。

    回帰直線上の点である条件を活用する

    ここで、
    \(\hat{y_i}\)と\(\hat{y_i}\)は回帰直線\(y=a+bx_1 +cx_2\)上に乗るので
    ●\(\hat{y_i}\)=\(a+bx_{1i}+cx_{2i}\)
    ●\(\bar{y}\)=\(a+b \bar{x_1}+c \bar{x_2}\)
    が成り立ちます。代入しましょう。

    \(\sum_{i=1}^{n}\)\(((a+bx_{1i}+cx_{2i})-( a+b \bar{x_1}+c \bar{x_2}))\)\((y_i-\hat{y_i})\)
    =\(\sum_{i=1}^{n}\)\( (b(x_{1i}-\bar{x_1})+ c(x_{2i}-\bar{x_2}))\)\((y_i-\hat{y_i})\)
    =\(b\sum_{i=1}^{n}\)\( (x_{1i}-\bar{x_1})\)\((y_i-\hat{y_i})\)
    +\(c\sum_{i=1}^{n}\)\( (x_{2i}-\bar{x_2})\)\((y_i-\hat{y_i})\) (式1)
    と変形します。

    \((y_i-\hat{y_i})\)を\(((y_i-\bar{y})-(\hat{y_i}-\bar{y}))\)に分割する

    (式1)の\((y_i-\hat{y_i})\)を\(((y_i-\bar{y})-(\hat{y_i}-\bar{y}))\)に分割します。

    (式1)
    =\(b\sum_{i=1}^{n}\)\( (x_{1i}-\bar{x_1})\)\(((y_i-\bar{y})-(\hat{y_i}-\bar{y}))\)
    +\(c\sum_{i=1}^{n}\)\( (x_{2i}-\bar{x_2})\)\(((y_i-\bar{y})-(\hat{y_i}-\bar{y}))\) (式2)
    と変形します。

    さらに、
    回帰直線上の点である条件を活用し、

    ●\(\hat{y_i}\)=\(a+bx_{1i}+cx_{2i}\)
    ●\(\bar{y}\)=\(a+b \bar{x_1}+c \bar{x_2}\)
    を、(式2)に代入しましょう。

    (式2)
    =\(b\sum_{i=1}^{n}\)\( (x_{1i}-\bar{x_1})\)\(((y_i-\bar{y})-b(x_{1i}-\bar{x_1})\)\(- c(x_{2i}-\bar{x_2})
    )\)
    +\(c\sum_{i=1}^{n}\)\( (x_{2i}-\bar{x_2})\)\(((y_i-\bar{y})-b(x_{1i}-\bar{x_1})\)\(- c(x_{2i}-\bar{x_2})
    )\) (式3)
    と変形します。

    回帰式の成立条件式を活用する

    (式3)のかっこ()を掛け算すると
    ●\(b\sum_{i=1}^{n}\)\( (x_{1i}-\bar{x_1})\)\((y_i-\bar{y})\)=\(bS_{1y}\)
    ●\(b\sum_{i=1}^{n}\)\( (x_{1i}-\bar{x_1})\)\((-b)(x_{1i}-\bar{x_1})\)=\(-b^2 S_{11}\)
    ●\(b\sum_{i=1}^{n}\)\( (x_{1i}-\bar{x_1})\)\((-c)(x_{2i}-\bar{x_2})\)=\(-bc S_{12}\)
    となりますし、
    ●\(c\sum_{i=1}^{n}\)\( (x_{2i}-\bar{x_2})\)\((y_i-\bar{y})\)=\(cS_{2y}\)
    ●\(c\sum_{i=1}^{n}\)\( (x_{2i}-\bar{x_2})\)\(-b)(x_{1i}-\bar{x_1})\)=\(-bcS_{12}\)
    ●\(c\sum_{i=1}^{n}\)\( (x_{2i}-\bar{x_2})\)\((-c)(x_{2i}-\bar{x_2})\)=\(-c^2 S_{22}\)
    となります。

    (式3)をまとめると
    =\(b\sum_{i=1}^{n}\)\( (x_{1i}-\bar{x_1})\)\(((y_i-\bar{y})-b(x_{1i}-\bar{x_1})\)\(- c(x_{2i}-\bar{x_2})
    )\)
    +\(c\sum_{i=1}^{n}\)\( (x_{2i}-\bar{x_2})\)\(((y_i-\bar{y})-b(x_{1i}-\bar{x_1})\)\(- c(x_{2i}-\bar{x_2})
    )\)
    =\(bS_{1y}\)-\(b^2 S_{11}\) -\(bc S_{12}\)
    +\(cS_{2y}\) -\(bcS_{12}\) -\(c^2 S_{22}\) =(式4)
    となります。

    ところで、回帰直線の成立条件を思い出すと、関連記事からみると

    重回帰分析の回帰式が導出できる
    本記事では公式暗記になりがちな重回帰分析の回帰式を途中経過を一切端折らず丁寧に解説します。

    ●傾き\(β_1\)、\(β_2\)の導出
    \(S_{11}b+S_{12}c\)=\(S_{1y}\)
    \(S_{12}b+S_{22}c\)=\(S_{2y}\)
    を満たす連立方程式から、\(β_1\)、\(β_2\)が導出できます!

    でしたね。(式4)をよくみると、
    (式4)
    =\(bS_{1y}\)-\(b^2 S_{11}\) -\(bc S_{12}\)
    +\(cS_{2y}\) -\(bcS_{12}\) -\(c^2 S_{22}\)
    =\(b\){\( S_{1y}-b S_{11}-c S_{12}\)}
    +\(c\){ \(S_{2y}-b S_{12}-c S_{22}\)}=(式5)
    となり、「{}」の中身が0になるのがわかりますね。

    よって、結果は

    \(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})\)\((y_i-\hat{y_i})\)=0
    となり、中間積和は0になります。これが平方和が分解できる理由ですね。

    難しいですが、必ず解いてから平方和の分解→分散分析と進めましょう。QCの数学で一番大事なところです!

    ➂重回帰分析の分散分析

    回帰平方和\(S_R\)の導出

    平方和が分解できたので、
    \(S_T\)=\(S_R\)+\(S_{er}\)
    (総平方和)=(回帰平方和)+ ((回帰)残差平方和)
    と平方和が分解できます。

    回帰平方和\(S_R\)の求め方の1つである次の公式を紹介・証明をします。結構活用します。

    \(S_R\)=\(β_1 S_{1y}\)+\(β_2 S_{2y}\)

    回帰平方和\(S_R\)は定義から
    \(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})^2\)
    から計算してもよいですが、回帰直線の傾き\(β\)を使って求める方が経験上多いです。

    公式は暗記ではなく、ちゃんと導出できますので、導出過程をしっかりおさえてください。

    \(S_R\)=\(β_1 S_{1y}\)+\(β_2 S_{2y}\)の証明

    \(\hat{y_i}\)と\(\bar{y}\)はともに、
    回帰直線上の点である条件を活用し、
    \((\hat{y_i}-\bar{y})\)=\(β_1(x_{1i}-\bar{x_1})+β_2(x_{2i}-\bar{x_2})\)
    を代入します。

    \(S_R\)
    =\(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})^2\)
    =\(\sum_{i=1}^{n}\)\((β_1(x_{1i}-\bar{x_1})+β_2(x_{2i}-\bar{x_2}))^2\)
    =\(β_1^2 \sum_{i=1}^{n}\)\((x_{1i}-\bar{x_1})^2\)
    +\(2β_1 β_2\)\(\sum_{i=1}^{n}\)\((x_{1i}-\bar{x_1})(x_{2i}-\bar{x_2})\)
    +\(β_2^2 \sum_{i=1}^{n}\)\((x_{2i}-\bar{x_2})^2\)
    =(式6)

    (式6)の∑の中身は各々の平方和なので、表記を変えます。
    (式6)
    =\(β_1^2 S_{11}\)+\(2β_1 β_2 S_{12}\)+\(β_2^2 S_{22}\)
    =\(β_1\)(\(β_1 S_{11}+β_2 S{12}\))+\(β_2\)(\(β_1 S_{12}+β_2 S{22}\))
    =(式7)

    ここで、

    ●傾き\(β_1\)、\(β_2\)の導出
    \(S_{11}b+S_{12}c\)=\(S_{1y}\)
    \(S_{12}b+S_{22}c\)=\(S_{2y}\)
    を満たす連立方程式から、\(β_1\)、\(β_2\)が導出できます!

    を使うと、(式7)は
    (式7)
    =\(β_1\)(\(β_1 S_{11}+β_2 S{12}\))+\(β_2\)(\(β_1 S_{12}+β_2 S{22}\))
    =\(β_1\)\(S_{1y}\)+\(β_2\)\(S_{2y}\)
    となります。ちゃんと導出できますね!

    よって、

    \(S_R\)=\(\sum_{i=1}^{n}\)\((\hat{y_i}-\bar{y})^2\)
    =\(β_1 S_{1y}\)+\(β_2 S_{2y}\)
    が導出できます! 暗記より導出方法をしっかりマスターしましょう!

    重回帰分析の分散分析表

    よく使う分散分析表は下表のとおりです。

    平方和S 自由度φ
    回帰R \(S_R\) k
    e \(S_{er}\) n-k-1
    T \(S_T\) n-1

    ここで、kは説明変数の種類ですね。

    なお、重回帰分析の分散分析については別の関連記事で詳しく解説します。

    まとめ

    「平方和の分解と分散分析ができる(重回帰分析)」を解説しました。

    • ①重回帰分析のデータの構造式
    • ➁平方和の分解
    • ➂中間積和項が0になる導出過程をすべて見せます!
    • ➃重回帰分析の分散分析
  • 重回帰分析の回帰式が導出できる

    重回帰分析の回帰式が導出できる

    本記事のテーマ

    重回帰分析の回帰式が導出できる

    おさえておきたいポイント

    • ①回帰式は誤差を最小にする条件で導出
    • ➁回帰式を導出
    • ➂【実例】回帰式を作る

    【QC検定®1級合格】回帰分析問題集を販売します!

    QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。
    【内容】①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用、の5章全41題。

    多変量解析はすべて数式で導出できます。導出過程から本質を理解しましょう。

    ①回帰式は誤差を最小にする条件で導出

    データの構造式を作る

    本記事は、説明変数が2つ(\(x_1,x_2\))、目的変数\(y\)についての回帰式を作ります。

    導出過程を一切端折らず解説しますので、一度などって下さい。理解が深まります!

    回帰式をなす、データの構造式は
    \(y=a+bx_1+cx_2\)
    として、定数\(a,b,c\)を求めていきます。回帰式となる定数\(a,b,c\)を
    ●\(a\)=\(β_0\)
    ●\(b\)=\(β_1\)
    ●\(c\)=\(β_2\)
    でよく表現します。

    回帰式は誤差を最小にする条件で導出

    ここで、同じ\(x_1,x_2\)について、実測値\(y_i\)と回帰式で求められる\(\hat{y_i}\)の2つを考えます。

    重回帰分析

    図は、理解しやすくするために、あえて2次元で描いています。

    実測値\(y_i\)と予測値\(\hat{y_i}\)の差を
    \(Q(a,b,c)\)と定義して
    \(Q(a,b,c)\)=\(\sum_{i=1}^{n}(y_i – \hat{y_i})^2\)
    が最小となる条件が、重回帰分析の回帰式を求める条件となります。

    つまり、実測値と予測値の差(誤差)を最小にする条件から回帰式を作ります。

    「(誤差)を最小にする条件」が最も大事です!

    複雑な計算になりますが、エッセンスは、「(誤差)を最小にする条件」です。

    ➁回帰式を導出

    2乗和を展開(導出過程すべて見せます!)

    \(Q(a,b,c)\)=\(\sum_{i=1}^{n}(y_i – \hat{y_i})^2\)

    \(Q(a,b,c)\)=\(\sum_{i=1}^{n}((y_i -\bar{y}) –(\hat{y_i}-\bar{y}))^2\)
    と間に\(\bar{y}\)を入れます。

    また、\(\bar{y}\)と\(\hat{y_i}\)は回帰式を通るので、
    ●\(\bar{y}\)=\(a_+b \bar{x_1}+c \bar{x_2}\)
    ●\(\hat{y}\)=\(a_+b x_{1i}+c x_{2i}\)
    が成り立つので、\(Q(a,b,c)\)に代入します。

    代入すると、
    \(Q(a,b,c)\)= \(\sum_{i=1}^{n}((y_i -\bar{y})\) –\(b(x_{1i}-\bar{x_1})\)-\( c(x_{2i}-\bar{x_2}))^2\)
    さらに、意図的に
    ●\(\bar{y}\)=\(a_+b \bar{x_1}+c \bar{x_2}\)を
    0=\(\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}\))
    として、\(Q(a,b,c)\)に代入します。

    よって、
    \(Q(a,b,c)\)= \(\sum_{i=1}^{n}((y_i -\bar{y})\)
    -\(b(x_{1i}-\bar{x_1})\)
    -\( c(x_{2i}-\bar{x_2})\)
    +\((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2})))^2\)
    となります。

    2乗和を整理

    この長い2乗式を展開します。

    \(Q(a,b,c)\)
    = \(\sum_{i=1}^{n}\) \( ((y_i -\bar{y})^2 \) →(1)
    +\(b^2(x_{1i}-\bar{x_1})^2\) →(2)
    +\(c^2(x_{2i}-\bar{x_2})^2\) →(3)
    +\(((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))^2\) →(4)
    -\(2b(y_i -\bar{y})(x_{1i}-\bar{x_1})\) →(5)
    -\(2c (y_i -\bar{y})(x_{2i}-\bar{x_2})\) →(6)
    +\(2(y_i -\bar{y})(\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))\) →(7)
    + \(2bc(x_{1i}-\bar{x_1})(x_{2i}-\bar{x_2})\) →(8)
    -\(2b(x_{1i}-\bar{x_1})\)\((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))\) →(9)
    -\(2c(x_{2i}-\bar{x_2})\)\((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2})))\) →(10)
    と展開します。長いですが、頑張りましょう。

    上の計算式を(1)~(10)に分けて、それぞれ見ていきましょう。

    ●(1)は
    \(\sum_{i=1}^{n}\) \( (y_i -\bar{y})^2 \)=\(S_{yy}\)と置けます。
    以下、Sは平方和を使って式を簡単に書いていきます。

    ●(2)は
    \(\sum_{i=1}^{n}\) \(b^2(x_{1i}-\bar{x_1})^2\) =\(b^2 S_{11}\)と置けます。

    ●(3)は
    \(\sum_{i=1}^{n}\) \(c^2(x_{2i}-\bar{x_2})^2\) =\(c^2 S_{22}\)と置けます。

    ●(4)はちょっとややこしいですが、定数を∑するので、
    \(\sum_{i=1}^{n}\)\(((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))^2\)
    =\(n((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))^2\)
    となります。あとで定数\(a\)を求めるための大事な式になります。

    ●(5)は
    \(\sum_{i=1}^{n}\)\(2b(y_i -\bar{y})(x_{1i}-\bar{x_1})\)
    =\(2b S_{1y}\)と置けます。

    ●(6)は
    \(\sum_{i=1}^{n}\)\(2c (y_i -\bar{y})(x_{2i}-\bar{x_2})\)
    = \(2c S_{2y}\)と置けます。

    ●(7)は、
    \(\sum_{i=1}^{n}\)\(2(y_i -\bar{y})(\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))\)
    =2\((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))\)\(\sum_{i=1}^{n}\)\((y_i -\bar{y})\)
    と定数を∑の外に出せて、かつ、
    \(\sum_{i=1}^{n}\)\((y_i -\bar{y})\)=0
    なので、
    (7)=0になります。

    ●(8)は、
    \(\sum_{i=1}^{n}\) \(2bc(x_{1i}-\bar{x_1})(x_{2i}-\bar{x_2})\)
    =\(2bc S_{12}\)
    と置けます。

    ●(9)は、
    \(\sum_{i=1}^{n}\)\(2b(x_{1i}-\bar{x_1})\)\((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))\)
    =\(2b(\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))\)\(\sum_{i=1}^{n}\)\((x_{1i}-\bar{x_1})\)
    と定数を∑の外に出せて、かつ、
    \(\sum_{i=1}^{n}\)\((x_{1i}-\bar{x_1})\)=0
    なので、
    (9)=0になります。

    ●(10)は、
    \(\sum_{i=1}^{n}\)\(2c(x_{2i}-\bar{x_2})\)\((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2})))\)
    =\(2c(\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2})))\)\(\sum_{i=1}^{n}\)\((x_{2i}-\bar{x_2})\)
    と定数を∑の外に出せて、かつ、
    \(\sum_{i=1}^{n}\)\(\sum_{i=1}^{n}\)\((x_{2i}-\bar{x_2})\)=0
    なので、
    (10)=0になります。

    誤差を最小にする条件

    (1)~(10)をまとめると、

    \(Q(a,b,c)\)= \(S_{yy}\)-\(b^2 S_{11}\)+\(c^2 S_{22}\)
    +\(n((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))^2\)
    -\(2b S_{1y}\)- \(2c S_{2y}\)+\(2bc S_{12}\)
    と整理できます。

    だいぶスッキリしましたね。機械的に計算しているだけなので、公式暗記の前に一回はなぞって理解しましょう。

    回帰式を導出

    ここで、回帰式の係数とy切片を求めます。つまり、
    ●\(a\)=\(β_0\)
    ●\(b\)=\(β_1\)
    ●\(c\)=\(β_2\)
    の各値です。

    回帰式は\(Q(a,b,c)\)が最小となる条件です。

    y切片 \(β_0\)の導出

    (Q(a,b,c))が最小となる条件で、定数(a)が有る項は、

    \(Q(a,b,c)\)= \(S_{yy}\)-\(b^2 S_{11}\)+\(c^2 S_{22}\)
    +\(n((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))^2\)
    -\(2b S_{1y}\)- \(2c S_{2y}\)+\(2bc S_{12}\)

    \(((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))^2\)
    の部分ですね。

    黄色マーカの2乗が最小になるのは、中身が0の時ですね。
    よって、
    \(\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2})\)=0
    が条件となり、変形すると、
    \(β_0\)=\(a\)=\(\bar{y}\)-(\(b \bar{x_1}+c \bar{x_2})\)
    が求める式となります。

    傾き\(β_1\)、\(β_2\)の導出

    \(Q(a,b,c)\)= \(S_{yy}\)-\(b^2 S_{11}\)+\(c^2 S_{22}\)
    +\(n((\bar{y}\)-(\(a_+b \bar{x_1}+c \bar{x_2}))^2\)
    -\(2b S_{1y}\)- \(2c S_{2y}\)+\(2bc S_{12}\)
    は、\(b,c\)の変数なので、
    偏微分=0
    から求めます。

    ●\(\displaystyle \frac{\partial Q(b,c)}{\partial b}\)=0
    ●\(\displaystyle \frac{\partial Q(b,c)}{\partial c}\)=0
    から条件式を作ります。

    ●\(\displaystyle \frac{\partial Q(b,c)}{\partial b}\)
    =\(2bS_{11}-2S_{1y}+2cS_{12}\)=0
    ●\(\displaystyle \frac{\partial Q(b,c)}{\partial c}\)
    =\(2cS_{22}-2S_{2y}+2bS_{12}\)=0
    となる連立方程式ができます。

    よって、
    \(S_{11}b+S_{12}c\)=\(S_{1y}\)
    \(S_{12}b+S_{22}c\)=\(S_{2y}\)
    を満たす連立方程式から、
    傾き\(b\)=\(β_1\)、\(c\)=\(β_2\)が導出できます。

    【結論】回帰式の導出

    ●y切片 \(β_0\)の導出
    \(β_0\)=\(a\)=\(\bar{y}\)-(\(b \bar{x_1}+c \bar{x_2})\)
    から計算し、
    ●傾き\(β_1\)、\(β_2\)の導出
    \(S_{11}b+S_{12}c\)=\(S_{1y}\)
    \(S_{12}b+S_{22}c\)=\(S_{2y}\)
    を満たす連立方程式から、\(β_1\)、\(β_2\)が導出できます!

    ちゃんと、導出できましたね!一切途中経過を端折っていないので、なぞるだけでも理解が深まります!

    では、具体的な数字を使って回帰式を作ってみましょう。

    ➂【実例】回帰式を作る

    データ例

    以下のデータを使って重回帰分析の回帰式を作ってみましょう。

    x1 x2 y
    3 1 3
    2 4 4
    4 2 4
    4 5 7
    5 4 7
    6 2 5

    導出式から回帰式を計算する

    ●y切片 \(β_0\)の導出
    \(β_0\)=\(a\)=\(\bar{y}\)-(\(b \bar{x_1}+c \bar{x_2})\)
    から計算し、
    ●傾き\(β_1\)、\(β_2\)の導出
    \(S_{11}b+S_{12}c\)=\(S_{1y}\)
    \(S_{12}b+S_{22}c\)=\(S_{2y}\)
    を満たす連立方程式から、\(β_1\)、\(β_2\)が導出できます!

    なので、
    ●平均\(\bar{x_1},\bar{x_2},\bar{y}\)と
    ●平方和\(S_{11}\),\(S_{12}\),\( S_{1y}\),\( S_{22}\),\( S_{2y}\)
    を計算しましょう。結構、計算が必要ですね。
    下表に結果をまとめましょう。

    x1 x2 y A=
    \(x_1\)-\(\bar{x_1}\)
    B=
    \(x_2\)-\(\bar{x_2}\)
    C=
    \(y-\bar{y}\)
    \(A^2\)=\(S_{11}\) \(AC\)=\(S_{1y}\) \(AB\)=\(S_{12}\) \(B^2\)=\(S_{22}\) \(BC\)=\(S_{2y}\) \(C^2\)=\(S_{yy}\)
    3 1 3 -1 -2 -2 1 2 2 4 4 4
    2 4 4 -2 1 -1 4 2 -2 1 -1 1
    4 2 4 0 -1 -1 0 0 0 1 1 1
    4 5 7 0 2 2 0 0 0 4 4 4
    5 4 7 1 1 2 1 2 1 1 2 4
    6 2 5 2 -1 0 4 0 -2 1 0 0
    合計 24 18 30 0 0 0 10 6 -1 12 10 14
    平均 4 3 5 ↑\(S_{11}\) ↑\(S_{1y}\) ↑\(S_{12}\) ↑\(S_{22}\) ↑\(S_{2y}\) ↑\(S_{yy}\)

    よって、
    ●y切片 \(β_0\)の導出
    \(β_0\)=\(a\)=\(\bar{y}\)-(\(b \bar{x_1}+c \bar{x_2})\)
    から計算し、
    ●傾き\(β_1\)、\(β_2\)の導出
    \(10b-c\)=6
    \(-b+12c\)=10
    から、
    \(b=β_1\)=\(\frac{82}{119}\)
    \(c=β_2\)=\(\frac{106}{109}\)

    \(β_0\)=\(a\)=\(\bar{y}\)-(\(b \bar{x_1}+c \bar{x_2})\)
    から
    5-\(\frac{82}{119}\)×4-\(\frac{106}{109}\)×3=-\(\frac{51}{109}\)

    以上、
    \(y\)=-\(\frac{51}{109}\)+\(\frac{82}{119}x_1\)+\(\frac{106}{109}x_2\)
    =-0.429+0.689\(x_1\)+0.891\(x_2\)
    となります。

    Excelから回帰式を計算する

    関数を使って一発で出せます。

    LINEST関数を使います。下図のように、縦5マス、横3マス分を選択して、
    「=LINEST(D3:D8,B3:C8,TRUE,TRUE)」
    の関数を入力して
    「ctrl+shift」を同時に押して、「enter」すると自動計算されます。

    重回帰分析

    自動計算は一瞬でできて、下図の結果になります。

    重回帰分析

    確かに、手計算で求めた
    \(y\)=-\(\frac{51}{109}\)+\(\frac{82}{119}x_1\)+\(\frac{106}{109}x_2\)
    =-0.429+0.689\(x_1\)+0.891\(x_2\)
    と一致します。

    当然、手計算でもExcel関数からでも結果は一致します。Excel関数の方が楽チンですが、意味を理解するためにも手計算で一度解くことを勧めます。

    まとめ

    「重回帰分析の回帰式が導出できる」を解説しました。

    • ①回帰式は誤差を最小にする条件で導出
    • ➁回帰式を導出
    • ➂【実例】回帰式を作る
  • 【まとめ】単回帰分析がわかる

    【まとめ】単回帰分析がわかる

    本記事のテーマ

    【まとめ】単回帰分析がわかる
    • ①単回帰分析の重要ポイント
    • ②QCプラネッツの単回帰分析の関連ブログを紹介
    • ③QCプラネッツがまとめた単回帰分析の冊子を紹介

    解説記事、冊子に、問題集(有料)を用意しています。是非ご活用ください!

    【QC検定®1級合格】回帰分析問題集を販売します!

    QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。
    ★関連リンク★
    【QC検定®合格】「回帰分析(単回帰分析・重回帰分析)」問題集

    【ポイント】

    ①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用を演習!

    ①単回帰分析の重要ポイント

    4テーマがあり、それぞれを詳細に関連ブログや冊子で紹介します。

    • ①回帰分析の超基本
    • ➁単回帰分析の基本(相関係数、回帰直線 分散分析)
    • ➂単回帰の検定と推定
    • ➃繰返しのある単回帰分析

    単回帰分析でマスターしたい内容をQCプラネッツがすべて解説!

    1. 無相関の検定
    2. 回帰分析と相関係数の計算
    3. 相関係数が-1~1までの理由
    4. クラメールの連関係数の導出
    5. スピアマンの順位相関係数を導出
    6. スピアマンの順位相関係数とピアソンの相関係数の比較
    7. 回帰分析と実験計画法を比較
    8. 繰返しのある単回帰分析の分散分析
    9. 回帰直線の区間推定を導出
    10. 回帰母数の検定と推定
    11. 大波の相関、小波の相関、符号検定
    12. 繰返しのある単回帰分析
    13. 単回帰分析のテコ比

    ②QCプラネッツの単回帰分析の関連ブログを紹介

    それぞれの、関連リンクでご確認ください。

    1. 回帰分析と相関係数をマスターする
    2. 無相関の検定がわかる
    3. 【必読】回帰分析と相関係数は確実に点数化すべし【QC検定®2級対策】
    4. 回帰分析と相関分析の演習問題【QC検定®2級対策】
    5. 回帰母数の検定と推定がよくわかる
    6. スピアマンの順位相関係数とピアソンの相関係数を比較する
    ●商標使用について、
    ①QC検定®と品質管理検定®は、一般財団法人日本規格協会の登録商標です。
    ➁このコンテンツは、一般財団法人日本規格協会の承認や推奨、その他の検討を受けたものではありません。
    ➂QCプラネッツは、QC検定®と品質管理検定®の商標使用許可を受けています。
    1. 回帰分析と相関係数をマスターする
    2. 【必読】相関係数や寄与率が1以上にできない理由がわかる
    3. 無相関の検定がわかる
    4. 回帰分析と実験計画法の違いがよくわかる(繰返しデータ無しの場合)
    5. 【必読】回帰分析と相関係数は確実に点数化すべし【QC検定®2級対策】
    6. 回帰分析と相関分析の演習問題【QC検定®2級対策】
    7. 回帰母数の検定と推定がよくわかる
    8. 回帰直線の区間推定が導出できる(その1)
    9. 回帰直線の区間推定が導出できる(その2)
    10. 繰返しのある単回帰分析がわかる
    11. 繰返しのある単回帰分析の分散分析がよくわかる
    12. 大波の相関、小波の相関、符号検定がよくわかる
    13. スピアマンの順位相関係数が導出できる
    14. スピアマンの順位相関係数の正負の入れ替えがわかる
    15. スピアマンの順位相関係数とピアソンの相関係数を比較する
    16. (必読)クラメールの連関係数が導出できる
    17. クラメールの連関係数の値が0、1の条件がわかる
    18. 単回帰分析のテコ比がよくわかる
    ★関連リンク★
    回帰分析と相関係数をマスターする

    【ポイント】

    回帰分析の基礎をマスターしよう!
    ★関連リンク★
    無相関の検定がわかる

    【ポイント】

    無相関の意味、検定統計量の導出を解説!
    ★関連リンク★
    【必読】回帰分析と相関係数は確実に点数化すべし【QC検定®2級対策】

    【ポイント】

    QC検定®2級で必ず出題される回帰分析と相関係数の解法を解説
    ★関連リンク★
    回帰分析と相関分析の演習問題【QC検定®2級対策】

    【ポイント】

    分散分析、回帰式、無相関の検定まで10分以内に解けるための流れとテクニックを解説!
    ★関連リンク★
    回帰母数の検定と推定がよくわかる【QC検定®2級対策】

    【ポイント】

    【QC検定®1級対策】必読記事です!回帰直線の傾きとy切片の検定と区間推定を解説!
    ★関連リンク★
    スピアマンの順位相関係数とピアソンの相関係数を比較する

    【ポイント】

    【QC検定®1級対策】必読記事です!実例をあげて計算して両者の違いが一致する条件をわかりやすく解説

    ③QCプラネッツがまとめた単回帰分析の冊子を紹介

  • ③QCプラネッツがまとめた単回帰分析の冊子を紹介
  • 以前、ブログ記事としていましたが、まとめて冊子にしました。
    どれも重要なテーマなので勉強しましょう!

    No タイトル
    1 【必読】相関係数や寄与率が1以上にできない理由がわかる
    2 (必読)クラメールの連関係数が導出できる
    3 クラメールの連関係数の値が0、1の条件がわかる
    4 スピアマンの順位相関係数が導出できる
    5 スピアマンの順位相関係数の正負の入れ替えがわかる
    6 回帰分析と実験計画法の違いがよくわかる
    (繰返しデータ無しの場合)
    7 繰返しのある単回帰分析の分散分析がよくわかる
    8 回帰直線の区間推定が導出できる
    9 大波の相関、小波の相関、符号検定がよくわかる
    10 繰返しのある単回帰分析がわかる
    11 単回帰分析のテコ比がよくわかる

    ●You tube動画もごらんください。

    しっかり勉強していきましょう!

    まとめ

    「【まとめ】単回帰分析がわかる」を解説しました。

    • ①単回帰分析の重要ポイント
    • ②QCプラネッツの単回帰分析の関連ブログを紹介
    • ③QCプラネッツがまとめた単回帰分析の冊子を紹介
  • 回帰母数の検定と推定がよくわかる

    回帰母数の検定と推定がよくわかる

    「回帰母数の検定と推定がわからない」など、疑問に思いませんか?

    こういう疑問に答えます。

    本記事のテーマ

    回帰母数の検定と推定がよくわかる

    おさえておきたいポイント

    • ①回帰母数の検定・推定に必要な公式
    • ➁回帰の検定が理解できる例題
    • ➂回帰直線の傾きについての検定と推定
    • ➃回帰直線の\(y\)切片についての検定と推定
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】回帰分析問題集を販売します!

    QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。
    【QC検定®合格】「回帰分析(単回帰分析・重回帰分析)」問題集を販売します! 内容は、①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用、の5章全41題を演習できる問題集です。

    ①回帰母数の検定・推定に必要な公式

    基本は、回帰直線の推定区間の導出から得られる公式を使って解いていきます。
    理論は関連記事で確認ください。

    回帰直線の区間推定が導出できる(その1)
    回帰直線の区間推定が暗記せず、公式が導出できますか?本記事では2回に分けて導出過程をわかりやすく解説します。公式暗記に頼らず式を理解することがとても大事です。回帰分析を勉強する人は必読です。

    回帰直線の区間推定が導出できる(その2)
    回帰直線の区間推定が暗記せず、公式が導出できますか?本記事では2回に分けて導出過程をわかりやすく解説します。公式暗記に頼らず式を理解することがとても大事です。回帰分析を勉強する人は必読です。

    傾き\(a\)について

    関連記事からは、傾き\(a\)の期待値E[\(a\)]と分散V[\(a\)]は以下の式です。

    ●E[\(a\)]= \(a\)
    ●V[\(a\)]= \(\frac{σ^2}{S_{xx}}\)

    なので、これが正規分布に従うとしたら、
    傾き\(a\)は、N[\(a\)、\(\frac{σ^2}{S_{xx}}\)]
    に従うと書けますね。

    標準化して、正規分布を使った検定統計量を式にすると

    \(u\)=\(\frac{a-a_0}{\sqrt{σ^2/S_{xx}}}\)
    は正規分布N(0,\(1^2\))に従います。

    ただし、実際は\(σ^2\)を推定しないといけないので、よくt分布の直して検定と推定を行いますね。個人的には、別に正規分布のままで検定と推定してもよいと思いますけど。

    \(σ^2\)→Veに直して、 残差の自由度\(n-2\)を使って、t分布に従う検定統計量を書き直します。

    ●検定統計量\(t\)=\(\frac{a-a_0}{\sqrt{Ve/S_{xx}}}\)
    は自由度\(n-2\)のt分布に従い、
    ●区間推定は \(a\)± \(t(n-2,α)\)\(\sqrt{\frac{Ve}{S_{xx}}}\)
    から計算します。

    \(y\)切片\(b\)について

    関連記事からは、傾きy切片\(b\)の期待値E[\(b\)]と分散V[\(b\)]は以下の式です。

    ●E[\(b\)]= \(b\)
    ●V[\(b\)]=\(σ^2(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})\)

    なので、これが正規分布に従うとしたら、
    傾き\(y\)切片\(b\)は、N[\(b\)、\(σ^2(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})\)]
    に従うと書けますね。

    標準化して、正規分布を使った検定統計量を式にすると

    \(u\)=\(\frac{b-b_0}{\sqrt{σ^2(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})}}\)
    は正規分布N(0,\(1^2\))に従います。

    ただし、実際は\(σ^2\)を推定しないといけないので、よくt分布の直して検定と推定を行いますね。個人的には、別に正規分布のままで検定と推定してもよいと思いますけど。

    \(σ^2\)→Veに直して、 残差の自由度\(n-2\)を使って、t分布に従う検定統計量を書き直します。

    ●検定統計量\(t\)=\(\frac{b-b_0}{\sqrt{Ve(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})}}\)
    は自由度\(n-2\)のt分布に従い、
    ●区間推定は \(b\)± \(t(n-2,α)\)\(\sqrt{Ve(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})}\)
    から計算します。

    OKですね。では、実例を使って計算してみましょう。

    ➁回帰の検定が理解できる例題

    例題をあげましょう。

    10個のデータがあったが、再実験して下表のデータが得られた。
    元のデータにおいては、
    ●傾き\(a_0\)=1.2
    ●\(y\)切片\(b_0\)=-8
    だった。
    (1) 傾き\(a\)において、元の傾きから変化したかどうかを検定せよ。
    (2) 傾き\(a\)における信頼率95%の信頼区間を計算せよ。
    (3) \(y\)切片\(b\)において、元の\(y\)切片から変化したかどうかを検定せよ。
    (4) \(y\)切片\(b\)における信頼率95%の信頼区間を計算せよ。
    No
    1 1.3 2.4
    2 3.4 4.5
    3 5.6 3.6
    4 7.5 6.7
    5 9.1 8.9
    6 11.2 6.6
    7 13.4 14.3
    8 13.7 24.5
    9 14.2 20.8
    10 16.2 30.5
    合計 95.6 122.8

    平方和 分散分析 S Φ V データ
    Sxx 226.50 R 659.52 1 659.52 傾き\(a\) 1.7
    Syy 866.28 e 206.76 8 25.84 \(y\)切片\(b\) -4.03
    Sxy 386.50 T 866.28 9 R 0.76

    回帰分析

    では解いてみましょう。

    ➂回帰直線の傾きについての検定と推定

    傾きについての検定

    検定統計量を使って計算します。

    ●検定統計量\(t\)=\(\frac{a-a_0}{\sqrt{Ve/S_{xx}}}\)

    ●\(t\)=\(\frac{1.70-1.2}{\sqrt{25.84/226.50}}\)
    =1.50 < \(t(10-2,0.05)\)=2.306
    より、傾きが変化したとはいえないという結果になります。

    傾きについての推定

    ●区間推定は \(a\)± \(t(n-2,α)\)\(\sqrt{\frac{Ve}{S_{xx}}}\)

    ●区間推定=1.70± 2.306×\(\sqrt{\frac{25.84}{226.50}}\)
    =0.93~2.49
    となります。

    基本をしっかりおさえていれば、あとは公式代入で解けます。もちろん、理論が一番大事ですよ!

    ➃回帰直線の\(y\)切片についての検定と推定

    ●検定統計量\(t\)=\(\frac{b-b_0}{\sqrt{Ve(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})}}\)

    ●\(t\)=\(\frac{-4.03-(-8)}{\sqrt{25.84(\frac{1}{10}+\frac{\bar{9.56^2}}{226.50})}}\)
    =1.10 < \(t(10-2,0.05)\)=2.306
    より、\(y\)切片が変化したとはいえないという結果になります。

    傾きについての推定

    ●区間推定は \(b\)± \(t(n-2,α)\)\(\sqrt{Ve(\frac{1}{n}+\frac{\bar{x^2}}{S_{xx}})}\)

    ●区間推定=-4.03±2.306×\(\sqrt{25.84(\frac{1}{10}+\frac{\bar{9.56^2}}{226.50})}\)
    =-12.35~4.29
    となります。

    結構幅が広いことがわかりますね。

    難しい計算問題でしたが、ちゃんとできましたね!

    公式は導出できてから使いましょう。

    まとめ

    「回帰母数の検定と推定がよくわかる」を解説しました。

    • ①回帰母数の検定・推定に必要な公式
    • ➁回帰の検定が理解できる例題
    • ➂回帰直線の傾きについての検定と推定
    • ➃回帰直線の\(y\)切片についての検定と推定

  • スピアマンの順位相関係数とピアソンの相関係数を比較する

    スピアマンの順位相関係数とピアソンの相関係数を比較する

    「スピアマンの順位相関係数とピアソンの相関係数の違いがよくわからない」など、疑問に思いませんか?

    こういう疑問に答えます。

    本記事のテーマ

    スピアマンの順位相関係数とピアソンの相関係数を比較する

    おさえておきたいポイント

    • ➀スピアマンの順位相関係数とピアソンの相関係数を比較
    • ➁スピアマンの順位相関係数とピアソンの相関係数が一致する条件
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】回帰分析問題集を販売します!

    QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。
    【QC検定®合格】「回帰分析(単回帰分析・重回帰分析)」問題集を販売します! 内容は、①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用、の5章全41題を演習できる問題集です。

    スピアマンの順位相関係数については、特別に公式暗記する必要はありません。自分で導出できます。

    導出過程は関連記事で確認ください。

    スピアマンの順位相関係数が導出できる
    スピアマンの順位相関係数は導出できますか?本記事では、一般的に使うピアソンの相関係数からスピアマンの順位相関係数を導出します。公式暗記は不要で自力で導出できるので、マスターしましょう

    スピアマンの順位相関係数の正負の入れ替えがわかる
    スピアマンの順位相関係数では、変数の順位が降順・降順で入れ替わると相関係数の正負が入れ替わります。その理由をわかりやすく解説します。スピアマンの順位相関係数はピアソンの相関係数から計算できるので、スピアマンの順位相関係数のための公式暗記は一切不要です。

    ピアソンの相関係数と比較することで、スピアマンの順位相関係数の理解を深めましょう。大事な記事です!

    ➀スピアマンの順位相関係数とピアソンの相関係数を比較

    データを用意

    変数\(x,y\)からなる、変量データを用意します。下表のとおりです。

    No x y
    1 0.15 8.05
    2 1.2 4.05
    3 2.08 5.77
    4 2.42 11.2
    5 4.82 20.17
    6 5.93 17.21
    7 6.15 15.22
    8 6.5 18.38
    9 7.32 30.59
    10 8.45 8.99

    ピアソンの相関係数

    平方和\(S_{xx}\),\(S_{yy}\),\(S_{xy}\)を計算します。
    ●\(S_{xx}\)=\(\sum_{i=1}^{n}(x_i -\bar{x})^2\)
    ●\(S_{yy}\)=\(\sum_{i=1}^{n}(y_i -\bar{y})^2\)
    ●\(S_{xy}\)=\(\sum_{i=1}^{n}(x_i -\bar{x})(y_i-\bar{y})\)
    表を追加します。

    No x y \((x-\bar{x})^2\) \((y-\bar{y})^2\) \((x-\bar{x})(y-\bar{y})\)
    1 0.15 8.05 18.94 34.96 25.73
    2 1.2 4.05 10.9 98.27 32.73
    3 2.08 5.77 5.87 67.13 19.84
    4 2.42 11.2 4.33 7.63 5.75
    5 4.82 20.17 0.1 38.53 1.97
    6 5.93 17.21 2.04 10.54 4.64
    7 6.15 15.22 2.72 1.58 2.07
    8 6.5 18.38 3.99 19.51 8.83
    9 7.32 30.59 7.94 276.46 46.85
    10 8.45 8.99 15.59 24.73 -19.63
    合計 45.02 139.63 72.42 579.34 128.79
    平均 4.502 13.963 ↑(\(S_{xx}\)) ↑(\(S_{yy}\)) ↑(\(S_{xy}\))

    よって、ピアソンの相関係数\(r\)は、

    ピアソンの相関係数\(r\)
    \(r\)=\(\frac{S_{xy}}{\sqrt{S_{xx} S_{yy}}}\)
    =\(\frac{128.79}{\sqrt{72.42×579.34}}\)
    =0.629

    これは、簡単ですね。

    スピアマンの順位相関係数

    変数\(x,y\)の順位をつけましょう。下表のとおりに変化しますね。

    実測データ 順位
    No x y x y
    1 0.15 8.05 1 3
    2 1.2 4.05 2 1
    3 2.08 5.77 3 2
    4 2.42 11.2 4 5
    5 4.82 20.17 5 9
    6 5.93 17.21 6 7
    7 6.15 15.22 7 6
    8 6.5 18.38 8 8
    9 7.32 30.59 9 10
    10 8.45 8.99 10 4

    スピアマンの順位相関係数\(r’\)を計算します。

    関連記事から、導出式を使います。

    スピアマンの順位相関係数が導出できる
    スピアマンの順位相関係数は導出できますか?本記事では、一般的に使うピアソンの相関係数からスピアマンの順位相関係数を導出します。公式暗記は不要で自力で導出できるので、マスターしましょう

    ●スピアマンの順位相関係数
    \(r\)=1-\(\frac{6\sum_{i=1}^{n}d_i^2}{n(n^2-1)}\)
    ここで、\(d_i\)=\(x_i -y_i\)

    計算に必要なデータは下表にあります。

    No x y d=x-y d2
    1 1 3 -2 4
    2 2 1 1 1
    3 3 2 1 1
    4 4 5 -1 1
    5 5 9 -4 16
    6 6 7 -1 1
    7 7 6 1 1
    8 8 8 0 0
    9 9 10 -1 1
    10 10 4 6 36
    合計 62
    ●スピアマンの順位相関係数
    \(r\)=1-\(\frac{6\sum_{i=1}^{n}d_i^2}{n(n^2-1)}\)
    =1-\(\frac{6×62}{10(10^2-1)}\)
    =0.624

    スピアマンの順位相関係数とピアソンの相関係数を比較

    図を比較します。

    スピアマンの順位相関係数

    ●ピアソンの相関係数\(r\)=0.629
    ●スピアマンの順位相関係数=0.624
    とスピアマンの順位相関係数の方が若干小さくなりました。
    データ値によって、
    ピアソンの相関係数とスピアマンの順位相関係数の
    大小関係の入れ替えはあります。

    ➁スピアマンの順位相関係数とピアソンの相関係数が一致する条件

    では、次の疑問が沸きますよね!

    スピアマンの順位相関係数とピアソンの相関係数が一致する条件って何?
    どんなデータを用意すればいいのか?

    一致するデータを用意

    結論からいいますと、

    スピアマンの順位相関係数とピアソンの相関係数が一致する条件は、
    各データから求まるR=\(\frac{S_{xy}^2}{S_{xx}S_{yy}}\)
    が一致する場合

    そりゃそうでしょう!というオチですが、
    スピアマンの順位相関係数とピアソンの相関係数の計算式は実は同じで、
    変数データを順位データに変換しても、寄与率Rの値が変化しなければOKです。

    スピアマンの順位相関係数とピアソンの相関係数が一致する例

    いろいろ例がありますが、

    1. ピアソンの相関係数とスピアマンの順位相関係数で扱うデータ値が完全に一致する場合
    2. ピアソンの相関係数側のデータが回帰直線に完全に乗る場合(つまり相関係数=1の場合)
    3. など(他の例も見つけてみてください)

    例えば、ピアソンの相関係数側のデータが回帰直線に完全に乗る場合(つまり相関係数=1の場合)ですが、実測データが完全に回帰直線に乗る場合(例としてy=3x-1)を下表に示します。

    No x y x順位 y順位
    1 0.15 -0.55 1 1
    2 1.2 2.6 2 2
    3 2.08 5.24 3 3
    4 2.42 6.26 4 4
    5 4.82 13.46 5 5
    6 5.93 16.79 6 6
    7 6.15 17.45 7 7
    8 6.5 18.5 8 8
    9 7.32 20.96 9 9
    10 8.45 24.35 10 10
    10 8.45 24.35 10 10

    グラフに描くと、確かに両者の相関係数は一致しています。

    スピアマンの順位相関係数

    などなど、いろいろ例がありますので、調べてみましょう。

    大事なのは、ピアソンの相関係数の式からスピアマンの順位相関係数の性質が導出できます!スピアマンの順位相関係数のための公式暗記は一切不要!導出過程を理解しましょう!

    まとめ

    「スピアマンの順位相関係数とピアソンの相関係数を比較する」を解説しました。

    • ➀スピアマンの順位相関係数とピアソンの相関係数を比較
    • ➁スピアマンの順位相関係数とピアソンの相関係数が一致する条件

  • 【まとめ】信頼性工学を究める!

    【まとめ】信頼性工学を究める!

    本記事のテーマ

    【まとめ】信頼性工学を究める!
    • ①QC検定で学んだくらいでは何もわかっていないのと同じ
    • ➁信頼性工学は何を学ぶものか?
    • ➂信頼性向上が信頼性工学の目的
    • ➃信頼性工学を究めるために必要な記事の紹介
    • ⑤ブログだった32記事を冊子にまとめました!
    単なる試験対策の勉強では、
    信頼性工学なんて何もわかっていないのと同じ。
    信頼性工学の本質がわかる
    QCプラネッツ記事で勉強しましょう。

    ①QC検定で学んだくらいでは何もわかっていないのと同じ

    QC検定で学ぶ内容

    点数稼ぎやすく、落とせない信頼性工学ですよね! だから、簡単で馴染みやすいイメージが強いはずです。

    頻出パターンは大体こんな感じです。

    1. 直列・並列の系の信頼度の計算
    2. MTTF,MTBF,MTTRの公式使った計算
    3. 意味不明でもいいから信頼度の区間計算はχ2乗分布とその自由度代入に注意して解く問題
    4. 突然出て来るワイブル分布を活用した確率紙の使い方
    5. 確率紙からパラメータやB10ライフの求め方

    得点源となる信頼性工学は簡単と思いがち

    理解していなくても、公式代入や確率紙の使い方を暗記すれば点数は稼げるし、QC検定1級も合格できます。

    でも、何もわかっていないのと同じ

    でも、そんな問題は
    お子ちゃまレベル!
    信頼性工学ってそんなに甘くないし
    ちゃんと理論を理解しましょう!
    信頼性向上で品質改善、業績向上につながる大事な理論です!

    QCプラネッツの思い

    過去の良書をかき集め、信頼性工学のプロとしても十分通用する大事なエッセンスを50記事にして解説しました!
    試験対策はもちろん、仕事しても、プロとしても十分通用できるレベルになれます!

    苦労して学んで得た、皆に伝えたいエッセンスを記事で解説しています。

    ➁信頼性工学は何を学ぶものか?

    関連記事の紹介の前に、全部ガチで勉強した結果、

    信頼性工学は何を学ぶものか?

    の結論を述べます。

    1. 信頼度向上(故障しにくく)する工夫とその効果が知りたい
    2. 信頼度を評価するパラメータを活用したい
    3. 信頼度を評価するための数学を駆使する
    4. QC検定合格したい(本質ではない)

    つまり、

    1. 使っている製品の寿命を評価し、延伸できる方法を考えたい
    2. 寿命を計算で求めたい
    3. 寿命計算できるための数学力が前提
    4. 公式暗記して問題が解ける(本質ではない)

    とわかりました。

    そこで、まとめのブログ記事として以下を紹介しています。

    1. 【信頼性工学】確率密度関数がわかる(指数関数)
    2. 【信頼性工学】確率密度関数がわかる(正規分布)
    3. 【信頼性工学】ワイブル分布がわかる
    4. 対数正規分布がよくわかる
    5. 【必読】寿命計算の信頼区間にχ2乗分布を使う理由がよくわかる
    6. 信頼度の点推定と区間推定がわかる(ワイブル分布)
    7. 【必読】指数分布とポアソン分布の関係がよくわかる
    8. 直列系の信頼性・故障率がよくわかる
    9. 並列系の信頼性・故障率がよくわかる
    10. 多数決系の信頼性・故障率がわかる
    11. 【必読】MTBF,MTTFの点推定と推定区間の式がよくわかる
    12. 信頼性における抜取検査はポアソン分布を使う理由がわかる
    13. 正規確率紙がよくわかる
    14. スタージェスの公式がよくわかる
    15. 対数正規確率紙がよくわかる
    16. メジアンランク法がよくわかる
    17. ミーンランク法がよくわかる
    18. ワイブル確率紙がよくわかるし、自分で作れる!(その1)
    19. ワイブル確率紙がよくわかるし、自分で作れる!(その2)
    20. 累積ハザード法がよくわかるし、自分で作れる!
    21. ワイブル確率紙と累積ハザード法の違いがよくわかる
    22. 【まとめ】信頼性工学を究める!

    なので、QC検定対策のための記事はありませんが、本質を解説した記事なので、試験は楽勝に合格できる内容です。

    今回は、
    【まとめ】信頼性工学を究める!

    この記事にリンク先はすべてのQCプラネッツ信頼性工学の記事につながっています!

    ➂信頼性向上が信頼性工学の目的

    信頼性工学を学ぶ目的は?

    単体の信頼性モデルや、数式が難解なため、単体モデルを考えるだけでもハードです。
    だから、

    信頼性工学を学ぶ目的が見失いがち

    さらに、教科書の章立てやページも、説明しやすさを優先するので、信頼性工学を学ぶ目的や目標が見えにくいです。むしろ、手前の数式とかでくじけやすい!

    信頼性工学を学ぶ目的は
    信頼性を向上させる方法を学ぶ!
    つまり、壊れにくい系を考え、数量評価すること!
    信頼性工学を学ぶ目的のために
    基礎となる確率、数学、統計の勉強
    単体の信頼性の評価
    が身に着けておく必要がある!
    信頼性工学に関する本、データをかき集めてファンダメンタルな理論をわかりやすく解説します!

    なお、半導体や電子部品などの実例を解説した本などありますが、どの分野でも自分で考えた確率分布を用いて信頼性評価したいので、ここの解説は省いています。

    QCプラネッツ信頼性工学の記事は50あります。結構ボリュームありますので、じっくり読み進めてください。

    ➃信頼性工学を究めるために必要な記事の紹介

    上から関連記事を読むと理解が進みますが、もちろん読みたい所からでもOKです。

    【信頼性工学】確率密度関数がわかる(指数関数)

    信頼性工学 信頼性工学は自力で説明や式の導出ができますか?公式や内容を暗記しやすい内容ですが、理論は意外と難しい信頼性工学。本記事では数式やモデルを理解しながら大事な信頼性工学を解説していきます。きちっと信頼性工学を勉強したい人は必読です。

    【信頼性工学】確率密度関数がわかる(正規分布)

    信頼性工学_正規分布 信頼性工学は自力で説明や式の導出ができますか?公式や内容を暗記しやすい内容ですが、理論は意外と難しい信頼性工学。本記事ではストレスストリングスモデルを使った正規分布型の関数を解説します。きちっと信頼性工学を勉強したい人は必読です。

    【信頼性工学】ワイブル分布がわかる

    信頼性工学_ワイブル分布 信頼性工学は自力で説明や式の導出ができますか?公式や内容を暗記しやすい内容ですが、理論は意外と難しい信頼性工学。本記事ではワイブル分布の導出や、ワイブル分布の確率密度関数の期待値と分散を導出過程を端折らず解説!。きちっと信頼性工学を勉強したい人は必読です。

    対数正規分布がよくわかる

    信頼性工学_対数正規分布 信頼性工学で使う対数正規分布が説明できますか? 本記事では、正規分布から対数正規分布を導出し、期待値・分散、故障率の変化をわかりやすく解説します。信頼性工学をマスターしたい方は必読です。

    【必読】寿命計算の信頼区間にχ2乗分布を使う理由がよくわかる

    信頼性工学_寿命区間 指数分布に従う製品の寿命の信頼区間を計算するのに、何で自由度倍のχ2乗分布を使うか理由がわかりますか?本記事では理由を丁寧に解説します。単なる公式暗記ではなく、理由を理解することが大事です

    信頼度の点推定と区間推定がわかる(ワイブル分布)

    信頼性工学_ワイブル分布_点推定と区間推定 信頼度の点推定と区間推定が計算できますか。本記事ではワイブル分布における点推定と区間推定をわかりやすく解説します。信頼性工学を勉強したい方は必読です。

    【必読】指数分布とポアソン分布の関係がよくわかる

    信頼性工学_ポアソン分布と指数分布の関係 信頼性工学で扱う指数分布とポアソン分布の関係が説明不足できますか?本記事では、数式を使って両者の関係を導出します。丸暗記せず導出を理解しましょう。

    直列系の信頼性・故障率がよくわかる

    信頼性工学_直列系 直列系の信頼度、故障率、平均寿命は計算できますか。本記事では、わかりやすく解説しています。基本的な内容ですが、信頼度、確率密度関数、MTTFの導出式を理解して、並列系、待機系、多数決系の応用パターンも理解していきましょう。

    並列系の信頼性・故障率がよくわかる

    信頼性工学_並列系 並列系の信頼度、故障率、平均寿命は計算できますか。本記事では、わかりやすく解説しています。基本的な内容ですが、信頼度、確率密度関数、MTTFの導出式を理解して、待機系、多数決系の応用パターンも理解していきましょう。

    多数決系の信頼性・故障率がわかる

    信頼性工学_多数決系 多数決系の信頼度、故障率、平均寿命は計算できますか。本記事では、わかりやすく解説しています。基本的な内容ですが、信頼度、確率密度関数、MTTFの導出式を理解して、多数決系、並列系、待機系の平均寿命の違いが理解できます。

    【必読】MTBF,MTTFの点推定と推定区間の式がよくわかる

    信頼性工学MTTF_MTBF_MTTR MTBF,MTTFの点推定と推定区間の式を無理に暗記していませんか?本記事では、点推定と推定区間の式を導出解説します。定時打切り、定数打切りで自由度が異なったり、変数2Tや自由度2nと2倍を使う理由をわかりやすく解説します。必読です!

    信頼性における抜取検査はポアソン分布を使う理由がわかる

    信頼性工学_抜取検査_ポアソン分布を使う理由 信頼性でも抜取検査することがありますが、なぜポアソン分布型を使うのか説明できますか?本記事では指数分布で信頼性を定義したものをポアソン分布の抜取検査を使ってよい理由を、数式で導出します。導出過程があるのはQCプラネッツだけです。必読です!

    正規確率紙がよくわかる

    信頼性工学_正規確率紙 正規確率紙の使い方や理論を解説します。Excelで済むので、今は不要ですが、平均ランク法や順序統計量、度数分布表などの信頼性工学に必要なエッセンスが詰まっています。信頼性工学を学ぶ方は必読です。

    スタージェスの公式がよくわかる

    信頼性工学_スタージェスの公式 ヒストグラムの区分数を考える1つの方法として、スタージェスの公式を解説します。信頼性工学ではヒストグラムをよく使いますので、紹介します。

    対数正規確率紙がよくわかる

    信頼性工学_対数正規確率紙 対数正規確率紙の使い方や、対数正規分布の平均・分散、メジアンランク法の使い方を解説します。ヒストグラムから対数正規確率紙を使って平均・分散導出する過程を丁寧に解説! 必読です!

    メジアンランク法がよくわかる

    信頼性工学_メジアンランク メジアンランク法は説明できますか? 本記事では順序統計量をベースにメジアンランク法をわかりやすく解説し、実際に解析しながら、公式の理解が深める事ができます。信頼性工学を学ぶ人は必読です。

    ミーンランク法がよくわかる

    信頼性工学_ミーンランク法 ミーンランク法を解説します。ミーンランク法の活用方法や、公式の導出、メジアンランク法との違いをわかりやすく解説!信頼性工学・統計学を学ぶ方は必読です。

    ワイブル確率紙がよくわかるし、自分で作れる!(その1)

    信頼性工学_ワイブル確率紙1 ワイブル確率紙は使えますか? ワイブル確率紙の目的を理解して、ワイブル確率紙に頼らず自分で解析できますか? 本記事は、ワイブル確率紙を使うために必要なエッセンスをわかりやすく解説します。信頼性工学を学ぶ人は必読です。

    ワイブル確率紙がよくわかるし、自分で作れる!(その2)

    信頼性工学_ワイブル確率紙2 ワイブル確率紙は使えますか? ワイブル確率紙の目的を理解して、ワイブル確率紙に頼らず自分で解析できますか?本記事は、ワイブル確率紙を使うために必要なエッセンスをわかりやすく解説します。指数分布とワイブル分布について確率紙を使った事例を解説!信頼性工学を学ぶ人は必読です。

    累積ハザード法がよくわかるし、自分で作れる!

    信頼性工学_累積ハザード法1 累積ハザード法を使って、信頼度が計算できますか? 本記事は、累積ハザード法を使ったワイブル分布のフィッティングをわかりやすく解説します。確率紙を使わずに、簡単なグラフから求めるコツを伝授します! 信頼性工学を学ぶ人は必読です。

    ワイブル確率紙と累積ハザード法の違いがよくわかる

    信頼性工学_ワイブル確率紙と累積ハザード法の違い ワイブル確率紙と累積ハザード法の違いや、使い分けが説明できますか?本記事では、ワイブル確率紙と累積ハザード法の使い分けをわかりやすく解説します。信頼性工学を学ぶ人は必読です。

    ⑤ブログだった32記事を冊子にまとめました!

    以前、ブログ解説していましたが、1つのPDFにまとめました。勉強に役立ててください。

    No 題名
    1 【信頼性工学】ガンマ分布がわかる
    2 【信頼性工学】二項正規分布がわかる
    3 【必読】ワイブル分布の寿命計算なのにχ2乗分布を使う理由がよくわかる
    4 信頼度の点推定と区間推定がわかる(指数分布)
    5 信頼度の点推定と区間推定がわかる(正規分布)
    6 信頼度の推定方法がわかる(寿命分布なし、区間分け有、打切り無しの場合)
    7 信頼度の推定方法がわかる(寿命分布なし、区間分け有、打切り有りの場合)
    8 待機系の信頼性・故障率がよくわかる
    9 待機系の冷予備系の信頼性・故障率がわかる
    10 待機系の温予備系の信頼性・故障率がわかる
    11 待機系の熱予備系の信頼性・故障率がわかる
    12 要素の故障が非独立な系の信頼性がわかる(非修理系)
    13 要素の故障が非独立な系の信頼性がわかる(完全修理系)
    14 要素の故障が非独立な系の信頼性がわかる(不完全修理系)
    15 【必読】MTTF,MTBFとMTTRが導出できる
    16 【必読】アベイラビリティがよくわかる
    17 並列系のアベイラビリティがよくわかる
    18 直列系のアベイラビリティがよくわかる
    19 並列系のアベイラビリティがよくわかる(修理系の一部が無い場合)
    20 信頼性工学がよくわかる(離散系と連続系まとめて理解できる)
    21 信頼性工学ができる(離散系と連続系まとめて演習)
    22 カプランマイヤー法が理解できる
    23 打切りデータがある場合の信頼度の計算がわかる
    24 ヒストグラムから信頼度が計算できる
    25 信頼性(指数分布)における計数抜取検査がよくわかる
    26 信頼性(指数分布)における計量抜取検査がよくわかる
    27 信頼性(指数分布)における逐次抜取検査がよくわかる
    28 一様分布のメジアンランク法がよくわかる
    29 カプランマイヤー法と累積ハザード法の違いがよくわかる
    30 直列モデルを使った累積ハザード法がよくわかる
    31 (カプランマイヤー法)グリーンウッドの公式導出がわかる
    32 信頼性工学に使う経験分布関数がわかる

    内容は以下です。応用レベルをわかりやすく解説しています。97ページあります。

    この記事を読めば、信頼性工学は究めたと言って過言ではありません!

    まとめ

    「【まとめ】信頼性工学を究める!」を解説しました。

    • ①QC検定で学んだくらいでは何もわかっていないのと同じ
    • ➁信頼性工学は何を学ぶものか?
    • ➂信頼性向上が信頼性工学の目的
    • ➃信頼性工学を究めるために必要な記事の紹介
    • ⑤ブログだった32記事を冊子にまとめました!

  • ワイブル確率紙と累積ハザード法の違いがよくわかる

    ワイブル確率紙と累積ハザード法の違いがよくわかる

    「ワイブル確率紙と累積ハザード法の違いがよくわからない」、と困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    ワイブル確率紙と累積ハザード法の違いがよくわかる
    • ①累積ハザード法の基礎を理解する
    • ➁ワイブル確率紙と累積ハザード法の違いを理解する
    • ➂同じ問題をワイブル確率紙と累積ハザード法それぞれで解いてみる
    • ➃打切りが無い場合は、両者は同等の結果になる
    • ➄打切りが無い場合は、両者の結果に差が出る
    累積ハザード法がわかると、
    ワイブル確率紙と累積ハザード法の違いは何か?
    カプランマイヤー法と累積ハザード法の違い何か?
    がわからなくなるので解説します!
    [themoneytizer id=”105233-2″]

    本物の「信頼性工学」問題集を販売します!

    QC検定®1級合格したい方、本物の信頼性工学を学びたい方におススメです。
    【QC検定®合格】「信頼性工学」問題集を販売します! ①QC検定®頻出問題、➁確率分布と順序統計量、➂各確率分布における故障率、➃点推定と区間推定、➄直列系、並列系、待機系、多数決系、⑥独立系と非独立系、⑦アベイラビリティ、⑧確率紙、⑨打切りデータ、⑩信頼性工学と抜取検査の組合せ、10章全54題。しっかり勉強しましょう。

    ①累積ハザード法の基礎を理解する

    まずは、関連記事を読んでください。この記事をベースに本記事は解説しています。

    累積ハザード法がよくわかるし、自分で作れる!
    累積ハザード法を使って、信頼度が計算できますか? 本記事は、累積ハザード法を使ったワイブル分布のフィッティングをわかりやすく解説します。確率紙を使わずに、簡単なグラフから求めるコツを伝授します! 信頼性工学を学ぶ人は必読です。

    ➁ワイブル確率紙と累積ハザード法の違いを理解する

    違いは何か?

    図のように同じような確率紙を使って、パラメータの値を求めます。
    違いはわかりますか?

    累積ハザード法

    ワイブル確率紙と累積ハザード法の違いは打切りデータを考慮できるかどうかの違い

    つまり、

    打切りデータが無い場合は、ほぼ同じ結果になるが、
    打切りデータが有る場合は、
    ワイブル確率紙の方は、打切りしない(故障した)データとして扱い
    累積ハザード法は打切りデータとして扱えるため、
    ワイブル確率紙の方が厳し目の結果になってしまう。

    という違いが出ます。

    実際に例題を使って比較しましょう。
    ワイブル確率紙と累積ハザード法の違いをまとめた記事はQCプラネッツだけ!

    ➂同じ問題をワイブル確率紙と累積ハザード法それぞれで解いてみる

    例題

    関連記事にもある、例題を使ってみましょう。

    サンプル番号 1 2 3 4 5
    時間t 800 350 730 1770 390
    サンプル番号 6 7 8 9 10
    時間t 110 100 160 940 320
    サンプル番号 11 12 13 14 15
    時間t 40 190 590 1260 420
    サンプル番号 16 17 18 19 20
    時間t 250 490 1060 290 630

    【問】
    上の表データを
    (1)ワイブル確率紙
    (2)累積ハザード法
    それぞれの手法で、ワイブル分布にフィッティングした場合の定数を求めよ。
    (注)
    (ここで、ワイブル分布\(R(t)\)=\(exp^{-H(t)}\)において、
    \(H(t)\)=\((\frac{t}{η})^m\)から
    \(log(H(t)\)=\(m(log(t)-log(η))\)として
    定数\(m\)、\(η\)を求めること

    手法、確率分布によらず、順序統計量に従って、データを小さい順に並べ替える

    下表のようになります。これは、ワイブル確率紙、累積ハザード法両方とも同じです。

    サンプル番号 1 2 3 4 5
    時間t 40 100 110 160 190
    サンプル番号 6 7 8 9 10
    時間t 250 290 320 350 390
    サンプル番号 11 12 13 14 15
    時間t 420 490 590 630 730
    サンプル番号 16 17 18 19 20
    時間t 800 940 1060 1260 1770

    ➃打切りが無い場合は、両者は同等の結果になる

    まず、打切りが無い場合を解いてみましょう。

    ワイブル確率紙

    確率を順序統計量に従って、メディアンランク法から計算します。これについては、関連記事で確認ください。

    メジアンランク法がよくわかる
    メジアンランク法は説明できますか? 本記事では順序統計量をベースにメジアンランク法をわかりやすく解説し、実際に解析しながら、公式の理解が深める事ができます。信頼性工学を学ぶ人は必読です。

    確率F= \(\frac{i-0.3}{n+0.4}\)という式をメディアンランク法から使いますが、公式の導出過程を関連記事で確認してください。

    結果を表にまとめると、

    i data F=\(\frac{i-0.3}{n+0.4}\) R=1-F X(=log(data)) Y(=ln(ln(1/R))
    1 40 0.034 0.966 3.689 -3.355
    2 100 0.083 0.917 4.606 -2.442
    3 110 0.132 0.868 4.701 -1.952
    4 160 0.181 0.819 5.076 -1.609
    5 190 0.23 0.77 5.248 -1.34
    6 250 0.279 0.721 5.522 -1.116
    7 290 0.328 0.672 5.67 -0.921
    8 320 0.377 0.623 5.769 -0.747
    9 350 0.426 0.574 5.859 -0.587
    10 390 0.475 0.525 5.967 -0.438
    11 420 0.525 0.475 6.041 -0.296
    12 490 0.574 0.426 6.195 -0.16
    13 590 0.623 0.377 6.381 -0.026
    14 630 0.672 0.328 6.446 0.108
    15 730 0.721 0.279 6.594 0.243
    16 800 0.77 0.23 6.685 0.384
    17 940 0.819 0.181 6.847 0.535
    18 1060 0.868 0.132 6.967 0.704
    19 1260 0.917 0.083 7.14 0.91
    20 1770 0.966 0.034 7.48 1.216

    ワイブル確率は、上表のX(=log(data))とY(=ln(ln(1/R))の直線グラフから定数\(m\)、\(η\)を求めます。グラフは下図になります。

    ワイブル確率紙

    結果は、
    \(m\)=直線の傾きより=1.233
    \(η\)=593.02
    (\(η\)は y切片 \(m(log(η))\)=7.8706から算出)
    となります。

    累積ハザード法

    累積ハザード法がよくわかるし、自分で作れる!
    累積ハザード法を使って、信頼度が計算できますか? 本記事は、累積ハザード法を使ったワイブル分布のフィッティングをわかりやすく解説します。確率紙を使わずに、簡単なグラフから求めるコツを伝授します! 信頼性工学を学ぶ人は必読です。

    累積ハザードを計算すると、下表になります。

    順位i
    (B)
    逆順位K=n-i+1
    (n=20)
    (C)
    時間ti
    (D)
    打切り有無
    ○⇒0
    ×⇒1
    不良率hi
    1/(逆順位) ×100%
    (E)
    累積ハザード値Hi
    ∑hi
    (F)
    1 20 40 1 1/20 1/20=0.05
    2 19 100 1 1/19 1/20+1/19=0.103
    3 18 110 1 1/18 1/20+1/19+1/18
    =0.158
    4 17 160 1 1/17 0.217
    5 16 190 1 1/16 0.28
    6 15 250 1 1/15 0.346
    7 14 290 1 1/14 0.418
    8 13 320 1 1/13 0.495
    9 12 350 1 1/12 0.578
    10 11 390 1 1/11 0.669
    11 10 420 1 1/10 0.769
    12 9 490 1 1/9 0.88
    13 8 590 1 1/8 1.005
    14 7 630 1 1/7 1.148
    15 6 730 1 1/6 1.314
    16 5 800 1 1/5 1.514
    17 4 940 1 1/4 1.764
    18 3 1060 1 1/3 2.098
    19 2 1260 1 1/2 2.598
    20 1 1770 1 1/1 1/20+1/19+1/18
    +…+1/2+1/1
    =3.598

    累積ハザード法を直線グラフにするために、上の表の色枠をつけた、時間log(ti)
    と、累積ハザード値log(Hi)を使って、下表にまとめます。

    順位i
    (B)
    t H(t) log(t) log(H(t)
    1 800 0.05 3.689 -2.996
    2 350 0.103 4.606 -2.277
    3 730 0.158 4.701 -1.844
    4 1770 0.217 5.076 -1.528
    5 390 0.28 5.248 -1.275
    6 110 0.346 5.522 -1.061
    7 100 0.418 5.67 -0.873
    8 160 0.495 5.769 -0.704
    9 940 0.578 5.859 -0.548
    10 320 0.669 5.967 -0.402
    11 40 0.769 6.041 -0.263
    12 190 0.88 6.195 -0.128
    13 590 1.005 6.381 0.005
    14 1260 1.148 6.446 0.138
    15 420 1.314 6.594 0.273
    16 250 1.514 6.685 0.415
    17 490 1.764 6.847 0.568
    18 1060 2.098 6.967 0.741
    19 290 2.598 7.14 0.955
    20 630 3.598 7.48 1.28

    結果をグラフにまとめると

    累積ハザード法

    結果は、
    \(m\)=直線の傾きより=1.173
    \(η\)=580.24
    (\(η\)は y切片 \(m(log(η)\))=7.4461から算出)
    となります。

    ワイブル確率紙と累積ハザード法を比較

    結果は、

    ワイブル確率紙 累積ハザード法
    \(m\) 1.233 1.173
    \(η\) 593.02 580.24
    ワイブル確率紙でも累積ハザード法でもほぼ同じ結果が出ました!

    グラフでも比較すると、

    累積ハザード法

    打切りデータが無い場合は、ほぼ同じ結果になることがわかりました。

    では、次に、打切りデータが有る場合に、両者の結果に差が出るか確認しましょう。

    ➄打切りが無い場合は、両者の結果に差が出る

    データに打切り有無を追加

    関連記事にもある、例題を使ってみましょう。

    未故障だったデータ、つまり打切りデータある場合は(○)
    故障したデータ、つまり打切りしなかったデータは(×)と表記します。
    サンプル番号 1 2 3 4 5
    時間t 800(○) 350(×) 730(×) 1770(○) 390(×)
    サンプル番号 6 7 8 9 10
    時間t 110(○) 100(×) 160(×) 940(×) 320(×)
    サンプル番号 11 12 13 14 15
    時間t 40(×) 190(×) 590(×) 1260(○) 420(×)
    サンプル番号 16 17 18 19 20
    時間t 250(×) 490(×) 1060(○) 290(×) 630(○)

    【問】
    上の表データを
    (1)ワイブル確率紙
    (2)累積ハザード法
    それぞれの手法で、ワイブル分布にフィッティングした場合の定数を求めよ。
    (注)
    (ここで、ワイブル分布\(R(t)\)=\(exp^{-H(t)}\)において、
    \(H(t)\)=\((\frac{t}{η})^m\)から
    \(log(H(t)\)=\(m(log(t)-log(η))\)として
    定数\(m\)、\(η\)を求めること

    手法、確率分布によらず、順序統計量に従って、データを小さい順に並べ替える

    これは、ワイブル確率紙、累積ハザード法両方とも同じで、打切りデータ有無に関係ありません。同じ表なので、割愛します。

    < h3>ワイブル確率紙

    ワイブル確率紙においては、打切りデータある場合の対処がないため、打切りデータが無い場合と同じ結果になります。

    結果を表にまとめると、

    ワイブル確率は、上表のX(=log(data))とY(=ln(ln(1/R))の直線グラフから定数\(m\)、\(η\)を求めます。グラフは下図になります。

    ワイブル確率紙

    結果は、
    \(m\)=直線の傾きより=1.233
    \(η\)=593.02
    (\(η\)は y切片 \(m(log(η)\))=7.8706から算出)
    となります。

    累積ハザード法

    累積ハザードを計算すると、下表になります。

    順位i
    (B)
    逆順位K=n-i+1
    (n=20)
    (C)
    時間ti
    (D)
    打切り有無
    ○⇒0
    ×⇒1
    不良率hi
    1/(逆順位) ×100%
    (E)
    累積ハザード値Hi
    ∑hi
    (F)
    1 20 40 0 0/20
    2 19 100 1 1/19 0/20+1/19=0.053
    3 18 110 1 1/18 0/20+1/19+1/18=0.108
    4 17 160 0 0/17 0.108
    5 16 190 1 1/16 0.171
    6 15 250 0 0/15 0.171
    7 14 290 1 1/14 0.242
    8 13 320 1 1/13 0.319
    9 12 350 1 1/12 0.402
    10 11 390 1 1/11 0.493
    11 10 420 1 1/10 0.593
    12 9 490 1 1/9 0.704
    13 8 590 1 1/8 0.829
    14 7 630 0 0/7 0.829
    15 6 730 1 1/6 0.996
    16 5 800 1 1/5 1.196
    17 4 940 1 1/4 1.446
    18 3 1060 0 0/3 1.446
    19 2 1260 1 1/2 1.946
    20 1 1770 0 0/1 0/20+1/19+1/18+…+0/3+1/2+0/1=1.946

    累積ハザード法を直線グラフにするために、上の表の色枠をつけた、時間log(ti)
    と、累積ハザード値log(Hi)を使って、下表にまとめます。

    ちなみに、打切り無しのデータを下表の右側にも参考で載せます。打切り有無でデータが変わっているのが分かりますね。

    log(t) log(H(t) log(H(t)
    (打切り無し)
    3.689 -2.996
    4.606 -2.945 -2.277
    4.701 -2.224 -1.844
    5.076 -2.224 -1.528
    5.248 -1.768 -1.275
    5.522 -1.768 -1.061
    5.67 -1.418 -0.873
    5.769 -1.143 -0.704
    5.859 -0.91 -0.548
    5.967 -0.707 -0.402
    6.041 -0.522 -0.263
    6.195 -0.35 -0.128
    6.381 -0.187 0.005
    6.446 -0.187 0.138
    6.594 -0.004 0.273
    6.685 0.179 0.415
    6.847 0.369 0.568
    6.967 0.369 0.741
    7.14 0.666 0.955
    7.48 0.666 1.28

    結果をグラフにまとめると

    累積ハザード法

    結果は、
    \(m\)=直線の傾きより=0.7965
    \(η\)=924.42
    (\(η\)は y切片 \(m(log(η)\))=5.4401から算出)
    となります。

    ワイブル確率紙と累積ハザード法を比較

    結果は、

    ワイブル確率紙 累積ハザード法
    \(m\) 1.233 0.7965
    \(η\) 593.02 924.42
    ワイブル確率紙でも累積ハザード法で、結果に差が出ました。
    mは累積ハザード法の方が低くでました。
    打切り有(未故障)データがあるので、寿命は長くなるはずだから、妥当な結果ですよね。
    ηは累積ハザード法の方が長くでました。
    打切り有(未故障)データがあるので、寿命は長くなるはずだから、妥当な結果ですよね。

    グラフでも比較すると、

    累積ハザード法

    打切りデータがあると、ワイブル確率紙は寿命が短いという厳しい評価をするために、累積ハザード法を使う必要があることがよくわかりますね。

    まとめ

    「ワイブル確率紙と累積ハザード法の違いがよくわかる」を解説しました。

    • ①累積ハザード法の基礎を理解する
    • ➁ワイブル確率紙と累積ハザード法の違いを理解する
    • ➂同じ問題をワイブル確率紙と累積ハザード法それぞれで解いてみる
    • ➃打切りが無い場合は、両者は同等の結果になる
    • ➄打切りが無い場合は、両者の結果に差が出る

  • 累積ハザード法がよくわかるし、自分で作れる!

    累積ハザード法がよくわかるし、自分で作れる!

    「累積ハザード法がよくわからない」、と困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    累積ハザード法がよくわかるし、自分で作れる!
    • ①ワイブル確率紙と累積ハザード法の違いを理解する
    • ➁指数分布を確率紙で考える
    • ➂カプランマイヤー法、ワイブル確率紙、累積ハザード法の違いを理解する(その2へ)
    累積ハザード法も自分でグラフ描いてフィッティングできます
    [themoneytizer id=”105233-2″]

    本物の「信頼性工学」問題集を販売します!

    QC検定®1級合格したい方、本物の信頼性工学を学びたい方におススメです。
    【QC検定®合格】「信頼性工学」問題集を販売します! ①QC検定®頻出問題、➁確率分布と順序統計量、➂各確率分布における故障率、➃点推定と区間推定、➄直列系、並列系、待機系、多数決系、⑥独立系と非独立系、⑦アベイラビリティ、⑧確率紙、⑨打切りデータ、⑩信頼性工学と抜取検査の組合せ、10章全54題。しっかり勉強しましょう。

    ①ワイブル確率紙と累積ハザード法の違いを理解する

    累積ハザード法とは

    「累積ハザード法」単体で説明されることが多いですが、

    ワイブル確率紙と累積ハザード法の違いが最後までわからないはずなので、違いがわかるように最初から書きます。
    累積ハザード法とは、未故障データ(打切りデータ)を打切りデータとして扱ってよい手法

    ワイブル確率紙と累積ハザード法の違いを理解する

    ワイブル確率紙と累積ハザード法の違いは、教科書的には、

    ワイブル確率紙とは、未故障データ(打切りデータ)を故障データとみなして扱う手法(打切りデータそのものは扱えない)
    累積ハザード法とは、未故障データ(打切りデータ)を打切りデータとして扱ってよい手法(打切りデータそのもの扱える)

    QCプラネッツ、個人的には、どちらでも差はないとみています。
    フィッティングして求める手法であり、精度もそれほど高いものでもないからです。
    モデルで故障時間を推定しても、本当にその時間で故障するかなんてわからんし、おまじない程度です。

    大事なのは、違いを理解することです!理解せずにやり方だけ知っているとならないよう注意しましょう。

    ➁累積ハザード法の使い方がわかる

    ハザード関数、累積ハザード関数とは

    信頼度\(R(t)\)を
    ●\(R(t)\)=\(exp(-\displaystyle \int_{0}^{t} λ(t)dt)\)
    ここで、
    ●\(R(t)\)=\(exp(-H(t)\)
    \(H(t)\)=\( \displaystyle \int_{0}^{t} λ(t)dt \)
    とおくと、

    ●\(λ(t)dt \)をハザード関数
    ●\(H(t)\)=\( \displaystyle \int_{0}^{t} λ(t)dt \)を累積ハザード関数
    と定義します。

    累積ハザードでは、実データをもとに、ハザード関数、累積ハザード関数を使います。
    実際は、

    ●\(λ(t)dt \)=\(\frac{(t_i,t_i+Δt)における故障数}{t_iの直前における未故障データ数}\)
    ●\(H(t)\)=\( \sum_{i=1}^{l} \frac{(t_i,t_i+Δt)における故障数}{t_iの直前における未故障データ数}\)
    とて計算します。

    【ここを理解せよ!】ハザード関数、累積ハザード関数を使う理由

    ここで、大事なのは、

    ●\(λ(t)dt \)をハザード関数
    ●\(H(t)\)=\( \displaystyle \int_{0}^{t} λ(t)dt \)を累積ハザード関数
    は、未故障データ(打切りデータ)を打切りデータとして扱ってよい手法(打切りデータそのもの扱える)ことです。
    これがわからないと、何でワイブル確率紙じゃダメなの?と理解できない!
    ここを教科書では説明していない!

    【ここを理解せよ!】ハザード関数、累積ハザード関数を使う理由

    関連記事の「カプランマイヤー法」という全く別の手法の解説にヒントがあります。

    カプランマイヤー法が理解できる(その2)
    信頼性工学で「打切りデータ」を扱う際、カプランマイヤー法を使いますが、カプランマイヤーの式は導出できますか? 本記事では、公式暗記しがちなカプランマイヤーの式を丁寧に導出します。信頼性工学を学ぶ人は必読です。

    ハザード関数がポイント!

    ●ハザード関数
    \(λ(t)\)= \( \displaystyle \lim_{Δt \to 0} \frac{1}{Δt}\)\((Pr(t \leq T \leq t+Δt|T \geq t)) \)

    ここで、2つの独立した確率分布T,Uを用意します。
    ●T:生存時間確率分布(打切りなし)
    ●U:打切り時間確率分布(打切りあり)

    「打切りデータ」も考慮できるポイントは、
    条件付き確率で、打切りなしの確率Tに、打切りなしの確率Uの式を分母分子に掛け算して整理すると、合成することができる!
    つまり、 打切りあり、なしを区別しても合成してハザード関数が扱える性質を活かして、累積ハザード法を使っている点を理解しましょう。

    実例を使って累積ハザード法の使い方をマスターする

    では、データを用意します。

    サンプル番号 1 2 3 4 5
    時間t 800(○) 350(×) 730(×) 1770(○) 390(×)
    サンプル番号 6 7 8 9 10
    時間t 110(○) 100(×) 160(×) 940(×) 320(×)
    サンプル番号 11 12 13 14 15
    時間t 40(×) 190(×) 590(×) 1260(○) 420(×)
    サンプル番号 16 17 18 19 20
    時間t 250(×) 490(×) 1060(○) 290(×) 630(○)

    累積ハザード法を使って、信頼度関数を作ってみましょう。ただし、上の○×は
    ○:故障無しで打切り有データ
    ×:故障有りデータ
    として、打切り有無両方のケースを含むとします。

    累積ハザード法を使って、信頼度関数を作る

    下ごしらえをします。

    1. 不良率λを計算するために、逆順位K=n-i+1を計算
    2. 不良率λは、逆順位Kの逆数
    3. 累積ハザードHiを計算
    サンプル
    番号
    (A)
    順位i
    (B)
    逆順位
    K=n-i+1
    (n=20)
    (C)
    時間ti
    (D)
    打切り
    有無
    ○⇒0
    ×⇒1
    不良率hi
    1/(逆順位) ×100%
    (E)
    累積ハザード値Hi
    ∑hi
    (F)
    11 1 20 40 0 0/20 0/20=0
    7 2 19 100 1 1/19 0/20+1/19=0.053
    6 3 18 110 1 1/18 0/20+1/19+1/18=0.108
    8 4 17 160 0 0/17 =0.108
    12 5 16 190 1 1/16 =0.171
    16 6 15 250 0 0/15 =0.171
    19 7 14 290 1 1/14 =0.242
    10 8 13 320 1 1/13 =0.319
    2 9 12 350 1 1/12 =0.402
    5 10 11 390 1 1/11 =0.493
    15 11 10 420 1 1/10 =0.593
    17 12 9 490 1 1/9 =0.704
    13 13 8 590 1 1/8 =0.829
    20 14 7 630 0 0/7 =0.829
    3 15 6 730 1 1/6 =0.996
    1 16 5 800 1 1/5 =1.196
    9 17 4 940 1 1/4 =1.446
    18 18 3 1060 0 0/3 =1.446
    14 19 2 1260 1 1/2 =1.946
    4 20 1 1770 0 0/1 0/20+1/19+1/18+…+1/2+0/1=1.946

    どの確率分布にフィッティングするか?

    今回は、ワイブル分布にフィッティングさせます!

    ワイブル分布は、
    \(R(t)\)=\(exp^{-H(t)}\)
    \(H(t)\)=\((\frac{t}{η})^m\)
    ですね。

    で、\(H(t)\)と\(t\)の値は、上の表からすでに計算ができています。
    これを直線で定数\(η\)、\(m\)の値を求めるので、
    \(H(t)\)=\((\frac{t}{η})^m\)を直線化します。

    両辺を対数logで取ると、
    \(log(H(t))\)=\(m(logt-logη)\)
    ●\(Y\)=\(log(H(t))\)
    ●\(X\)=\(logt\)
    ●\(n\)=\(-m(logη)\)
    として、直線で定数\(η\)、\(m\)の値を求めましょう。

    グラフに必要な表を作るため、上の表の\(t\),\(H(t)\)に対数logを取った値をいれます。

    順位i
    (B)
    t H(t) log(t) log(H(t)
    1 800 0 3.689
    2 350 0.053 4.606 -2.945
    3 730 0.108 4.701 -2.224
    4 1770 0.108 5.076 -2.224
    5 390 0.171 5.248 -1.768
    6 110 0.171 5.522 -1.768
    7 100 0.242 5.67 -1.418
    8 160 0.319 5.769 -1.143
    9 940 0.402 5.859 -0.91
    10 320 0.493 5.967 -0.707
    11 40 0.593 6.041 -0.522
    12 190 0.704 6.195 -0.35
    13 590 0.829 6.381 -0.187
    14 1260 0.829 6.446 -0.187
    15 420 0.996 6.594 -0.004
    16 250 1.196 6.685 0.179
    17 490 1.446 6.847 0.369
    18 1060 1.446 6.967 0.369
    19 290 1.946 7.14 0.666
    20 630 1.946 7.48 0.666

    ここから、\(X=log(t)\)、\(Y=log(H(t)\)
    として、直線を描きます。

    累積ハザード法

    両辺を対数logで取ると、
    ●\(m\)=0.7965
    ・\(n\)=-5.44=\(-m(logη)\)より
    ●\(η\)=924.4
    となります。

    累積ハザード法も確率紙があるが、手法を理解する方が大事

    ちなみに、累積ハザード法も確率紙があります。

    累積ハザード法

    ただ、

    解き方を理解すれば、確率紙は不要。
    計算機がない時代は重宝されたが、今は自力で解ける!

    ➂カプランマイヤー法、ワイブル確率紙、累積ハザード法の違いを理解する(その2へ)

    慣れると気づくこの疑問

    さて、累積ハザード法を理解すると、絶対気づくこの疑問!

    ワイブル確率紙、累積ハザード法の違いは何?

    累積ハザード法

    図見ると、見た目同じだけど

    さらに、累積ハザード法を理解すると、絶対気づくこの疑問!

    打切り有無ってカプランマイヤー法もあるけど、累積ハザード法の違いは何?

    となるはず。

    次の関連記事で解説!

    では、次に参りましょう。

    まとめ

    「累積ハザード法がよくわかるし、自分で作れる!」を解説しました。

    • ①ワイブル確率紙と累積ハザード法の違いを理解する
    • ➁指数分布を確率紙で考える
    • ➂カプランマイヤー法、ワイブル確率紙、累積ハザード法の違いを理解する

  • error: Content is protected !!