カテゴリー: 手法

  • 重回帰分析と単回帰分析の比較がわかる

    重回帰分析と単回帰分析の比較がわかる

    「単回帰分析と重回帰分析では、どちらの寄与率が大きいかわからない」と困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    重回帰分析と単回帰分析の比較がわかる

    おさえておきたいポイント

    • ①重回帰分析と単回帰分析を比較
    • ➁重回帰分析と単回帰分析で寄与率が等しい場合
    • ➂重回帰分析の方が単回帰分析より寄与率が大きい場合
    • ➃単回帰分析の方が重回帰分析より寄与率が大きい場合
    [themoneytizer id=”105233-2″]

    【QC検定®1級合格】回帰分析問題集を販売します!

    QC検定®1級合格したい方、回帰分析をしっかり学びたい方におススメです。
    【QC検定®合格】「回帰分析(単回帰分析・重回帰分析)」問題集を販売します! 内容は、①単回帰分析の基本、➁特殊な単回帰分析、➂単回帰分析の応用、➃重回帰分析の基礎、⑤重回帰分析の応用、の5章全41題を演習できる問題集です。

    多重共線性の話につながるテーマです。

    ①重回帰分析と単回帰分析を比較

    目的変数データは同じで、説明変数の種類を変えて寄与率を比較

    寄与率を比較するために、目的変数zは同じとし、
    説明変数は
    ●単回帰分析はxのみ
    ●重回帰分析はx,yとし、
    重回帰分析と単回帰分析のxデータも同じとし、
    yの値の差によって、寄与率がどう変化するかを考えます。

    イメージを下表に書きます。

    単回帰分析 重回帰分析
    x z x y z
    1 3 1 ?? 3
    4 4 4 ?? 4
    2 4 2 ?? 4
    5 7 5 ?? 7
    4 7 4 ?? 7
    2 5 2 ?? 5
    寄与率 A 寄与率 B A、Bどちらがおおきい? 

    公式を比較

    まず、重回帰分析と単回帰分析において、それぞれの
    ●「データの構造式」
    ●「回帰直線」
    ●「回帰直線の傾き」
    ●「平方和」
    ●「寄与率」
    について公式を確認しましょう。

    公式は暗記ではなく、導出できます。関連記事で導出過程を確認しましょう。

    単回帰分析の復習

    回帰分析と相関係数をマスターする
    回帰分析と相関係数。学びやすく、試験で点数化したい領域ですが、重要なポイントと回帰分析の導出を解説しました。本記事を一通りマスターしておけば試験では確実に点数とれます。

    重回帰分析の復習

    重回帰分析の回帰式が導出できる
    重回帰分析の回帰式は自力で導出できますか?本記事では公式暗記になりがちな重回帰分析の回帰式を途中経過を一切端折らず丁寧に解説します。ちゃんと自力で導出できて、重回帰分析や多変量解析ができるようになりましょう。重回帰分析や多変量解析を勉強する人は必読です。

    公式を比較

    下表にまとめます。あっさりした表ですが、個々の数式をすべて導出できるように上の関連記事で確認しましょう。

    単回帰分析 重回帰分析
    データの構造式 \((z_i-\bar{z})\)=\((\hat{z_i}-\bar{x})\)+\((z_i-\hat{z_i})\)
    回帰直線 \(z\)=\(α+βx\) \(z\)=\(η+γx+δy\)
    傾き \(β\)=\(\frac{S_{xz}}{S_{xx}}\) (*)
    回帰平方和 \(S_{R1}\)=\(\frac{S_{xz}^2}{S_{xx}}\) \(S_{R2}\)=\(γS_{xz}+δS_{yz}\)
    総平方和 \(S_T\)=\(S_{zz}\)
    寄与率R R1=\(\frac{S_{R1}}{S_T}\) R2=\(\frac{S_{R2}}{S_T}\)

    上表の(*)は、下の連立方程式を満たす解が傾き\(γ,δ\)となります。

    \(S_{xx}γ+S_{xy}δ\)=\(S_{xz}\)
    \(S_{xy}γ+S_{yy}δ\)=\(S_{yz}\)

    寄与率を比較

    上の表を使って,重回帰分析と単回帰分析の寄与率の差を比較しましょう。
    ところで、寄与率Rを求める際、
    \(R\)=\(\frac{S_R}{S_T}\)
    ですが、単回帰分析も重回帰分析も目的変数のデータが同じ場合は、
    どちらも、総平方和\(S_T\)=\(S_{zz}\)なので、
    寄与率を求める分子の¥(S_R¥)について比較します。

  • ワイブル確率紙

    ワイブル確率紙においては、打切りデータある場合の対処がないため、打切りデータが無い場合と同じ結果になります。

    結果を表にまとめると、

    ワイブル確率は、上表のX(=log(data))とY(=ln(ln(1/R))の直線グラフから定数\(m\)、\(η\)を求めます。グラフは下図になります。

    ワイブル確率紙

    結果は、
    \(m\)=直線の傾きより=1.233
    \(η\)=593.02
    (\(η\)は y切片 \(m(log(η)\))=7.8706から算出)
    となります。

    累積ハザード法

    累積ハザードを計算すると、下表になります。

    順位i
    (B)
    逆順位K=n-i+1
    (n=20)
    (C)
    時間ti
    (D)
    打切り有無
    ○⇒0
    ×⇒1
    不良率hi
    1/(逆順位) ×100%
    (E)
    累積ハザード値Hi
    ∑hi
    (F)
    1 20 40 0 0/20
    2 19 100 1 1/19 0/20+1/19=0.053
    3 18 110 1 1/18 0/20+1/19+1/18=0.108
    4 17 160 0 0/17 0.108
    5 16 190 1 1/16 0.171
    6 15 250 0 0/15 0.171
    7 14 290 1 1/14 0.242
    8 13 320 1 1/13 0.319
    9 12 350 1 1/12 0.402
    10 11 390 1 1/11 0.493
    11 10 420 1 1/10 0.593
    12 9 490 1 1/9 0.704
    13 8 590 1 1/8 0.829
    14 7 630 0 0/7 0.829
    15 6 730 1 1/6 0.996
    16 5 800 1 1/5 1.196
    17 4 940 1 1/4 1.446
    18 3 1060 0 0/3 1.446
    19 2 1260 1 1/2 1.946
    20 1 1770 0 0/1 0/20+1/19+1/18+…+0/3+1/2+0/1=1.946

    累積ハザード法を直線グラフにするために、上の表の色枠をつけた、時間log(ti)
    と、累積ハザード値log(Hi)を使って、下表にまとめます。

    ちなみに、打切り無しのデータを下表の右側にも参考で載せます。打切り有無でデータが変わっているのが分かりますね。

    log(t) log(H(t) log(H(t)
    (打切り無し)
    3.689 -2.996
    4.606 -2.945 -2.277
    4.701 -2.224 -1.844
    5.076 -2.224 -1.528
    5.248 -1.768 -1.275
    5.522 -1.768 -1.061
    5.67 -1.418 -0.873
    5.769 -1.143 -0.704
    5.859 -0.91 -0.548
    5.967 -0.707 -0.402
    6.041 -0.522 -0.263
    6.195 -0.35 -0.128
    6.381 -0.187 0.005
    6.446 -0.187 0.138
    6.594 -0.004 0.273
    6.685 0.179 0.415
    6.847 0.369 0.568
    6.967 0.369 0.741
    7.14 0.666 0.955
    7.48 0.666 1.28

    結果をグラフにまとめると

    累積ハザード法

    結果は、
    \(m\)=直線の傾きより=0.7965
    \(η\)=924.42
    (\(η\)は y切片 \(m(log(η)\))=5.4401から算出)
    となります。

    ワイブル確率紙と累積ハザード法を比較

    結果は、

    ワイブル確率紙 累積ハザード法
    \(m\) 1.233 0.7965
    \(η\) 593.02 924.42
    ワイブル確率紙でも累積ハザード法で、結果に差が出ました。
    mは累積ハザード法の方が低くでました。
    打切り有(未故障)データがあるので、寿命は長くなるはずだから、妥当な結果ですよね。
    ηは累積ハザード法の方が長くでました。
    打切り有(未故障)データがあるので、寿命は長くなるはずだから、妥当な結果ですよね。

    グラフでも比較すると、

    累積ハザード法

    打切りデータがあると、ワイブル確率紙は寿命が短いという厳しい評価をするために、累積ハザード法を使う必要があることがよくわかりますね。

    まとめ

    「ワイブル確率紙と累積ハザード法の違いがよくわかる」を解説しました。

    • ①累積ハザード法の基礎を理解する
    • ➁ワイブル確率紙と累積ハザード法の違いを理解する
    • ➂同じ問題をワイブル確率紙と累積ハザード法それぞれで解いてみる
    • ➃打切りが無い場合は、両者は同等の結果になる
    • ➄打切りが無い場合は、両者の結果に差が出る

  • 累積ハザード法がよくわかるし、自分で作れる!

    累積ハザード法がよくわかるし、自分で作れる!

    「累積ハザード法がよくわからない」、と困っていませんか?

    こういう疑問に答えます。

    本記事のテーマ

    累積ハザード法がよくわかるし、自分で作れる!
    • ①ワイブル確率紙と累積ハザード法の違いを理解する
    • ➁指数分布を確率紙で考える
    • ➂カプランマイヤー法、ワイブル確率紙、累積ハザード法の違いを理解する(その2へ)
    累積ハザード法も自分でグラフ描いてフィッティングできます
    [themoneytizer id=”105233-2″]

    本物の「信頼性工学」問題集を販売します!

    QC検定®1級合格したい方、本物の信頼性工学を学びたい方におススメです。
    【QC検定®合格】「信頼性工学」問題集を販売します! ①QC検定®頻出問題、➁確率分布と順序統計量、➂各確率分布における故障率、➃点推定と区間推定、➄直列系、並列系、待機系、多数決系、⑥独立系と非独立系、⑦アベイラビリティ、⑧確率紙、⑨打切りデータ、⑩信頼性工学と抜取検査の組合せ、10章全54題。しっかり勉強しましょう。

    ①ワイブル確率紙と累積ハザード法の違いを理解する

    累積ハザード法とは

    「累積ハザード法」単体で説明されることが多いですが、

    ワイブル確率紙と累積ハザード法の違いが最後までわからないはずなので、違いがわかるように最初から書きます。
    累積ハザード法とは、未故障データ(打切りデータ)を打切りデータとして扱ってよい手法

    ワイブル確率紙と累積ハザード法の違いを理解する

    ワイブル確率紙と累積ハザード法の違いは、教科書的には、

    ワイブル確率紙とは、未故障データ(打切りデータ)を故障データとみなして扱う手法(打切りデータそのものは扱えない)
    累積ハザード法とは、未故障データ(打切りデータ)を打切りデータとして扱ってよい手法(打切りデータそのもの扱える)

    QCプラネッツ、個人的には、どちらでも差はないとみています。
    フィッティングして求める手法であり、精度もそれほど高いものでもないからです。
    モデルで故障時間を推定しても、本当にその時間で故障するかなんてわからんし、おまじない程度です。

    大事なのは、違いを理解することです!理解せずにやり方だけ知っているとならないよう注意しましょう。

    ➁累積ハザード法の使い方がわかる

    ハザード関数、累積ハザード関数とは

    信頼度\(R(t)\)を
    ●\(R(t)\)=\(exp(-\displaystyle \int_{0}^{t} λ(t)dt)\)
    ここで、
    ●\(R(t)\)=\(exp(-H(t)\)
    \(H(t)\)=\( \displaystyle \int_{0}^{t} λ(t)dt \)
    とおくと、

    ●\(λ(t)dt \)をハザード関数
    ●\(H(t)\)=\( \displaystyle \int_{0}^{t} λ(t)dt \)を累積ハザード関数
    と定義します。

    累積ハザードでは、実データをもとに、ハザード関数、累積ハザード関数を使います。
    実際は、

    ●\(λ(t)dt \)=\(\frac{(t_i,t_i+Δt)における故障数}{t_iの直前における未故障データ数}\)
    ●\(H(t)\)=\( \sum_{i=1}^{l} \frac{(t_i,t_i+Δt)における故障数}{t_iの直前における未故障データ数}\)
    とて計算します。

    【ここを理解せよ!】ハザード関数、累積ハザード関数を使う理由

    ここで、大事なのは、

    ●\(λ(t)dt \)をハザード関数
    ●\(H(t)\)=\( \displaystyle \int_{0}^{t} λ(t)dt \)を累積ハザード関数
    は、未故障データ(打切りデータ)を打切りデータとして扱ってよい手法(打切りデータそのもの扱える)ことです。
    これがわからないと、何でワイブル確率紙じゃダメなの?と理解できない!
    ここを教科書では説明していない!

    【ここを理解せよ!】ハザード関数、累積ハザード関数を使う理由

    関連記事の「カプランマイヤー法」という全く別の手法の解説にヒントがあります。

    カプランマイヤー法が理解できる(その2)
    信頼性工学で「打切りデータ」を扱う際、カプランマイヤー法を使いますが、カプランマイヤーの式は導出できますか? 本記事では、公式暗記しがちなカプランマイヤーの式を丁寧に導出します。信頼性工学を学ぶ人は必読です。

    ハザード関数がポイント!

    ●ハザード関数
    \(λ(t)\)= \( \displaystyle \lim_{Δt \to 0} \frac{1}{Δt}\)\((Pr(t \leq T \leq t+Δt|T \geq t)) \)

    ここで、2つの独立した確率分布T,Uを用意します。
    ●T:生存時間確率分布(打切りなし)
    ●U:打切り時間確率分布(打切りあり)

    「打切りデータ」も考慮できるポイントは、
    条件付き確率で、打切りなしの確率Tに、打切りなしの確率Uの式を分母分子に掛け算して整理すると、合成することができる!
    つまり、 打切りあり、なしを区別しても合成してハザード関数が扱える性質を活かして、累積ハザード法を使っている点を理解しましょう。

    実例を使って累積ハザード法の使い方をマスターする

    では、データを用意します。

    サンプル番号 1 2 3 4 5
    時間t 800(○) 350(×) 730(×) 1770(○) 390(×)
    サンプル番号 6 7 8 9 10
    時間t 110(○) 100(×) 160(×) 940(×) 320(×)
    サンプル番号 11 12 13 14 15
    時間t 40(×) 190(×) 590(×) 1260(○) 420(×)
    サンプル番号 16 17 18 19 20
    時間t 250(×) 490(×) 1060(○) 290(×) 630(○)

    累積ハザード法を使って、信頼度関数を作ってみましょう。ただし、上の○×は
    ○:故障無しで打切り有データ
    ×:故障有りデータ
    として、打切り有無両方のケースを含むとします。

    累積ハザード法を使って、信頼度関数を作る

    下ごしらえをします。

    1. 不良率λを計算するために、逆順位K=n-i+1を計算
    2. 不良率λは、逆順位Kの逆数
    3. 累積ハザードHiを計算
    サンプル
    番号
    (A)
    順位i
    (B)
    逆順位
    K=n-i+1
    (n=20)
    (C)
    時間ti
    (D)
    打切り
    有無
    ○⇒0
    ×⇒1
    不良率hi
    1/(逆順位) ×100%
    (E)
    累積ハザード値Hi
    ∑hi
    (F)
    11 1 20 40 0 0/20 0/20=0
    7 2 19 100 1 1/19 0/20+1/19=0.053
    6 3 18 110 1 1/18 0/20+1/19+1/18=0.108
    8 4 17 160 0 0/17 =0.108
    12 5 16 190 1 1/16 =0.171
    16 6 15 250 0 0/15 =0.171
    19 7 14 290 1 1/14 =0.242
    10 8 13 320 1 1/13 =0.319
    2 9 12 350 1 1/12 =0.402
    5 10 11 390 1 1/11 =0.493
    15 11 10 420 1 1/10 =0.593
    17 12 9 490 1 1/9 =0.704
    13 13 8 590 1 1/8 =0.829
    20 14 7 630 0 0/7 =0.829
    3 15 6 730 1 1/6 =0.996
    1 16 5 800 1 1/5 =1.196
    9 17 4 940 1 1/4 =1.446
    18 18 3 1060 0 0/3 =1.446
    14 19 2 1260 1 1/2 =1.946
    4 20 1 1770 0 0/1 0/20+1/19+1/18+…+1/2+0/1=1.946

    どの確率分布にフィッティングするか?

    今回は、ワイブル分布にフィッティングさせます!

    ワイブル分布は、
    \(R(t)\)=\(exp^{-H(t)}\)
    \(H(t)\)=\((\frac{t}{η})^m\)
    ですね。

    で、\(H(t)\)と\(t\)の値は、上の表からすでに計算ができています。
    これを直線で定数\(η\)、\(m\)の値を求めるので、
    \(H(t)\)=\((\frac{t}{η})^m\)を直線化します。

    両辺を対数logで取ると、
    \(log(H(t))\)=\(m(logt-logη)\)
    ●\(Y\)=\(log(H(t))\)
    ●\(X\)=\(logt\)
    ●\(n\)=\(-m(logη)\)
    として、直線で定数\(η\)、\(m\)の値を求めましょう。

    グラフに必要な表を作るため、上の表の\(t\),\(H(t)\)に対数logを取った値をいれます。

    順位i
    (B)
    t H(t) log(t) log(H(t)
    1 800 0 3.689
    2 350 0.053 4.606 -2.945
    3 730 0.108 4.701 -2.224
    4 1770 0.108 5.076 -2.224
    5 390 0.171 5.248 -1.768
    6 110 0.171 5.522 -1.768
    7 100 0.242 5.67 -1.418
    8 160 0.319 5.769 -1.143
    9 940 0.402 5.859 -0.91
    10 320 0.493 5.967 -0.707
    11 40 0.593 6.041 -0.522
    12 190 0.704 6.195 -0.35
    13 590 0.829 6.381 -0.187
    14 1260 0.829 6.446 -0.187
    15 420 0.996 6.594 -0.004
    16 250 1.196 6.685 0.179
    17 490 1.446 6.847 0.369
    18 1060 1.446 6.967 0.369
    19 290 1.946 7.14 0.666
    20 630 1.946 7.48 0.666

    ここから、\(X=log(t)\)、\(Y=log(H(t)\)
    として、直線を描きます。

    累積ハザード法

    両辺を対数logで取ると、
    ●\(m\)=0.7965
    ・\(n\)=-5.44=\(-m(logη)\)より
    ●\(η\)=924.4
    となります。

    累積ハザード法も確率紙があるが、手法を理解する方が大事

    ちなみに、累積ハザード法も確率紙があります。

    累積ハザード法

    ただ、

    解き方を理解すれば、確率紙は不要。
    計算機がない時代は重宝されたが、今は自力で解ける!

    ➂カプランマイヤー法、ワイブル確率紙、累積ハザード法の違いを理解する(その2へ)

    慣れると気づくこの疑問

    さて、累積ハザード法を理解すると、絶対気づくこの疑問!

    ワイブル確率紙、累積ハザード法の違いは何?

    累積ハザード法

    図見ると、見た目同じだけど

    さらに、累積ハザード法を理解すると、絶対気づくこの疑問!

    打切り有無ってカプランマイヤー法もあるけど、累積ハザード法の違いは何?

    となるはず。

    次の関連記事で解説!

    では、次に参りましょう。

    まとめ

    「累積ハザード法がよくわかるし、自分で作れる!」を解説しました。

    • ①ワイブル確率紙と累積ハザード法の違いを理解する
    • ➁指数分布を確率紙で考える
    • ➂カプランマイヤー法、ワイブル確率紙、累積ハザード法の違いを理解する

  • error: Content is protected !!