カプランマイヤー法が理解できる(その2)
「打切りデータがある場合では、何でカプランマイヤー法を使うのかがわからない」と困っていませんか?
こういう疑問に答えます。
本記事のテーマ
- ①カプランマイヤー法とは(その1で解説)
- ➁実測データで扱う経験分布関数は「打切りデータ」が扱えない(その1で解説)
- ➂生存関数、ハザード関数、累積ハザード関数を作る(その1で解説)
- ➃「打切りデータ」も考慮できるポイント
- ➄Nelson-Aalen推定量を一旦作る
- ⑥カプランマイヤー法が導出できる(その2で解説)
QC(品質管理)を勉強して、強く思うのは、
自分で導出できない式は使うな!
意味(目的)を理解せよ!
信頼性工学で、いまいち理解できない
「打切りデータ」⇒カプランマイヤー法
を実際に導出してみましょう。
①➁➂については、関連記事で解説済です。ご確認ください。
カプランマイヤー法が理解できる(その1) 信頼性工学で「打切りデータ」を扱う際、カプランマイヤー法を使いますが、カプランマイヤーの式は導出できますか? 本記事では、公式暗記しがちなカプランマイヤーの式を丁寧に導出します。信頼性工学を学ぶ人は必読です。 |
①➁➂まとめ
関連記事にも書いていますが、本記事を読む前におさえておくべきポイントは、
- ●生存関数\(S(t)\)=\(exp(-Λ(t)\)
- ●ハザード関数\(λ(t)\)=\(f(t) \frac{1}{S(t)}\)
- ●累積ハザード関数\(Λ(t)\)= \( \displaystyle \int_{0}^{t} λ(s)ds \)
の3点ですね。導出は関連記事に書いています。関係式は本記事で使います。
➃「打切りデータ」も考慮できるポイント
ハザード関数がポイント!
\(λ(t)\)= \( \displaystyle \lim_{Δt \to 0} \frac{1}{Δt}\)\((Pr(t \leq T \leq t+Δt|T \geq t)) \)
ここで、2つの独立した確率分布T,Uを用意します。
●T:生存時間確率分布(打切りなし)
●U:打切り時間確率分布(打切りあり)
●\((Pr(t \leq T \leq t+Δt|T \geq t)\)は条件付き確率なので、
\((Pr(t \leq T \leq t+Δt|T \geq t)\)=\(\frac{ Pr(t \leq T \leq t+Δt、T \geq t) }{ Pr(T \geq t)}\)
となりますね。
●この式の分母分子に確率変数Uについて、\(Pr(U \geq t)\)を掛け算します。
\(\frac{ Pr(t \leq T \leq t+Δt、T \geq t) }{ Pr(T \geq t)}\)×\(\frac{ Pr(U \geq t)}{ Pr(U \geq t)}\)
●分子は
\(Pr(t \leq T \leq t+Δt、T \geq t) \)×\(Pr(U \geq t)\)
となり、独立した確率の積になるので、
\(Pr(t \leq T \leq t+Δt、T \geq t) \)×\(Pr(U \geq t)\)= \(Pr(t \leq T \leq t+Δt、T \geq t、、U \geq t) \)
と合成することができます。
●分母は
\(Pr(T \geq t)\)×\(Pr(U \geq t)\)
となり、独立した確率の積になるので、
\(Pr(T \geq t)\)×\(Pr(U \geq t)\)= \(Pr(T \geq t、U \geq t)\)
●まとめると、
\((Pr(t \leq T \leq t+Δt|T \geq t)\)=\(\frac{ Pr(t \leq T \leq t+Δt、T \geq t、U \geq t)) }{ Pr(T \geq t、U \geq t)}\)
となります。
●さらに、よくみると T≡T+UとしてT、Uを合成すると、
\(\frac{ Pr(t \leq T \leq t+Δt、T \geq t、U \geq t)) }{ Pr(T \geq t、U \geq t)}\)=
\(\frac{ Pr(t \leq T \leq t+Δt、T \geq t) }{ Pr(T \geq t)}\)
とできるので、元の式に戻ります。
累積ハザード関数の近似
ハザード関数\(λ(t)\)は
\(λ(t)\)= \( \displaystyle \lim_{Δt \to 0} \frac{1}{Δt}\)\((Pr(t \leq T \leq t+Δt|T \geq t)) \)
と難しい式ですが、よく見ると
\((Pr(t \leq T \leq t+Δt|T \geq t)) \)
=\(\frac{ Pr(t \leq T \leq t+Δt、T \geq t)}{ Pr(T \geq t)}\)=\(\frac{d/n}{y/n}\)
・d:単位時間当たりの故障数
・y:時刻tでまだ故障していない個数
・n:全体の個数
という条件付き確率で表現できます。
つまり、
\(λ(t)\)≡\(\frac{d}{y}\)
として考えることができるので、この式を使ってみましょう。
➄Nelson-Aalen推定量を一旦作る
Nelson-Aalen推定量とは
ハザード関数を
\(λ(t)\)≡\(\frac{d}{y}\)
として考えることができるので、この式を使って、累積ハザード関数を作ってみます。
累積ハザード関数はハザード関数の積分ですが、積分の代わりに∑(和)で表現してみます。
\(Λ(t)\)=\(\sum_{i=1}^{n} \frac{D}{Y}\)
この形の式をNelson-Aalen推定量と呼びます。カプランマイヤー法の導出に必要なので、一旦式を作ります。
●次に、生存関数を作りましょう。
生存関数\(S(t)\)=\(exp(-Λ(t))\)より、
\(S(t)\)=\(exp(-\sum_{i=1}^{n} \frac{D}{Y})\)
指数部分に∑があると、掛け算になるので、
\(S(t)\)=\(exp(-\sum_{i=1}^{n} \frac{D}{Y})\)
=\(\displaystyle \prod_{i=1}^n (exp(-\frac{D}{Y})\)
となり、だんだんカプランマイヤー法の式に近づいてきました。
⑥カプランマイヤー法が導出できる
Nelson-Aalen推定量から生存関数\(S(t)\)は
\(S(t)\)= \(\displaystyle \prod_{i=1}^n (exp(-\frac{D}{Y})\)
を使っても良いですが、もう少し式が簡単にならないか考えましょう。
●ここで、テーラー展開を思い出しましょう。
\(e^x\)=1+\(x\)+\(\frac{x^2}{2!}\)+…
ですね。
\(exp(-\frac{D}{Y})\)をテーラー展開すると、
\(exp(-\frac{D}{Y})\)=1+\((-1)\frac{D}{Y}\)+\((-1)^2 \frac{(D/Y)^2}{2!}\)+…
となり、1次式まで取り出すと、
\(exp(-\frac{D}{Y})\)=1-\(\frac{D}{Y}\)
となります。
●まとめると、
\(S(t)\)= \(\displaystyle \prod_{i=1}^n (exp(-\frac{D}{Y})\)
= \(\displaystyle \prod_{i=1}^n (1-\frac{D}{Y})\)
と変形できます。これがカプランマイヤー法で使う生存関数の式です。ゴール到達できました!。
●\(D_i\):故障数
●\(R_i\):全体の個数
の式に一致しましたね!
導出が難しく、長いですが、何も知らずに公式暗記するよりは、導出過程を読んで理解した方がいいですよね!
まとめ
「カプランマイヤー法が理解できる(その2)が理解できる」を解説しました。
- ①カプランマイヤー法とは(その1で解説)
- ➁実測データで扱う経験分布関数は「打切りデータ」が扱えない(その1で解説)
- ➂生存関数、ハザード関数、累積ハザード関数を作る(その1で解説)
- ➃「打切りデータ」も考慮できるポイント
- ➄Nelson-Aalen推定量を一旦作る
- ⑥カプランマイヤー法が導出できる(その2で解説)
Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119