QCプラネッツ 品質のプロフェッショナルを育成するサイト

順序統計量からR管理図の係数d2,d3導出の紹介

統計学

「順序統計量がさっぱりわからない」と困っていませんか?

こういう疑問に答えます。

本記事のテーマ

順序統計量からR管理図の係数d2,d3導出の紹介
  • ①順序統計量のイメージが理解できる
  • ➁R管理図の変数d2,d3
  • ➂順序統計量からR管理図の係数d2,d3導出の紹介
高校数学で十分わかる!
順序にそって、期待値が増加していることを図で理解しよう!

①順序統計量のイメージが理解できる

順序統計量とは

順序統計量は意外と使われています。範囲R、R管理図、2点間距離の分布とかです。直観的にはわかりやすけど、数式で書くとめっちゃムズイのが順序統計量!

定義は、

確率変数\(X_1\),\(X_2\),…,\(X_n\)が独立の確率分布に従うとき、
これらを大きい順に並べたとき、\(k\)番目の確率変数を\(X_{(k)}\)と書くと、
\(X_{(1)}\) < \(X_{(2)}\) < \(X_{(k)}\) < … < \(X_{(n)}\)
に並ぶ統計量を基本統計量という。

定義は、そうなんだ!と言う感じですが、確率分布関数を見ると「なんじゃこりゃ」とムズくなります。

確率分布関数\(f_{(i)}(x)\)=\(\frac{n!}{(i-1)!1!(n-i)!} F(x)^{i-1}[1-F(x)]^{n-i}f(x)\)

順序統計量の確率分布関数を見たら、勉強辞めようとなっちゃいます!
順序統計量は式変形の解説が多いので、わかりやすく図で理解できるよう解説します。

順序統計量のイメージ

言葉の定義どおり、\(X_{(1)}\) < \(X_{(2)}\) < \(X_{(k)}\) < … < \(X_{(n)}\)
に並びます。

面白いのは、

確率分布関数\(f_{(i)}(x)\)の式は1つだが、整数\(i\)を0から1ずつ増やして代入してできる確率分布関数の期待値を計算すると、期待値がちゃんと増加していく!

図で理解しましょう! 下図をご覧ください。

順序統計量

もともと確率分布関数\(f_{(i)}(x)\)の式は1つですが、整数\(i\)を0から1ずつ増やして代入してできる確率分布関数の期待値を計算すると、期待値がちゃんと増加しているのがわかりますよね。

視覚的に順序統計量がイメージできたところで、実際に計算して、上図を作ってみましょう。

➁R管理図の変数d2,d3

詳しくは、すでに関連記事で書いています。

【必読】R管理図の変数d2,d3の導出が(半分)わかる
R管理図の係数d2,d3はどうやって求めるか説明できますか?本記事では、範囲Rの確率密度関数を順序統計量の同時分布を使って導出し、途中までですが、d2,d3の導出方法を解説します。管理図をマスターしたい方は必見です。

R管理図の変数d2,d3

●\(d_2\)=\(\displaystyle \int_{-\infty}^{\infty} [1-(1-φ(x))^n-(φ(x))^n]dx\)
●\(d_3\)=\(\sqrt{2\displaystyle \int_{-\infty}^{\infty} \displaystyle \int_{-\infty}^{y}f(x,y)dxdy-d_2^2 }\)
\(f(x,y)=1-φ(y)^n-(1-φ(x))^n+(φ(y)-φ(x))^n\)

読んでも理解ができない超難関な式です。でも、これをR管理図の係数表として有名です。どうやってこの式になったのか?と気になるのは当然!

注意!

先に謝っておきます!
完璧に導出できていませんが、日本中の資料をかき集めて、自分で研究した成果を解説します。d2,d3の導出で新たな知見が出たら、ブログを更新します。
R管理図の関連記事を書いて9カ月経過し、統計学を猛勉強して、順序統計量を解説できるレベルまで高めましたが、やっぱりR管理図の係数d2,d3は導出できない。読んでもわからない

●\(d_2\)=\(\displaystyle \int_{-\infty}^{\infty} [1-(1-φ(x))^n-(φ(x))^n]dx\)
●\(d_3\)=\(\sqrt{2\displaystyle \int_{-\infty}^{\infty} \displaystyle \int_{-\infty}^{y}f(x,y)dxdy-d_2^2 }\)
\(f(x,y)=1-φ(y)^n-(1-φ(x))^n+(φ(y)-φ(x))^n\)
は順序統計量を勉強すれば、同時分布の幅の分布から導出するのがわかりますが、その先の導出がやっぱりわからないです。

➂順序統計量からR管理図の係数d2,d3導出の紹介

要約は関連記事で

【必読】R管理図の変数d2,d3の導出が(半分)わかる
R管理図の係数d2,d3はどうやって求めるか説明できますか?本記事では、範囲Rの確率密度関数を順序統計量の同時分布を使って導出し、途中までですが、d2,d3の導出方法を解説します。管理図をマスターしたい方は必見です。

本記事は、図書の原文を残しておきます

導出が書いている唯一の図書が、です。大きな図書館でないと借りれません。

1952年から70年経過しており、著作権の影響がないことと、
この本の内容以外、R管理図の変数d2,d3の導出が書いていないため、原文を書き残して、導出過程をみなさんと協議したいと思います。

「新編統計数値表 河出書房」P206-208の原文です。古い漢字や誤植や解釈が難しいと思われるところはQCプラネッツの方で修正しています。

「新編統計数値表 河出書房」

36.範囲の分布

連続型分布で無作為標本\(x_1\),\(x_2\),…, \(x_n\)を大きさの順に並べたものを
\(x_1\) < \(x_2\) < … < \(x_n\)
とする。\(x_r\)を\(r\)番目の順序統計量という。

元の分布関数を\(F(x)\)、確率密度関数を\(f(x)\)とすれば、\(x_r\)の分布は、
\(Φ(x_r)dx_r\)=\([F(x_r)]^{r-1} [1-F(x_r)]^{n-r} f(x_r)dx_r /B(r,n-r+1)\)

\(F_1=F(x_r)\), \(F_2=F(x_{n-l+1})\)の同時分布は
\(F_1^{r-1} (F_2 – F_1)^{n-r-l}(1-F_2)^{l-1} dF_1 dF_2 \)
に比例する。

つぎに、
\(R=x_n – x_1\)と定義すると、\(R\)は範囲という。\(R\)の標本分布において、\(x_2-x_1=w\)と置くと、\(R\)の確率密度関数\(f_W (w)\)は

\(f_W (w)\)=\(n(n-1)\)\( \displaystyle \int_{-∞}^{∞} \displaystyle \int_{-∞}^{x_2} (F_2 -F_1)^{n-2} f(x_1)f(x_1+w) dx_1 dx_2\)

ここで、\(dF_i\)=\(df_i dx_i\)とすると、

\(f_W (w)\)=\(n(n-1)\)\( \displaystyle \int_{-∞}^{∞} \displaystyle \int_{-∞}^{x_2} (F_2 -F_1)^{n-2} dF_1 dF_2\)
となる。

期待値E[\(w\)]は、
E[\(w\)]=\(n(n-1)\)\( \displaystyle \int_{-∞}^{∞} \displaystyle \int_{-∞}^{x_2} (F_2 -F_1)^{n-2} (x_2 -x_1) dF_1 dF_2\)
となる。

\((F_2-F_1)^{n-2}\)を展開して、部分積分からまとめると、
E[\(w\)]=\(n! \sum_{r=0}^{n-2} \frac{(-1)^r}{(r+1)!(n-r-1)!} \displaystyle \int_{-∞}^{∞} (1-F_2^{n-r-1})F_2^{r+1} dx_2\)
=\(\displaystyle \int_{-∞}^{∞} (1-F_2^n-(1-F_2)^n)dx_2\)

同様にしてE[\(w^2\)]は
E[\(w^2\)]=\(2 \displaystyle \int_{-∞}^{∞} \displaystyle \int_{-∞}^{x_2}(1-F_2^n-(1-F_1)^n-(F_2-F_1)^n)dx_1 dx_2 \)

従って\(w\)の母分散は
\(σ_w^2\)= E[\(w^2\)]- E[\(w\)]2
で与えられる。

範囲の分布は、元の分布の母平均の値によらないから、
\(\displaystyle \int_{0}^{1} xdF\)=0
\(\displaystyle \int_{0}^{1} x^2dF\)=\(σ^2\)=1
と置いても、一般性は失わない。\(σ^2\)が存在するなら、
\( \displaystyle \lim_{x \to -\infty} xF= 0\)
\( \displaystyle \lim_{x \to +\infty} x(1-F)= 0\)
より、

部分積分から、
E[\(w\)]=\(\displaystyle \int_{-∞}^{∞} (1-F^n-(1-F)^n)dx\)
=-\(\displaystyle \int_{0}^{1} xd[1-F^n-(1-F)^n]\)= \(\displaystyle \int_{0}^{1} x[(1-F)^n-F^n]dF\)

シュワルツの不等式より、
\(E[w]^2\) ≤ \(\displaystyle \int_{0}^{1} x^2dF \displaystyle \int_{0}^{1} [(1-F)^n-F^2]^2 dF\)
=\(\frac{2n^2}{2n-1}(1-\frac{1}{_{2n-2}C_{n-1}})=K\)
とすると、\(K\)は、
E[\(w\)]=E[\(\frac{R}{σ}\)]=\(d_2\)
を与える。

E[w]の導出までは理解できますが、そのあとの計算がさっぱりわからないですね。式が正しく導出できるかが分からないです。

導出が分かり次第報告します!

このテーマはわかるまで研究したいと考えております。

まとめ

「順序統計量からR管理図の係数d2,d3導出の紹介」を解説しました。

  • ①順序統計量のイメージが理解できる
  • ➁R管理図の変数d2,d3
  • ➂順序統計量からR管理図の係数d2,d3導出の紹介


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!