2022/09/24 (更新日: 2025/01/21)

順序統計量の同時確率密度関数の導出がよくわかる

統計学

「順序統計量がさっぱりわからない」と困っていませんか？

こういう疑問に答えます。

本記事のテーマ

順序統計量の同時確率密度関数の導出がよくわかる

①順序統計量のイメージが理解できる
➁順序統計量の教科書的な確率密度関数の導出
➂順序統計量確率密度関数の導出がもっと理解できる

高校数学で十分わかる！

順序にそって、期待値が増加していることを図で理解しよう！

QCに必要な数学問題集をを販売します！

QC検定®1級合格したい方、QCに必要な数学をしっかり学びたい方におススメです。

QC検定®１級、２級、統計検定２級以上の数学スキルを磨くのに苦戦していませんか？　広大すぎる統計学、微分積分からQC・統計に勝てるための６０題に厳選した問題集を紹介します。是非ご購入いただき、勉強してスキルを高めましょう。

‎

①順序統計量のイメージが理解できる

順序統計量とは

順序統計量は意外と使われています。範囲R、R管理図、２点間距離の分布とかです。直観的にはわかりやすけど、数式で書くとめっちゃムズイのが順序統計量！

定義は、

確率変数\(X_1\),\(X_2\),…,\(X_n\)が独立の確率分布に従うとき、
これらを大きい順に並べたとき、\(k\)番目の確率変数を\(X_{(k)}\)と書くと、
\(X_{(1)}\) < \(X_{(2)}\) < \(X_{(k)}\) < … < \(X_{(n)}\)
に並ぶ統計量を基本統計量という。

定義は、そうなんだ！と言う感じですが、確率分布関数を見ると「なんじゃこりゃ」とムズくなります。

確率分布関数\(f_{(i)}(x)\)=\(\frac{n!}{(i-1)!1!(n-i)!} F(x)^{i-1}[1-F(x)]^{n-i}f(x)\)

順序統計量の確率分布関数を見たら、勉強辞めようとなっちゃいます！

順序統計量は式変形の解説が多いので、わかりやすく図で理解できるよう解説します。

順序統計量のイメージ

言葉の定義どおり、\(X_{(1)}\) < \(X_{(2)}\) < \(X_{(k)}\) < … < \(X_{(n)}\)
に並びます。

面白いのは、

確率分布関数\(f_{(i)}(x)\)の式は１つだが、整数\(i\)を0から１ずつ増やして代入してできる確率分布関数の期待値を計算すると、期待値がちゃんと増加していく！

図で理解しましょう！　下図をご覧ください。

順序統計量

もともと確率分布関数\(f_{(i)}(x)\)の式は１つですが、整数\(i\)を0から１ずつ増やして代入してできる確率分布関数の期待値を計算すると、期待値がちゃんと増加しているのがわかりますよね。

視覚的に順序統計量がイメージできたところで、実際に計算して、上図を作ってみましょう。

➁順序統計量の教科書的な確率密度関数の導出

(1) 順序統計量の教科書的な確率密度関数の導出

関数\(f_{(i)}(x)\)=\(\frac{n!}{(i-1)!1!(n-i)!}\)\(F(x)^{i-1}(1-F(x))^{n-1} f(x)\)の導出についてです。

教科書の導出方法を解説します。

\(X\)=(\(X_1,…,X_n\))を\(n\)個の独立な確率標本とし、確率密度関数、および分布関数をそれぞれ\(f(x)\),\(F(x)\)とする。また、\(F_{(i)}\),\(i=1,…,n\)を\(i\)番目の順序統計量\(X_{(i)}\)の分布案数とする。

順序統計量

上図のように、事象\(x\) < \(X_{(i)}\) < \(x+δx\)(\(δx\)は微小とする)の起こる確率Prは、二項定理を使って
Pr(\(x\) < \(X_{(i)}\) < \(x+δx)\)
=\(\frac{n!}{(i-1)!1!(n-i)!}\) \(F(x)^{i-1} (1-F(x+δx))^{n-i} (F(x+δx)-F(x))\)
=(式1)
と表現できる。

二項定理から見ると、
●\(F(x)\)が\(i-1\)個
●\(F(x+δx)-F(x)\)が1個
●残り\(1F(x+δx)\)が\(n-i\)個
を選ぶ、場合の数を求めるイメージです。

(式１)の微分が関数\(f_{(i)}(x)\)になるので、
\( \displaystyle \lim_{n \to \infty} \frac{ Pr}{δx} \)
=\(f_{(i)}(x)\)=\(\frac{n!}{(i-1)!1!(n-i)!}\)\(F(x)^{i-1}(1-F(x))^{n-1} f(x)\)
=(式2)

((式1)の中の、\((F(x+δx)-F(x))/δx\)⇒\(f(x)\)になります。)

この導出方法は、数学的に正しいけど、順序統計量の「順序」がどこにあるのかがまったくわからず、むしろ何で二項定理を使って導出するのか？で混乱する

続いて、教科書的な同時確率密度関数の導出も見ましょう。

(2) 順序統計量の教科書的な同時確率密度関数の導出

関数\(f_{(i),(j)}(x_{(i)},x_{(j)})\)=\(C_{i,j}F(x_i)^{i-1}\)\((F(x_j)-F(x_i))^{j-i-1}\)\((1-F(x_j))^{n-j}f(x_i)f(x_j)\)の導出についてです。

教科書の導出方法を解説します。

2つの順序統計量\(X_{(i)}\)、\(X_{(ij)}\)について考えるが、
●1 < \(i\) < \(j\) < \(n\)
とする。この場合、
\(x_i\) < \(X_{(i)}\) \(X_{(i)}\) \(x_i + δx_i\)および\(x_j\) < \(X_{(j)}\) \(X_{(j)}\) \(x_j + δx_j\)が同時に起こる確率Prは、下図と二項定理を使って以下で表現できる。

順序統計量

Pr(\(x\) < \(X_{(i)}\) < \(x+δx\),\(x\) < \(X_{(i)}\) < \(x+δx\))
=\(\frac{n!}{(i-1)!1!(j-i-1)!1!(n-j)!}\) \(F(x)^{i-1} (F(x_j)-F(x_i +δx_i))^{j-i-1}\)\((1-F(x_j + δx_j))^{n-j} (F(x_i +δx_i)-F(x_i)) (F(x_j +δx_j)-F(x_j))\)
=(式3)
で表現できる。

二項定理から見ると、
●\(F(x_i)\)が\(i-1\)個
●\(F(x_i+δx_i)-F(x_i)\)が1個
●\(F(x_j)-F(x_i + δx_i)\)が\(j-i-1\)個
●\(F(x_j+δx_j)-F(x_j)\)が1個
●1-\(F(x_j+δx_j)\)が\(n-j\)個
を選ぶ、場合の数を求めるイメージです。

(式3)の微分が関数\(f_{(i),(j)}(x)\)になるので、
\( \displaystyle \lim_{n \to \infty} \frac{ Pr}{δx_i δx_j} \)
=\(C_{i,j}F(x_i)^{i-1}\)\((F(x_j)-F(x_i))^{j-i-1}\)\((1-F(x_j))^{n-j}f(x_i)f(x_j)\)
(ここで、\(C_{i,j}=\frac{n!}{(i-1)!(j-i-1)!(n-j)!}\))
=(式4)

((式3)の中の、
\((F(x_i+δx_i)-F(x_i))/δx_i\)⇒\(f_(i)(x)\)と
\((F(x_j+δx_j)-F(x_j))/δx_j\)⇒\(f_(j)(x)\)に
なります。)

➂順序統計量確率密度関数の導出がもっと理解できる

二項定理から導出できるのは事実ですが、順序よく並ぶイメージがまったくありません。

むしろ、順序よく並ぶ関数が先にあって、それを整えて作られたのが順序統計量の確率密度関数の形であるとQCプラネッツでは考えています。

なので、

順序よく並ぶ関数の形を探す
関数の値が綺麗になるように係数で整える

の順番で順序統計量の確率密度関数を考えていきます。

高校数学の関数で期待値が昇順に並ぶ例を学ぶ

順序よく並ぶ関数の形を探す
関数の値が綺麗になるように係数で整える

を簡単な事例で解説します！　しかも高校数学でできます！　

高校数学でしかも、\(x^n\)の式で、期待値が昇順に並ばせることができる関数があります。面白い！ので次の例題を提示します！大学入試に出題されてもいい良問です！

順序統計量の確率密度関数が理解できる高校数学問題

4次関数
\(f_1 (x)= 5(1-x)^4\)
\(f_2 (x)= 5x(1-x)^3\)
\(f_3 (x)= 5x^2 (1-x)^2\)
\(f_4 (x)= 5x^3 (1-x)^1\)
\(f_5 (x)= 5x^4 \)
(つまり、\(f_i (x)= 5x^{i-1} (1-x)^{5-i}\) (\(i\)=1,2,3,4,5))
( 0 < \(x\) < 1)
を定義する。
(1) \(f_i (x)= 5x^{i-1} (1-x)^{5-i}\) (\(i\)=1,2,3,4,5))の概形を描け。
(2) 期待値E[\(x_i\)]=\( \displaystyle \int_{0}^{1} x f_i(x)\)を計算せよ。
(3) 期待値E’ [\(x_i\)]=\(\frac{5!}{i!(5-i)!}\)E[\(x_i\)]を求めよ。
ただし、以下の式\( \displaystyle \int_{0}^{1} x^{p-1} (1-x)^{q-1} dx\)=\(\frac{(p-1)!}{(q-1)!}{(p+q-1)!}\)は証明せずに使ってよい。

どうでしょう。見た目、大学入試か高校の実力試験に出ても違和感ないですよね！

ここからは、関連記事で詳細に解説しているので、読んでください。

順序統計量確率密度関数の考え方がよくわかる
順序統計量が説明できますか？順序統計量の確率密度関数の式が理解・導出できますか？本記事では、確率密度関数の式の構成や理論をわかりやすく解説します。統計学を学ぶ方は必読です。

実は、上の例の(3)
期待値E’ [\(x_i\)]=\(\frac{5!}{i!(5-i)!}\)E[\(x_i\)]こそが順序統計量の確率密度関数の形になっていますし、この期待値を計算すると\(i/n\)に近い式になり、\(i\)を増やすと期待値もそれに従って順序よく増加し、下の図のイメージになります。

順序統計量

順序統計量の確率密度関数を理解する方法

再掲しますが、

順序よく並ぶ関数の形を探す
関数の値が綺麗になるように係数で整える

最初の、順序よく並ぶ関数の形を探すは、上の例題と関連記事の解説から
\(x^{i}(1-x)^{n-i}\)が関数の項にあれば、期待値は\(i\)を増やすごとに増加し、順序どおり並びます。

もっと一般化すると、
●\(x^{i}(1-x)^{n-i}\)が関数の項にあること
●\(f(x)^{i}(1-f(x))^{n-i}\)が関数の項にあること
●\(x^{i}(y-x)^{j-i} (1-y)^{n-j}\)が関数の項にあること
となると、これらも順序よく並びます。

まず、二項定理から導出するのではなく、順序よく並ぶ関数を用意することが先とQCプラネッツは考えます。

次に、関数の値が綺麗になるように係数で整えるために二項定理のような係数がつきます。

実際に、\(x^{i}(1-x)^{n-i}\)を積分するとベータ関数を適用し、計算結果が階乗!を使いまくる式になります。そのままは使いにくいので、「!」を無くすように関数の前に係数が付きます。

つまり、下図のように順序統計量の式は構成されています。これは同時確率密度関数の場合も同じです。

順序統計量

難しい公式を無理に暗記せず、意味を理解しましょう。順序統計量は意味をよく理解することが大事です。

まとめ

「順序統計量の同時確率密度関数の導出がよくわかる」を解説しました。

①順序統計量のイメージが理解できる
➁順序統計量の教科書的な確率密度関数の導出
➂順序統計量確率密度関数の導出がもっと理解できる

統計学