QCプラネッツ 品質のプロフェッショナルを育成するサイト

順序統計量の同時確率密度関数の期待値・分散がよくわかる

統計学

「順序統計量がさっぱりわからない」と困っていませんか?

こういう疑問に答えます。

本記事のテーマ

順序統計量の同時確率密度関数の期待値・分散がよくわかる
  • ①順序統計量のイメージが理解できる
  • ➁順序統計量の期待値・分散を復習する
  • ➂順序統計量(一様分布)の同時確率密度関数の期待値・分散の導出
  • ➃順序統計量(一様分布)の同時確率密度関数の期待値の導出
  • ➄順序統計量(一様分布)の同時確率密度関数の分散の導出
高校数学で十分わかる!
順序にそって、期待値が増加していることを図で理解しよう!

①順序統計量のイメージが理解できる

順序統計量とは

順序統計量は意外と使われています。範囲R、R管理図、2点間距離の分布とかです。直観的にはわかりやすけど、数式で書くとめっちゃムズイのが順序統計量!

定義は、

確率変数\(X_1\),\(X_2\),…,\(X_n\)が独立の確率分布に従うとき、
これらを大きい順に並べたとき、\(k\)番目の確率変数を\(X_{(k)}\)と書くと、
\(X_{(1)}\) < \(X_{(2)}\) < \(X_{(k)}\) < … < \(X_{(n)}\)
に並ぶ統計量を基本統計量という。

定義は、そうなんだ!と言う感じですが、確率分布関数を見ると「なんじゃこりゃ」とムズくなります。

確率分布関数\(f_{(i)}(x)\)=\(\frac{n!}{(i-1)!1!(n-i)!} F(x)^{i-1}[1-F(x)]^{n-i}f(x)\)

順序統計量の確率分布関数を見たら、勉強辞めようとなっちゃいます!
順序統計量は式変形の解説が多いので、わかりやすく図で理解できるよう解説します。

順序統計量のイメージ

言葉の定義どおり、\(X_{(1)}\) < \(X_{(2)}\) < \(X_{(k)}\) < … < \(X_{(n)}\)
に並びます。

面白いのは、

確率分布関数\(f_{(i)}(x)\)の式は1つだが、整数\(i\)を0から1ずつ増やして代入してできる確率分布関数の期待値を計算すると、期待値がちゃんと増加していく!

図で理解しましょう! 下図をご覧ください。

順序統計量

もともと確率分布関数\(f_{(i)}(x)\)の式は1つですが、整数\(i\)を0から1ずつ増やして代入してできる確率分布関数の期待値を計算すると、期待値がちゃんと増加しているのがわかりますよね。

視覚的に順序統計量がイメージできたところで、実際に計算して、上図を作ってみましょう。

➁順序統計量の期待値・分散を復習する

まずは、一様分布、指数分布、正規分布の事例から読もう!

いきなり、同時分布の事例を読むと、苦戦します。なので、最初は、一変数の事例から読んで欲しいです。関連記事を紹介します。

一様分布

順序統計量の考え方がよくわかる
順序統計量を説明できますか? 本記事では難解な順序統計量をわかりやすく解説します。整式を使い、期待値が順序に従い増加することを視覚的に理解できます。順序統計量を理解したい方は必見です。

指数分布

順序統計量(指数関数)がよくわかる
順序統計量が説明できますか? 本記事は指数分布の場合における順序統計量の期待値と分散を丁寧に導出します。順序統計量や統計学を学ぶ人は必読です。

正規分布

順序統計量(正規分布)がよくわかる
順序統計量は説明できますか?本記事では正規分布の順序統計量をわかりやすく解説します。正規分布の順序統計量を定義式から解析的に導出できないため、順序統計量の定義を見直す必要があることを提案します。数学は公式として従うのものではなく式を理解して定義するものでもあります。順序統計量や統計学を学ぶ方は必読です。

➂順序統計量(一様分布)の同時確率密度関数の期待値・分散の導出

実例として一様分布で期待値・分散を計算します。他の分布関数ではちょっと計算が大変なので。

同時確率密度関数\(f_{(i),(j)}(x_i,x_j)\)

同時確率密度関数を確認しましょう。関連記事で導出やイメージを解説しますが、ここでは式を実際に使って慣れましょう。

\(f_{(i),(j)}(x_{(i)},x_{(j)})\)=\(C_{i,j}F(x_i)^{i-1}\)\((F(x_j)-F(x_i))^{j-i-1}\)\((1-F(x_j))^{n-j}f(x_i)f(x_j)\)
(-∞ < \(x_i\) < \(x_j\) < ∞ )

期待値・分散の導出例題

次の例題を考えます。

確率変数\(X\)の確率密度関数\(f(x)\)および分布関数\(F(x)\)が
●\(f(x)\)=1 (0 < \(x\) < 1)
●\(F(x)\)=x (0 < \(x\) < 1)
の一様分布に従うとする。このとき、\(X_{(i)}\)と\(X_{(j)}\) (0 < \(X_{(i)}\) < \(X_{(j)}\) < 1)の同時分布について
(1)期待値E[\(X_{(i)}\)]
(2)期待値E[\(X_{(i)} X_{(j)}\)]
(3)分散V[\(X_{(i)}\)]
(4)共分散Cov[\(X_{(i)} X_{(j)}\)]
をそれぞれ求めよ。

➃順序統計量(一様分布)の同時確率密度関数の期待値の導出

期待値の公式を確認

変数が2つ\(x_i\), \(x_j\)あるので、期待値は3種類考えます。
(i)E[\(X_{(i)}\)]
(ii)E[\(X_{(j)}\)]
(iii)E[\(X_{(i)} X_{(j)}\)]

(i)E[\(X_{(i)}\)]と(ii)E[\(X_{(j)}\)]は文字\(i\)と\(j\)を変えるだけで式は同じです。なので、
(1)期待値E[\(X_{(i)}\)]⇒(i)E[\(X_{(i)}\)]
(2)期待値E[\(X_{(i)} X_{(j)}\)]⇒(iii)E[\(X_{(i)} X_{(j)}\)]
を解いていきます。

期待値E[\(X_{(i)}\)]の導出

2変数ある同時確率密度関数は
\(f_{(i),(j)}(x_{(i)},x_{(j)})\)=\(C_{i,j}F(x_i)^{i-1}\)\((F(x_j)-F(x_i))^{j-i-1}\)\((1-F(x_j))^{n-j}f(x_i)f(x_j)\)
ですが、1変数の確率密度関数は何でしょうか? 

というと、すでに関連記事でも解説しているとおり、
確率密度関数\(f_{(i)}(x)\)=\(n _{n-1}C_{i-1} x^{i-1} (1-x)^{n-i}\)
です。

関連記事で期待値まで導出していますので、関連記事の内容を確認しておいてください。

順序統計量の考え方がよくわかる
順序統計量を説明できますか? 本記事では難解な順序統計量をわかりやすく解説します。整式を使い、期待値が順序に従い増加することを視覚的に理解できます。順序統計量を理解したい方は必見です。

期待値の計算結果だけ書くと

●期待値E[\(X_{(i)}\)], E[\(X_{(j)}\)]
E[\(X_{(i)}\)]=\(\frac{i}{n+1}\)
E[\(X_{(j)}\)]=\(\frac{j}{n+1}\)
となります。スッキリした式ですね。

期待値E[\(X_{(i)} X_{(j)}\)]の導出

期待値E[\(x_i\)]公式通りです。確認すると、
E[\(x_{(i)}\)]=\( \displaystyle \int_{0}^{1} x_{(i)} f_{(i)}(x) dx\)
E[\(x_{(i)} x_{(j)}\)]=\( \displaystyle \int_{0}^{1} \displaystyle \int_{0}^{x_{(j)}}\)\( x_{(i)} x_{(j)} f_{(i),(j)}(x_{(i)},x_{(j)}) dx_{(i)} dx_{(j)}\)
ですよね。

なお、
0 < \(X_{(i)}\) < \(X_{(j)}\) < 1
より、積分区間は
●\(x_{(i)}\)⇒ 0~\(x_{(j)}\)
●\(x_{(j)}\)⇒ 0~1
とします。

期待値E[\(X_{(i)} X_{(j)}\)]の導出

E[\(x_{(i)} x_{(j)}\)]=\( \displaystyle \int_{0}^{1} \displaystyle \int_{0}^{x_{(j)}}\)\( x_{(i)} x_{(j)} f_{(i),(j)}(x_{(i)},x_{(j)}) dx_{(i)} dx_{(j)}\)

=\( \displaystyle \int_{0}^{1} \displaystyle \int_{0}^{x_{(j)}} x_{(i)} x_{(j)} \)
\(C_{i,j} x_{(i)}^{i-1} (x_{(j)}-x_{(i)})^{j-i-1} (1-x_{(j)})^{n-j} ・1・1 dx_{(i)} dx_{(j)} \)
(\(F(x_i)= x_{(i)}\), \(F(x_j)= x_{(j)}\), \(f(x_i)=1,f(x_j)=1\)を代入)

=\( \displaystyle \int_{0}^{1} \displaystyle \int_{0}^{x_{(j)}} C_{i,j} x_{(i)}^i x_{(j)} (x_{(j)}-x_{(i)})^{j-i-1} (1-x_{(j)})^{n-j} dx_{(i)} dx_{(j)} \)
=(式1)

(式1)の\(x_{(i)}\)について先に積分します。つまり、
\( \displaystyle \int_{0}^{x_{(j)}} \)\(x_{(i)}^i (x_{(j)}-x_{(i)})^{j-i-1} dx_{(i)} \)
は第1種オイラーの積分
\( \displaystyle \int_{α}^{β} (x-α)^m (β-x)^n dx \)=\(\frac{m! n!}{(m+n+1)!} (β-α)^{m+n+1}\)
を使って、
●\(x\)⇒\(x_{(i)}\)
●\(α\)⇒0
●\(m\)⇒\(i\)
●\(β\)⇒\(x_{(j)}\)
●\(n\)=\(j-i-1\)
を代入します。

よって、(式1)の\(x_{(i)}\)についての積分部分は
\( \displaystyle \int_{0}^{x_{(j)}} \)\(x_{(i)}^i (x_{(j)}-x_{(i)})^{j-i-1} dx_{(i)} \)
=\(\frac{i! (j-i-1)!}{j!} x_{(j)}^j\)
=(式2)

(式2)を(式1)に代入します。
(式1)
=\( \displaystyle \int_{0}^{1} C_{i,j} x_{(j)} (1-x_{(j)})^{n-j} \frac{i! (j-i-1)!}{j!} x_{(j)}^j dx_{(j)} \)
一旦係数を外に出します。
=\( C_{i,j} \frac{i! (j-i-1)!}{j!} \displaystyle \int_{0}^{1} x_{(j)}^{j+1} (1-x_{(j)})^{n-j} dx_{(j)} \)
=(式3)

(式3)の積分を見ると、ベータ関数が使えることが分かります。
=\( \displaystyle \int_{0}^{1} x_{(j)}^{j+1} (1-x_{(j)})^{n-j} dx_{(j)} \)
=B(\(j+2,n-j+1\))
=\(\frac{(j+1)! (n-j)!}{(n+2)!}\)
=(式4)

(式4)を(式3)に代入し、\(C_{i,j}\)=\(\frac{n!}{(i-1)!(j-i-1)!(n-j)!}\)を代入すると
(式3)
=\(\frac{n!}{(i-1)!(j-i-1)!(n-j)!} \frac{i! (j-i-1)!}{j!} \frac{(j+1)! (n-j)!}{(n+2)!} \)
=\(\frac{i(j+1)}{(n+1)(n+2)}\)

よって、

期待値E[\(X_{(i)} X_{(j)}\)]= \(\frac{i(j+1)}{(n+1)(n+2)}\)

計算できました。2変数\(i,j\)の積が入るんだろうなという予想通りの式ですね。

期待値をまとめると

【期待値】
●期待値E[\(X_{(i)}\)]= \(\frac{i}{n+1}\)
●期待値E[\(X_{(i)} X_{(j)}\)]= \(\frac{i(j+1)}{(n+1)(n+2)}\)

➄順序統計量(一様分布)の同時確率密度関数の分散の導出

分散の公式を確認

変数が2つ\(x_i\), \(x_j\)あるので、分散と共分散の計3種類考えます。
(i)V[\(X_{(i)}\)]
(ii)V[\(X_{(j)}\)]
(iii)Cov[\(X_{(i)} X_{(j)}\)]

(i)V[\(X_i\)]と(ii)V[\(X_j\)]は文字\(i\)と\(j\)を変えるだけで式は同じです。なので、
(1)分散V[\(X_{(i)}\)]⇒(i)E[\(X_i\)]
(2)分散Cov[\(X_{(i)} X_{(j)}\)]⇒(iii)Cov[\(X_{(i)} X_{(j)}\)]
を解いていきます。

分散V[\(X_{(i)}\)]の導出

分散もすでに関連記事で解説しています。こちらで確認ください。

順序統計量の考え方がよくわかる
順序統計量を説明できますか? 本記事では難解な順序統計量をわかりやすく解説します。整式を使い、期待値が順序に従い増加することを視覚的に理解できます。順序統計量を理解したい方は必見です。

分散の計算結果だけ書くと

●分散V[\(X_{(i)}\)],V[\(X_{(j)}\)]
V[\(X_{(i)}\)]=\(\frac{i(n-i+1)}{(n+1)^2 (n+2)}\)
V[\(X_{(j)}\)]=\(\frac{j(n-j+1)}{(n+1)^2 (n+2)}\)
となります。

共分散V[\(X_{(i)} X_{(j)}\)]の導出

共分散V[X,Y]=E[XY]-E[X]E[Y]という公式があり、
V[\(X_{(i)} X_{(j)}\)]= E[\(X_{(i)} X_{(j)}\)- E[\(X_{(i)}\)] E[\(X_{(j)}\)]
から計算できます。

よって、
V[\(X_{(i)} X_{(j)}\)]=E[\(X_{(i)} X_{(j)}\)- E[\(X_{(i)}\)] E[\(X_{(j)}\)]
=\(\frac{i(j+1)}{(n+1)(n+2)}\)- \(\frac{i}{n+1}\) \(\frac{j}{n+1}\)
=\(\frac{i(n-j+1)}{(n+1)^2 (n+2)}\)

よくみると、
V[\(X_{(i)}\)]=\(\frac{i(n-i+1)}{(n+1)^2 (n+2)}\)
V[\(X_{(i)} X_{(j)}\)] =\(\frac{i(n-j+1)}{(n+1)^2 (n+2)}\)
分子を比較するとよく似ているのがわかります。

分散、共分散をまとめると

【分散、共分散】
●期待値V[\(X_{(i)}\)]= \(\frac{i(n-i+1)}{(n+1)^2 (n+2)}\)
●期待値V[\(X_{(i)} X_{(j)}\)] =\(\frac{i(n-j+1)}{(n+1)^2 (n+2)}\)
順序統計量(一様分布)の同時確率密度関数の難しい式を使う良い演習ができました。

まとめ

「順序統計量の同時確率密度関数の期待値・分散がよくわかる」を解説しました。

  • ①順序統計量のイメージが理解できる
  • ➁順序統計量の期待値・分散を復習する
  • ➂順序統計量(一様分布)の同時確率密度関数の期待値・分散の導出
  • ➃順序統計量(一様分布)の同時確率密度関数の期待値の導出
  • ➄順序統計量(一様分布)の同時確率密度関数の分散の導出


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!