QCプラネッツ 品質のプロフェッショナルを育成するサイト

順序統計量 確率密度関数の考え方がよくわかる

統計学

「順序統計量の確率密度関数がさっぱりわからない」と困っていませんか?

こういう疑問に答えます。

本記事のテーマ

順序統計量 確率密度関数の考え方がよくわかる
  • ①順序統計量の確率密度関数とは
  • ➁昇順に並べられるように確率密度関数を作った
  • ➂もっと簡単に順序統計量の確率密度関数を作っても良いのでは?
高校数学で十分わかる!
順序にそって、期待値が増加していることを図で理解しよう!

①順序統計量の確率密度関数とは

確率密度関数の求め方

関数は、

\(f_i(x)\)=\(\frac{n!}{(i-1)!1!(n-i)!}F(x)^{i-1} (1-F(x))^{n-i} f(x)\)

で、感想は

なんじゃこりゃ! 意味不明!

教科書、wikiなど導出過程を確認ください。

でも、

なんじゃこりゃ! 意味不明!

確率密度関数の求め方が理解できない

いくつか疑問に思うのが、
\(f_i(x)\)=\(\frac{n!}{(i-1)!1!(n-i)!}F(x)^{i-1} (1-F(x))^{n-i} f(x)\)

●\(\frac{n!}{(i-1)!1!(n-i)!}\)
●\(F(x)^{i-1} (1-F(x))^{n-i} \)
●\( f(x)\)
に分解すると

  1. \(f_i(x)\)は何で、\(F(x)^{i-1}(1-F(x))^{n^i} \)の形なの?
  2. \(f_i(x)\)に何で、\(\frac{n!}{(i-1)!1!(n-i)!}\)が係数に入っているの?
  3. 最後の\(f(x)\)を積するイメージが沸かない
順序統計量とリンクしない考え方で立式しているので、理解できないし、
式が難解で計算できないなら、順序に並ぶイメージが全くつかない。

QCプラネッツも最近までは、順序統計量は理解できず諦めていました。

順序統計量というのだから、昇順に並ぶ様子を計算して可視化したい!

➁昇順に並べられるように確率密度関数を作った

順序統計量の確率密度関数がわかりにくい理由は再掲すると

  1. \(f_i(x)\)は何で、\(F(x)^{i-1}(1-F(x))^{n^i} \)の形なの?
  2. \(f_i(x)\)に何で、\(\frac{n!}{(i-1)!1!(n-i)!}\)が係数に入っているの?
  3. 最後の\(f(x)\)を積するイメージが沸かない

(i)期待値E[X]を計算すると確率密度関数の構成の意図が見える

まず、

  • \(f_i(x)\)は何で、\(F(x)^{i-1}(1-F(x))^{n^i} \)の形なの?

が理解できるよう解説します。

一様分布と指数関数を例に\(n=5\)の場合の\(i\)を1から5まで変えた場合の期待値E[X]の変化を先に見ましょう。

一様分布

関数は、
\(f_i(x)\)=\(\frac{n!}{(i-1)!1!(n-i)!}x^{i-1} (1-x)^{n-i} \)
(\(F(x)=x\),\(f(x)=1\))

期待値は、
E[\(X_i\)]=\(\displaystyle \int_{0}^{1} xf_i(x)\)

導出過程は関連記事にあります。

順序統計量の考え方がよくわかる
順序統計量を説明できますか? 本記事では難解な順序統計量をわかりやすく解説します。整式を使い、期待値が順序に従い増加することを視覚的に理解できます。順序統計量を理解したい方は必見です。

順序統計量

指数分布

関数は、
\(f_i(x)\)=\(\frac{n!}{(i-1)!1!(n-i)!}(1-e^{-x})^{i-1} (e^{-x})^{n+1-i} \)
(\(F(x)=1-e^{-x}\),\(f(x)=e^{-x}\))

期待値は、
E[\(X_i\)]=\(\displaystyle \int_{0}^{∞} xf_i(x)\)

導出過程は関連記事にあります。

順序統計量

図のポイント

上の2つの図で着目点は、\(i\)が増えることによってグラフのピークが右にズレていっている点です。これが期待値E[X]を昇順に並べる秘訣なんです!

順序統計量

昇順に並べる秘訣は\((1-f(x))^i f(x)^{n-i}\)の形

面白い事に、次の関数をグラフで描いてみましょう。

\(f_i(x)\)=\(x^i (1-x)^{5-i}\) (\(n=5)\)

つまり、
●\(f_1(x)\)=\(x(1-x)^4\)
●\(f_2(x)\)=\(x^2 (1-x)^3\)
●\(f_3(x)\)=\(x^3 (1-x)^2\)
●\(f_4(x)\)=\(x^4 (1-x)\)
●\(f_5(x)\)=\(x^5 \)
の5本です。単純な5次関数なので、これは簡単に描けますよね!

順序統計量

よく見ると面白いことに気が付きませんか?

\(i\)が増えることによってグラフのピークが右にズレていっている点です。これが期待値E[X]を昇順に並べる秘訣になっているとわかりますよね!

つまり、順序に並べるには、一般化すると

\( f(x)^i (1-f(x))^{n-i}\)の式が欲しくなる!

これ結構大事なポイントです!

(ii)期待値、分散を簡易にするための係数がついている

次に、

  • \(f_i(x)\)に何で、\(\frac{n!}{(i-1)!1!(n-i)!}\)が係数に入っているの?

を解説します。

では、何で、

\(f_i(x)\)=\(\frac{n!}{(i-1)!1!(n-i)!}F(x)^{i-1} (1-F(x))^{n-i} f(x)\)の
\(\frac{n!}{(i-1)!1!(n-i)!}\)があるのか?

これは、ベータ関数を知っていれば、計算を楽にするためだ!っとわかります。

一様分布の例で紹介します!

先ほどの場合、関数は、
\(f_i(x)\)=\(\frac{n!}{(i-1)!1!(n-i)!}x^{i-1} (1-x)^{n-i} \)
(\(F(x)=x\),\(f(x)=1\))
でしたね。

期待値は、
E[\(X_i\)]=\(\displaystyle \int_{0}^{1} xf_i(x)\)
=\(\displaystyle \int_{0}^{1} \frac{n!}{(i-1)!1!(n-i)!}x^{(i-1)+1} (1-x)^{n-i}dx \)
=\( \frac{n!}{(i-1)!1!(n-i)!}\)\( (\displaystyle \int_{0}^{1} x^i (1-x)^{n-i}dx \)
で、積分の部分に注目すると、ベータ関数になっていますよね。

\(\displaystyle \int_{0}^{1} x^i (1-x)^{n-i} dx \)
=\(B(i+1,n-i+1)\)
=\(\frac{(i)! (n-i)!}{(n+1)!}\)
と「!」だらけですよね。

積分部分がベータ関数によって「!」だらけになるで、
\(\frac{n!}{(i-1)!1!(n-i)!}\)を入れてシンプルな式にするためと思うとわかりやすい

実際に
E[\(X_i\)]
=\(\displaystyle \int_{0}^{1} \frac{n!}{(i-1)!1!(n-i)!}x^i (1-x)^{n-i}dx \)
=\( \frac{n!}{(i-1)!1!(n-i)!}\) \(\frac{i! (n-i)!}{(n+1)!}\)
=\(\frac{ n!}{ (n+1)!}\) \(\frac{ i!}{ (i-1)!}\) \(\frac{ (n-i)!}{ (n-i)!}\)
=\(\frac{i}{n+1}\)
とシンプルになります。

(iii)最後の\(f(x)\)を積するイメージが沸かない

最後に、

  • 最後の\(f(x)\)を積するイメージが沸かない

最後の\(f(x)\)は、計算してわかったのは、あっても無くても影響はない。

一様分布の期待値なら、最後の\(f(x)\)があっても無くても
E[\(X_i\)]=\(\frac{i}{n+1}\)のままです。

指数関数の場合は積分の計算の一部の指数の値が変わる程度と、あっても無くても影響はない。です。後ろについてる尻尾と思う感じでOKです。

順序統計量の確率密度関数の式のイメージ

  1. \(f_i(x)\)は何で、\(F(x)^{i-1}(1-F(x))^{n^i} \)の形なの?
    ⇒昇順に期待値を並べるため
  2. \(f_i(x)\)に何で、\(\frac{n!}{(i-1)!1!(n-i)!}\)が係数に入っているの?
    ⇒期待値の値をシンプルにするため
  3. 最後の\(f(x)\)を積するイメージが沸かない⇒期待値の値をシンプルにするため
    ⇒期待値の値には大きな影響はない

と理解しておけば、
\(f_i(x)\)=\(\frac{n!}{(i-1)!1!(n-i)!}F(x)^{i-1} (1-F(x))^{n-i} f(x)\)
もわかりやすくなったと思います。

➂もっと簡単に順序統計量の確率密度関数を作っても良いのでは?

昇順に期待値が並べたらいい

確率密度関数の式の構成を理解すると、次の疑問が沸きませんか?

期待値の昇順を含む、もっと簡単な関数でも良いのではないか?

現状、順序統計量の確率密度関数は、関数\(f(x)\)に昇順の項を入れずに、順序統計量の式を
\(f_i(x)\)=\(\frac{n!}{(i-1)!1!(n-i)!}F(x)^{i-1} (1-F(x))^{n-i} f(x)\)として、昇順に並ぶように関数を作っていますよね!

ならば、最初から、関数\(f(x)\)に昇順の項を入れた簡単な式にしておけばよいのは?

つまり、

●関数\(f(x)\)に昇順の項を入れない⇒教科書の順序統計量で、計算が非常に複雑で難しい
●関数\(f(x)\)に昇順の項を入れる⇒簡単になる、教科書には書いていない非公式な関数にはなるけど

実際、\(f_i(x)\)=\(\frac{n!}{(i-1)!1!(n-i)!}F(x)^{i-1} (1-F(x))^{n-i} f(x)\)で手計算で解析できるのは、一様分布と指数分布くらいで、正規分布は解析できません。

一方、式を簡単にしておけば、どんな分布関数でも順序統計量を表現する確率密度関数は作れます。QC
プラネッツではいくつか具体事例を挙げて解説していきます。

大事なのは、式から順序統計量をしっかり理解すること

どの式が良いかの比較ではなく、いろいろな式を提案してもよいです。それによって、順序統計量の理解を深めることができるからです。

順序統計量は、視覚的に理解して、確率密度関数の式の意味を理解することが大事!

まとめ

「順序統計量 確率密度関数の考え方がよくわかる」を解説しました。

  • ①順序統計量の確率密度関数とは
  • ➁昇順に並べられるように確率密度関数を作った
  • ➂もっと簡単に順序統計量の確率密度関数を作っても良いのでは?


Warning: count(): Parameter must be an array or an object that implements Countable in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 119

    Warning: Invalid argument supplied for foreach() in /home/qcplanets/qcplanets.com/public_html/wp-content/themes/m_theme/sns.php on line 122
error: Content is protected !!