Statistical Programming

有名な確率分布

確率分布とは確率変数と確率変数に対応したその変数の起こる確率の分布。具体例で考えるとわかりやすい。サイコロの目が確率変数で、それぞれの目の出る確率(もちろん1/6)。それらをx軸が確率変数、y軸がその変数の確率といった形で分布化したものが確率分布。確率密度関数といっても差し支えないと思う。この場合、x軸は1〜6の離散値。y軸はその変数の確率なので全て1/6。よって横一直線の関数ができる。
<一様分布>上のサイコロの例のように常に確率密度関数が常に一定の値をとる分布を一様分布U(a,b)という。この分布では以下のことが言える。

f(x) = k [a<=x<=b]    ||   0   [x<a || x>b]  ,  µ = (a+b) / 2 , σ^2 = ( (b-a)^2 ) /12    

※kは一定であり確率の総和が1であることから求める。

<二項分布>
一回の試行である事象Aの起こる確率がpである時にこの試行をn回繰り返す。事象Aがk回起こる確率分布B(n,p)は
    nCk * p^k * ( (1-p)^(n-k) )
※nCkは組み合わせを表現。変数ではない
また平均、分散は
    µ = np
    σ^2 = np(1-p)

正規分布
みんな大好き正規分布は頻度派統計ほどじゃないがベイズでも大きな役割を果たす。正規分布確率密度関数N(µ,σ^2)は
f(x) = 1/(√(2π)-1) * e^(- (x-µ)^2 / 2σ-2 )
eはネイピア数でe=2.71828....
<ベータ分布>
事前分布、事後分布として利用されることの多い分布だがベイズ統計に置いてはその分布の意味自体ではなく分布の形だけが重要なことも多いらしい。ベータ分布の確率密度関数Be(p,q)は
f (x) = k * x^(p-1) * (1-x)^(q-1)
※kは定数、0<x<1,0<p,0<q
µ = p / (p+q)
σ^2 = pq / ( (p+q)^2 * (p+q+1) )

kは確率の総和が1になることから求められる(規格化の条件)。