10.連続的な確率変数
このページは電子ブック「探求 数学B・C」の一部です。
★PDFの密度を積分してCDFの確率になるね。
1.連続的な確率変数と確率
<連続的な確率変数>
ダーツをしたり、PCで乱数を発生させたりするとき1つ1つの点や値には確率がない。
1つ1つのX=aに対する確率がなくてもa<=X<=bのようなXの幅なら確率があるでしょう。
・たとえば、(0,1)区間上の定数分布 f(x) =1があるとしよう。
確率は、P(X ≤ 0.50) = = 0.50 − 0 =0 .5と決められる。
まあ、よこが1,たてが1の面積1の長方形の面積のうち、2分の1の幅でたて切りすると、
面積も2分の1を占めるということだね。面積の割合が確率を表しているということだ。
・この場合F(k)=p(X<=k)=と定義すると、F(X)が累積分布関数cdf[cumulative distribution function]で、Xが離散量のときと、変わらないネーミングだ。
F(X)= だから、dF(X)/dx=f(x)。
・しかし、f(x)は確率密度関数pdf[probability density function]と呼ばれている。
なぜ密度[density]なのか?
面積が確率そのものだけれど、たては、f(x)=(確率を表す面積)÷区間(質量÷長さ=密度)という比喩からきているようだ。
<離散量から類比しよう>
離散量でのやり方と類比[analogy]しよう。
連続量の場合、確率変数に対する確率に対応するのは確率密度関数をf(X)だ。
確率の合計∑に対応するのは、密度関数f(x)の積分∫f(X)dxだね。
離散量の変数Xの変域に対応するのは、連続量の積分区間だ。
・だから、xipi、xi2piの合計∑を類比すると、xf(x),x2f(x)の積分∫だね。
ということは、E(X)=∫xf(x)dx、E(X2)=∫x2f(x)dxとできるだろう。
<期待値と分散の定義>
連続型の確率変数Xの区間I=(s,t)で確率密度関数f(X)が定義されているとする。
・区間Iで、f(x)は非負。
・Xがa以上b以下になる確率P=
・全区間Iでの確率和=1つまり、∫I f(x)dx = 1。
・E(X)= = μ(平均)
・V(X)=E(X2)-μ2=
・σ=√V(x)
(例)
Xの区間を(0,1)とするとき、連続一様分布f(x)=1とする。
E(X)=(平均)
E(X2)=
V(X)=E(X2)-μ2=1/3-(1/2)2=1/12
σ=1/6√3=0.288675。
(例)
Xの区間を(0,2)とするときの連続一様分布f(x)=1/2とする。
E(X)=(平均)
E(X2)=
V(X)=E(X2)-μ2=4/3-(1)2=1/3
σ=1/√3=0.577。
<正規化と標準化>
正規というのは、確率和=1であること。
もしも、確率和=kとなるようなら、f(x)を1/k倍すると積分値も1/kになり正規化できる。
標準というのは、Xの平均m=0,標準偏差=1であること。
標準化するには変数XをZ=(X-m)/σの変換をする。
mは(m-m)/σ=0になり、σは1/σ倍されて1になる。
★電車の待ち時間の正規分布は?
★正規分布表の代用です
2.標準正規分布N(0,1)
<正規分布N(μ、σ2)>
平均が実数μ、標準偏差σが正である確率密度関数f(x)=K・eg(x)になるものを正規分布N(μ, σ2)という。
ただし、K=1/((2π)1/2σ), e=2.718281828......,g(x)=-(x-μ)2/(2σ2)
g(x)の変化はx=μのとき0で、それ以外では負でμから離れるほど絶対値は大きくなる。
x=μ+2σのとき、g(x)=-2σ、x=μ+σのとき、g(x)=-1/2σ
Kはxによらない定数だが、σが分母にあるので大きくなると小さくなる。
eg(x)は、x=μのときe0=1で最大となる。頂点の座標は(μ, K)
x=μ+2σのとき(1/e)2=((1/e)2)=0.135335
x=μ+σのとき(1/e)1/2=((1/e)1/2)=0.60653
だから、xが平均μから標準偏差σの1倍離れると、大きさは最大値の0.606倍と小さくなる。
平均μから標準偏差σの2倍離れると、大きさは最大値の0.135倍と激減する。
x=μ±σで、関数f(X)は変曲点となり、上に凸から下に凸に変わる境目となっているようだ。
xの値を代入しても確率密度しか出せないから、積分することで確率を出してみよう。
確率は区間の積分値で求められる。
μを中心に±σの確率は0.683 , 2σでは0.954、3σでは0.997
<標準正規分布N(0,1)と変数変換>
平均が0、標準偏差1の確率密度関数f(x)=K・eg(x)になるものを標準正規分布N(0, 1)という。
ただし、K=1/√(2π), e=2.718281828......,g(x)=-x2/2。
変数XがN(m,σ2)分布のとき、Z=(X-m)/σ変換をすれば、変数ZはN(0,1)分布になる。
PCや統計パッケージが手元になくても、標準正規分布表のデータを見てZ値の確率を読み取る。
また、二項分布B(n,p)(E(X)=np,V(x)=npq)はnが大きいと正規分布N(np, npq)(p+q=1)に近くなる。
(例)
「変数Xの分布N(20,52)で20以上28以下の確率」は?
Z=(X-20)/5の変換をすると、ZはN(0,1)の分布になる。
Xが20以上28以下なら、Zは0以上1.6以下の確率で、正規分布表から、p=0.445。
(例)
「サイコロを720回投げるとき1の目が135回以下の確率」は?
1の目が出る回数をX回とすると、Xは分布B(720,1/6)に従う。
E(x)=m=np=720・1/6=120。V(x)=npq=120・(1-1/6)=100は、近似的にN(120,100)分布が使える。
変数変換Z=(X-120)/√100=(X-120)/10をしたZはN(0,1)分布になる。
X=135に対して、Z=(135-120)/10=1.5の確率を正規分布表から読むと0.433。