Googleクラスルーム
GeoGebraGeoGebra Classroom

10.連続的な確率変数

このページは電子ブック探求 数学B・Cの一部です。

★PDFの密度を積分してCDFの確率になるね。

1.連続的な確率変数と確率

<連続的な確率変数> ダーツをしたり、PCで乱数を発生させたりするとき1つ1つの点や値には確率がない。 1つ1つのX=aに対する確率がなくてもa<=X<=bのようなXの幅なら確率があるでしょう。 ・たとえば、(0,1)区間上の定数分布 f(x) =1があるとしよう。  確率は、P(X ≤ 0.50) = = 0.50 − 0 =0 .5と決められる。 まあ、よこが1,たてが1の面積1の長方形の面積のうち、2分の1の幅でたて切りすると、 面積も2分の1を占めるということだね。面積の割合が確率を表しているということだ。 ・この場合F(k)=p(X<=k)=と定義すると、F(X)が累積分布関数cdf[cumulative distribution function]で、Xが離散量のときと、変わらないネーミングだ。 F(X)= だから、dF(X)/dx=f(x)。 ・しかし、f(x)は確率密度関数pdf[probability density function]と呼ばれている。 なぜ密度[density]なのか? 面積が確率そのものだけれど、たては、f(x)=(確率を表す面積)÷区間(質量÷長さ=密度)という比喩からきているようだ。 <離散量から類比しよう> 離散量でのやり方と類比[analogy]しよう。 連続量の場合、確率変数に対する確率に対応するのは確率密度関数をf(X)だ。 確率の合計∑に対応するのは、密度関数f(x)の積分∫f(X)dxだね。 離散量の変数Xの変域に対応するのは、連続量の積分区間だ。 ・だから、xipi、xi2piの合計∑を類比すると、xf(x),x2f(x)の積分∫だね。 ということは、E(X)=∫xf(x)dx、E(X2)=∫x2f(x)dxとできるだろう。 <期待値と分散の定義> 連続型の確率変数Xの区間I=(s,t)で確率密度関数f(X)が定義されているとする。 ・区間Iで、f(x)は非負。 ・Xがa以上b以下になる確率P=  ・全区間Iでの確率和=1つまり、∫I f(x)dx = 1。 ・E(X)= = μ(平均) ・V(X)=E(X2)-μ2 ・σ=√V(x) (例) Xの区間を(0,1)とするとき、連続一様分布f(x)=1とする。 E(X)=(平均) E(X2)= V(X)=E(X2)-μ2=1/3-(1/2)2=1/12 σ=1/6√3=0.288675。 (例) Xの区間を(0,2)とするときの連続一様分布f(x)=1/2とする。 E(X)=(平均) E(X2)= V(X)=E(X2)-μ2=4/3-(1)2=1/3 σ=1/√3=0.577。 <正規化と標準化> 正規というのは、確率和=1であること。 もしも、確率和=kとなるようなら、f(x)を1/k倍すると積分値も1/kになり正規化できる。 標準というのは、Xの平均m=0,標準偏差=1であること。 標準化するには変数XをZ=(X-m)/σの変換をする。 mは(m-m)/σ=0になり、σは1/σ倍されて1になる。

★電車の待ち時間の正規分布は?

★正規分布表の代用です

2.標準正規分布N(0,1)

<正規分布N(μ、σ2)> 平均が実数μ、標準偏差σが正である確率密度関数f(x)=K・eg(x)になるものを正規分布N(μ, σ2)という。 ただし、K=1/((2π)1/2σ), e=2.718281828......,g(x)=-(x-μ)2/(2σ2) g(x)の変化はx=μのとき0で、それ以外では負でμから離れるほど絶対値は大きくなる。 x=μ+2σのとき、g(x)=-2σ、x=μ+σのとき、g(x)=-1/2σ Kはxによらない定数だが、σが分母にあるので大きくなると小さくなる。 eg(x)は、x=μのときe0=1で最大となる。頂点の座標は(μ, K) x=μ+2σのとき(1/e)2=((1/e)2)=0.135335 x=μ+σのとき(1/e)1/2=((1/e)1/2)=0.60653 だから、xが平均μから標準偏差σの1倍離れると、大きさは最大値の0.606倍と小さくなる。 平均μから標準偏差σの2倍離れると、大きさは最大値の0.135倍と激減する。 x=μ±σで、関数f(X)は変曲点となり、上に凸から下に凸に変わる境目となっているようだ。 xの値を代入しても確率密度しか出せないから、積分することで確率を出してみよう。 確率は区間の積分値で求められる。 μを中心に±σの確率は0.683 , 2σでは0.954、3σでは0.997 <標準正規分布N(0,1)と変数変換> 平均が0、標準偏差1の確率密度関数f(x)=K・eg(x)になるものを標準正規分布N(0, 1)という。 ただし、K=1/√(2π), e=2.718281828......,g(x)=-x2/2。 変数XがN(m,σ2)分布のとき、Z=(X-m)/σ変換をすれば、変数ZはN(0,1)分布になる。 PCや統計パッケージが手元になくても、標準正規分布表のデータを見てZ値の確率を読み取る。 また、二項分布B(n,p)(E(X)=np,V(x)=npq)はnが大きいと正規分布N(np, npq)(p+q=1)に近くなる。 (例) 「変数Xの分布N(20,52)で20以上28以下の確率」は? Z=(X-20)/5の変換をすると、ZはN(0,1)の分布になる。 Xが20以上28以下なら、Zは0以上1.6以下の確率で、正規分布表から、p=0.445。 (例) 「サイコロを720回投げるとき1の目が135回以下の確率」は? 1の目が出る回数をX回とすると、Xは分布B(720,1/6)に従う。 E(x)=m=np=720・1/6=120。V(x)=npq=120・(1-1/6)=100は、近似的にN(120,100)分布が使える。 変数変換Z=(X-120)/√100=(X-120)/10をしたZはN(0,1)分布になる。 X=135に対して、Z=(135-120)/10=1.5の確率を正規分布表から読むと0.433。