１０．連続的な確率変数

このページは電子ブック「探求　数学B・C」の一部です。

★PDFの密度を積分してCDFの確率になるね。

１．連続的な確率変数と確率

＜連続的な確率変数＞ ダーツをしたり、PCで乱数を発生させたりするとき１つ１つの点や値には確率がない。１つ１つのX=aに対する確率がなくてもa<=X<=bのようなXの幅なら確率があるでしょう。・たとえば、（０，１）区間上の定数分布 f(x) =1があるとしよう。　確率は、P(X ≤ 0.50) =

= 0.50 − 0 =0 .5と決められる。まあ、よこが１，たてが１の面積１の長方形の面積のうち、2分の１の幅でたて切りすると、面積も2分の１を占めるということだね。面積の割合が確率を表しているということだ。・この場合F(k)=p(X<=k)=

と定義すると、F(X)が累積分布関数cdf[cumulative distribution function]で、Xが離散量のときと、変わらないネーミングだ。 F(X)=

　だから、dF(X)/dx=f(x)。・しかし、f(x)は確率密度関数pdf[probability density function]と呼ばれている。 なぜ密度[density]なのか？ 面積が確率そのものだけれど、たては、f(x)=（確率を表す面積）÷区間（質量÷長さ＝密度）という比喩からきているようだ。 ＜離散量から類比しよう＞ 離散量でのやり方と類比[analogy]しよう。 連続量の場合、確率変数に対する確率に対応するのは確率密度関数をf(X)だ。 確率の合計∑に対応するのは、密度関数ｆ(x)の積分∫f(X)dxだね。 離散量の変数Xの変域に対応するのは、連続量の積分区間だ。・だから、xipi、xi²piの合計∑を類比すると、xf(x),x²f(x)の積分∫だね。ということは、E(X)=∫xf(x)dx、E(X²)=∫x²f(x)dxとできるだろう。 ＜期待値と分散の定義＞ 連続型の確率変数Xの区間I=(ｓ,ｔ)で確率密度関数f(X)が定義されているとする。・区間Iで、f(x)は非負。・Xがa以上b以下になる確率P＝

　・全区間Iでの確率和＝１つまり、∫_If(x)dx = 1。・E(X)=

＝ μ（平均）・V(X)=E(X²)-μ²＝

・σ=√V(x) （例） Xの区間を(0,1)とするとき、連続一様分布f(x)=1とする。 E(X)=

(平均） E(X²)=

V(X)=E(X²)-μ²=1/3-(1/2)²=1/12 σ=1/6√3=0.288675。（例） Xの区間を(0,2)とするときの連続一様分布f(x)=1/2とする。 E(X)=

(平均） E(X²)=

V(X)=E(X²)-μ²=4/3-(1)²=1/3 σ=1/√3=0.577。 ＜正規化と標準化＞ 正規というのは、確率和＝１であること。もしも、確率和＝ｋとなるようなら、f(x)を1/k倍すると積分値も1/kになり正規化できる。標準というのは、Xの平均m=0,標準偏差=1であること。標準化するには変数XをZ=(X-m)/σの変換をする。 mは(m-m)/σ=0になり、σは1/σ倍されて１になる。

★電車の待ち時間の正規分布は？

★正規分布表の代用です

2.標準正規分布N（０，１）

＜正規分布N（μ、σ²）＞ 平均が実数μ、標準偏差σが正である確率密度関数f(x)=K・e^g(x)になるものを正規分布N(μ, σ²)という。ただし、K=1/((2π)^1/2σ), e=2.718281828......,g(x)＝-(x-μ)²/(2σ²) g(x)の変化はx=μのとき０で、それ以外では負でμから離れるほど絶対値は大きくなる。 x=μ+2σのとき、g(x)=-2σ、x=μ+σのとき、g(x)=-1/2σ Kはｘによらない定数だが、σが分母にあるので大きくなると小さくなる。 e^g(x)は、x=μのときe⁰=1で最大となる。頂点の座標は(μ, K) x=μ+2σのとき(1/e)²=((1/e)²)=0.135335x=μ+σのとき(1/e)^1/2=((1/e)^1/2)=0.60653 だから、xが平均μから標準偏差σの1倍離れると、大きさは最大値の0.606倍と小さくなる。平均μから標準偏差σの2倍離れると、大きさは最大値の0.135倍と激減する。 x=μ±σで、関数f(X)は変曲点となり、上に凸から下に凸に変わる境目となっているようだ。ｘの値を代入しても確率密度しか出せないから、積分することで確率を出してみよう。確率は区間の積分値で求められる。 μを中心に±σの確率は0.683 , 2σでは0.954、3σでは0.997 ＜標準正規分布N(0,1)と変数変換＞ 平均が0、標準偏差1の確率密度関数f(x)=K・e^g(x)になるものを標準正規分布N(0, 1)という。ただし、K=1/√(2π), e=2.718281828......,g(x)＝-x²/2。

変数XがN(m,σ²)分布のとき、Z=(X-m)/σ変換をすれば、変数ZはN(0,1)分布になる。 PCや統計パッケージが手元になくても、標準正規分布表のデータを見てZ値の確率を読み取る。また、二項分布B(n,p)（E(X)=np,V(x)=npq）はｎが大きいと正規分布N(np, npq)(p+q=1)に近くなる。（例）「変数Xの分布N(20,5²)で20以上28以下の確率」は？ Z＝(X-20)/5の変換をすると、ZはN(0,1)の分布になる。 Xが20以上28以下なら、Zは0以上1.6以下の確率で、正規分布表から、ｐ＝0.445。（例）「サイコロを720回投げるとき１の目が135回以下の確率」は？１の目が出る回数をX回とすると、Xは分布B(720,1/6)に従う。 E(x)=m=np=720・1/6=120。V(x)=npq=120・(1-1/6)=100は、近似的にN(120,100)分布が使える。変数変換Z=(X-120)/√100=(X-120)/10をしたZはN(0,1)分布になる。 X=135に対して、Z=(135-120)/10=1.5の確率を正規分布表から読むと0.433。

１０．連続的な確率変数

★PDFの密度を積分してCDFの確率になるね。

１．連続的な確率変数と確率

★電車の待ち時間の正規分布は？

★正規分布表の代用です

2.標準正規分布N（０，１）

新しい教材

教材を発見

トピックを見つける