暇人の研究室

金融工学やR言語・統計学について書いてます。

<

【統計学】中心極限定理の正規近似による確率計算

 

・中心極限定理の意味

 

 

大数の法則によって、標本平均は母平均 µ のまわりに分布し、µ から離れる確率は n が大きくなるにつれて 0 になります。

 

 

このとき、標本平均 X の平均と分散の値だけでなく、標本平均X の分布も中心極限定理はよって求めることが可能です。

 

 

ちなみに、この定理は母集団の平均と標本平均についてのものなので、「母分布が正規分布とは異なる一様分布であっても、n が十分に大きければ標本平均  X の分布は正規分布 N(µ,σ2/n) によって近似できる」ということも意味しています。

 

 

中心極限定理を利用するための条件は、母分布の平均と分散が存在することなので、母集団の分布の形はわかっていなくても大丈夫です。

 

 

つまり、中心極限定理により標本分布がわからない場合や、分布が複雑すぎて確率密度の計算が困難な場合でも、n が十分大きければ、中心極限定理により正規分布を仮定して、推定や検定を行うことが可能なのです。

 

 

ちなみに中心極限定理が適用できる n の大きさは 30 ∼ 100 以上とされることが多いです。

 

 

f:id:oruka199665:20170325031331j:plain

 

 

 

・中心極限定理を使った確率の計算例

 


例題 :ある工場で作られるネジの重さは過去の記録から平均 100グラム,標準偏差 σ が 5グラムであったとする。ある日この生産工程より 100コのネジを抜き出し、重さの品質調査を行うことになった。


(1) 100コのネジの平均重量が100グラム以上で 105グラム以下である確率を求めよ。
(2) 標本平均が 95 %の確率 を伴って入る区間 (a,b) を求めよ。

 

 

 

 解答(1)

要するにP(100 ≦ X≦ 105) を求めるという事になります。

中心極限定理によりnが大きければ ( n ≧ 100)、母分布がいかなる分布でも、母平均 µ と母分散 σ² が既知であれば、 X を標準化した Z を標準正規分布で近似できます。

 

 

すなわち、f:id:oruka199665:20170325032412j:plain


E(X) = µ = 100,  σ/√n = 5/√100 = 1/2 = 0.5

Z = X −100 /0.5 
.
P(100 ≦ X≦ 105) = P(100−100/ 2.5≦ Z ≦105−100 /2.5 )

= P(0 ≦ Z ≦ 2) =0.4772(標準正規分布表より)

→ 100コのネジの平均重量が 100グラム以上で 105 グラム以下の確率は 47.72%

 

 

 

解答(2)

 

この問題はつまりP(a ≦ X≦ b) ≈ 0.95 であるような a、b を求めろという事なので、まず標準正規分布表より、P(−c ≦ Z ≦ c) ≈ 0.95 であるような c を求めます。

 

 

標準正規分布は左右対称なので、 P(Z ≧ c) = (1−0.95)/2 = 0.025、P(Z ≦ c) = 1−P(Z ≧ c) = 1−0.025 = 0.975。標準正規分布表で 0.975 を探すと、c = 1.96 と求まり、P(−1.96 ≦ Z ≦ 1.96) ≈ 0.95 が得られる。

 

 

P(a ≦ X≦ b) ≈ 0.95  P(a−100/2.5 ≦ Z ≦ (b−100/2.5 )≈ 0.95  

a−100/2.5 = −1.96 を変形して→ a = 2.5 × (−1.96) + 100 =95.1

b−100/2.5 = 1.96 → b = 2.5 × 1.96 + 100 = 104.9

 

 

よって  P(95.1 ≦ X≦ 104.9) ≈ 0.95、つまり、母平均が 100 グラムであれば、標本平均が 100 時間から±4.9 時間 (= 2.5 × 1.96) から外の数値になるのは 100 回のうち 5 回程度だという事になります。

 

 

 

統計学についてしっかり勉強するのであれば、↓の本が分かりやすく説明していてオススメです。