§2 3 常用的离散型分布:常用的离散型分布:超几何分布超几何分布→→二项分布二项分布→→泊松分布泊松分布/一、退化分布 二、两点分布 * √四、二项分布 *六、超几何分布 * √七、泊松(Poisson)分布 注解:凡是带有×可以不讲,√都是重点,*都是难点*√本节重点难点:超几何分布的极限分布是二项分布,二项分布的极限分布是 Poisson 分布三、离散均匀分布 课件分布规律与上课指南:课件分布规律与上课指南:1.离散分布之一:超几何与二项离散分布之一:超几何与二项2.离散分布之二:二项与泊松离散分布之二:二项与泊松小结:超几何转二项,二项转泊松正态小结:超几何转二项,二项转泊松正态3.离散分布之三:四大分布数字特征离散分布之三:四大分布数字特征4.附录附录注意注意1:附录三有各种分布的:附录三有各种分布的EXCEL求解公式求解公式注意注意2:上课可以先将几个不重要的分布,在附录:上课可以先将几个不重要的分布,在附录1-退化退化/两点两点/0-1/均匀分布先简介均匀分布先简介30分钟,再分钟,再用用90分钟讲解四大分布及其关系分钟讲解四大分布及其关系 离散分布之一:超几何分布离散分布之一:超几何分布vs二项分布二项分布1,超几何分布:基本意义,超几何分布:基本意义/期望方差期望方差/与二项与二项分布的关系分布的关系2,二项分布:基本意义,二项分布:基本意义/期望方差期望方差/与超几何与超几何分布的关系分布的关系有放回抽样模型有放回抽样模型=重复抽样模型重复抽样模型=二项分布二项分布B(n,P),EXCEL:BINOMDIST(k,n,P,逻辑值逻辑值)不放回抽样模型不放回抽样模型=不重复抽样不重复抽样=超几何分布超几何分布H(n,N1,N),EXCEL:HYPGEOMDIST(k,n,N1,N) X= 0 1 2 … K …. M Cn0P0qn , Cn1P1qn-1, Cn2P2qn-2 … CnkPkqn-k… CnnPnq0 …… X P 0e− /0!, 1e − /1!,, 2e − /2 … ke− /k! … ne− /n! 三大分布的概率计算对比三大分布的概率计算对比 超几何分布超几何分布→→二项分布二项分布→→泊松分布泊松分布/ /正态分布正态分布 一、超几何分布→二项分布:案例分析案例:案例:10产品,产品,3-7+;;100件,件,30-70+,任取任取3无放回:无放回:X= 0 1 2 3 P(X=)=C73/C103 C31C72/C103 C32C71/C103 C33/C103 0.2917 0.525 0.175 0.0083 C703/C1003,C301C702/C1003,C302C701/C1003,C303/C1003 0.339 0.448 0.188 0.025有放回有放回=C300.73 C310.310.72 C320.320.71 C330.33 0.343 0.441 0.189 0.027 显然:当显然:当N→+∞,H(n,N1,N2,N)→b(n,P)→+∞,H(n,N1,N2,N)→b(n,P)图形分析:图形分析:1 1,产品总量,产品总量N N越大,越大,n/Nn/N越小,则越接近!越小,则越接近!2 2,两者图形向两边延伸,两者图形向两边延伸 ,得到正态模型!,得到正态模型! 结论:当结论:当n<8000发芽概率发芽概率 案例:二项分布适用范围案例:二项分布适用范围1.所有卖场销售数据:每天进场人数所有卖场销售数据:每天进场人数n不详,每天购买概率不详,每天购买概率P未知,但是每天销售数据未知,但是每天销售数据nP已知,如何求解销售数据的概已知,如何求解销售数据的概率分布?率分布?好又多家乐福沃尔马好又多家乐福沃尔马/苏宁国美苏宁国美/DELL/本田本田/万科万科2.电子商务销售数据:已知点击人数电子商务销售数据:已知点击人数n,购买率购买率P,购买人数,购买人数np,求解分布,求解分布-阿里巴巴阿里巴巴/当当购物当当购物3.网络邮箱网络邮箱/网络硬盘使用率:点击使用藤讯人数网络硬盘使用率:点击使用藤讯人数n,邮箱或邮箱或硬盘使用率硬盘使用率P,使用人数,使用人数nP,,藤讯藤讯/网易网易/163/Hotmail/MSN/yahoo….4.饭店饭店/酒店食物定购:真功夫酒店食物定购:真功夫/麦当劳麦当劳/肯德基肯德基5.自己开店:花店自己开店:花店/电脑城电脑城/……如何进货销售曲线如何进货销售曲线注解:案例注解:案例1+5属于属于n,p未知,案例未知,案例2+3+4属于属于n,p已知已知 例例2 20 某某商商店店根根据据过过去去的的销销售售记记录录知知道道某某种种商商品品每每月月的的销销售售量量可可以以用用参参数数为为10的的泊泊松松分分布布来来描描述述 为为了了以以95%以以上上的的概概率率保保证证不不脱脱销销 问问商商店店在在月月底底应应存存多多少少件件该该种种商商品品(设设只只在在月月底底进进货货)??大大卖卖场场的的顾顾客客数数n很很大大,买买商商品品概概率率P很少很少/多多 设设该该商商店店每每月月销销售售该该商商品品的的件件数数为为X 月月底底存存货货为为a 则则当当X a时时就就不不会会脱脱销销 据题意据题意 要求要求a使得使得 P{X a} 0 95 由由于于已已知知X服服从从参参数数为为10的的泊松分布泊松分布 上式即为上式即为 X=0, 1, 2,…14, 15, 16…a,… P0P1P3… P14 P15 P16…Pa… 解 于于是是 这这家家商商店店只只要要在在月月底底保保证证存存货货不不低低于于15件件就就能能以以95%以以上上的的概概率率保保证证下下个个月月该种商品不会脱销该种商品不会脱销 销售数据销售数据实际销售数据概率实际销售数据概率销售累计概率销售累计概率= =不脱销率不脱销率0 04.53999E-054.53999E-054.53999E-054.53999E-051 10.0004539990.0004539990.0004993990.0004993992 20.0022699960.0022699960.0027693960.0027693963 30.0075666550.0075666550.0103360510.0103360514 40.0189166370.0189166370.0292526880.0292526885 50.0378332750.0378332750.0670859630.0670859636 60.0630554580.0630554580.1301414210.1301414217 70.0900792260.0900792260.2202206470.2202206478 80.1125990320.1125990320.3328196790.3328196799 90.1251100360.1251100360.4579297140.45792971410100.1251100360.1251100360.583039750.5830397511110.1137363960.1137363960.6967761460.69677614612120.094780330.094780330.7915564760.79155647613130.0729079460.0729079460.8644644230.86446442314140.0520771040.0520771040.9165415270.91654152715150.034718070.034718070.9512595970.95125959716160.0216987940.0216987940.972958390.9729583917170.0127639960.0127639960.9857223860.98572238618180.0070911090.0070911090.9928134950.99281349519190.0037321630.0037321630.9965456580.99654565820200.0018660810.0018660810.9984117390.998411739 图示:实际销售数据概率/不脱销率的变化规律 补充实践应用案例举例补充实践应用案例举例1:伦敦情报战:伦敦情报战伦敦上空的鹰究竟是有目的的轰炸行为还是随机的行为?伦敦上空的鹰究竟是有目的的轰炸行为还是随机的行为?二次世界大战期间,德军飞机对英伦三岛进行了无数次的轰炸二次世界大战期间,德军飞机对英伦三岛进行了无数次的轰炸空袭行动,为了了解英军情报是否泄密,英国密码是否被破译,空袭行动,为了了解英军情报是否泄密,英国密码是否被破译,英国情报机构对英国各被轰炸地区进行一项统计调查,他们对英国情报机构对英国各被轰炸地区进行一项统计调查,他们对伦敦划分成伦敦划分成586区,统计区,统计每个地区实际被轰炸次数如下每个地区实际被轰炸次数如下:: X= 0 1 2 3 4 5 6 7 …频数频数 229 221 93 35 7 1 0 0…EX=0.93次次=λ=nPλ=nP但是德军空袭次数但是德军空袭次数n n未知未知, ,理论被炸区数理论被炸区数P(P(λ)=231.2 215 100 31 7.2 1.34 0.2 0.02 λ)=231.2 215 100 31 7.2 1.34 0.2 0.02 结论:德军的空袭对任何地区发生的概率均等,且每次空袭袭结论:德军的空袭对任何地区发生的概率均等,且每次空袭袭击任何地区的概率都是击任何地区的概率都是P P,试验属于,试验属于n n重独立试验重独立试验类似案例:公司销售数据概率分布的获得,如类似案例:公司销售数据概率分布的获得,如eg2.20eg2.20X= 0, 1, 2,….,10, 11, 12,…, k,…mean=EX=X= 0, 1, 2,….,10, 11, 12,…, k,…mean=EX=λ λ 频率频率f=ff=f0 0 f f1 1 f f2 2 … f… f1010 f f1111 f f1212… Pk…… Pk…实际概率实际概率f fP(X)= PP(X)= P0 0 P P1 1 P P2 2 … P… P1010 P P1111 P P1212… Pk…… Pk…理论概率理论概率P PIf If Σ|fi-Pi|10(5)10(5)b(n,P)→N(nP,nPq)=N(u,b(n,P)→N(nP,nPq)=N(u,σ2) 棣莫弗棣莫弗- -拉普拉斯中心极限定理拉普拉斯中心极限定理—Page111 —Page111 证明略证明略实践计算中:超几何实践计算中:超几何→→二项分布二项分布→→泊松分布泊松分布/ /正态分布正态分布问题案例:问题案例:某生物高科技集团,新研制出一批转基因种某生物高科技集团,新研制出一批转基因种子,发芽率为子,发芽率为0.7, 准备试种准备试种1000颗,问其中有颗,问其中有500颗颗以上发芽的概率?二项以上发芽的概率?二项b(1000,0.7)?P(700)?P(300) 二项分布二项分布→→泊松分布泊松分布/ /正态分布正态分布n=100, p=0.01 ,np=1二项泊松重合正态分布远离N=2000产品次品NA=20 二项分布二项分布→→泊松分布泊松分布/ /正态分布正态分布n=100,p=0.02,np=2二项泊松重合二项正态靠近N=2000产品次品NA=40 二项分布二项分布→→泊松分布泊松分布/ /正态分布正态分布n=100,p=0.06,np=6二项泊松重合二项正态重合N=2000产品次品NA=120 二项分布二项分布→→泊松分布泊松分布/ /正态分布正态分布n=100,p=0.1,np=10二项泊松分离二项正态重合N=2000产品次品NA=200 二项分布二项分布→→泊松分布泊松分布/ /正态分布正态分布n=100,p=0.2,np=20二项泊松分离二项正态重合N=2000产品次品NA=400 二项分布二项分布→→泊松分布泊松分布/ /正态分布正态分布n=100,p=0.4,np=40二项泊松远离二项正态重合N=2000产品次品NA=800 超几何分布超几何分布→→二项分布二项分布→→泊松分布泊松分布/ /正态分布正态分布N=2000,NA=40,n=100,p=0.2,np=2 超几何分布超几何分布→→二项分布二项分布→→泊松分布泊松分布/ /正态分布正态分布N=2000,NA=120,n=100,K=0\1\...,np=6 超几何分布超几何分布→→二项分布二项分布→→泊松分布泊松分布/ /正态分布正态分布N=2000,,NA=200,,n=100,K=0\1\...,np=10 理论基础总结数据:数据:N=总体个数,总体个数,N1=总体中总体中A的个数,的个数, n=样本个数,=样本个数,k=样本中样本中A的个数;的个数;逼近关系:逼近关系:超几何分布N件产品,其中N1件次品不放回抽n,其中次品k件二项分布N件产品,次品率N1/N放回抽n,其中次品k件n<5 and nq>5np<5 or nq<5Poisson分布,P(np)Normal分布,N(np,npq)P(λ)N(u,σ2) ×提示:possion分布期望为的理论证明*√三、 3大分布的分布律与数字特征小结大分布的分布律与数字特征小结 如果一个随机变量如果一个随机变量X的概率分布为的概率分布为 X~H(n N1,N2,N) X~b(n p) X~~P( ) X~~N N1,N2,N→+→+∞ N1/N=P,N2/N=q n→+∞,nP→ n→+∞,nP→ 三大分布的期望和方差比较三大分布的期望和方差比较 EX=n·N1/N=nP →→EX=nP →→EX u DX=n·(N1/N)·(N2/N)·(N-n)/(N-1)→→DX np(1-P)→→DX= σ2 注:从图形分析,与正态分布相比,三大分布更像偏态分布注:从图形分析,与正态分布相比,三大分布更像偏态分布 *√四、众数/最大可能值/P(X=k)及其计算 0e− /0!, 1e − /1!… ke− /k! … ne− /n!Cn0P0qn , Cn1P1qn-1… CnkPkqn-k… CnnPnq0显然,最大可能值显然,最大可能值X=k处,点概率应该满足:处,点概率应该满足:P(X=k)≥P(X=k-1),≥P(X=k-1),且且P(X=k)≥ P(X=k+1)P(X=k)≥ P(X=k+1) ke− /k!≥≥ k-1e− /(k-1)! → → ≥k → k≤≥k → k≤ ke− /k!≥≥ k+1e− /(k+1)!→k+1→k+1≥≥ →k→k≥≥ -1→ → -1≤k≤≤k≤ CnkPkqn-k≥≥Cnk-1Pk-1qn-k+1→k≤nP+P→k≤nP+PCnkPkqn-k≥≥Cnk+1Pk+1qn-k-1→k≥nP+P-1→k≥nP+P-1→ nP+P -1≤ k≤nP+P ↔ → nP+P -1≤ k≤nP+P ↔ -1≤k≤≤k≤ 注:都在平均数附近,二项注:都在平均数附近,二项 泊松泊松 正态正态 nP+P -1≤ k≤nP+P nP+P -1≤ k≤nP+P -1≤k≤≤k≤ u [nP+P] [ [nP+P] [λ]λ] *√四大分布重点回顾四大分布重点回顾 1:分布律的联系分布律的联系; 2:数字特征数字特征1:H(n,N1,N)→b(n,P)→P(→b(n,P)→P( )/N(nP,nPq))/N(nP,nPq)理论上理论上 N→∞ n→∞,nP→ N→∞ n→∞,nP→ / n→∞,P/ n→∞,P不不→0,1→0,1实践中实践中P(P( )=b(∞,P),N(nP,nPq)=b(∞,P))=b(∞,P),N(nP,nPq)=b(∞,P)即泊松分布与正态分布都是二项分布的极限分布即泊松分布与正态分布都是二项分布的极限分布2:EX=2:EX=n·N1/N EX=nP EX EX=u DX=n·(N1/N)·(N2/N)·(N-n)/(N-1) DX np(1-P) DX= DX=σ2众数众数k? nP+P-1k? nP+P-1≤k≤nP+P -1≤k≤ u3:区别区别-前三者为离散型分布,有点概率区间概率后者前三者为离散型分布,有点概率区间概率后者正态为连续分布,只有区间概率正态为连续分布,只有区间概率前三者为偏态分布,后者为正态前三者为偏态分布,后者为正态二项分布当二项分布当EX=nP处于中间时可以近似为正态分布处于中间时可以近似为正态分布 EX=nP处于两边时可以近似为泊松分布处于两边时可以近似为泊松分布 附录三:四大分布的概率表示附录三:四大分布的概率表示1.超几何分布超几何分布:HYPGEOMDIST(k,n,N1,N)2.二项分布二项分布:每点概率每点概率;累计概率和累计概率和BINOMDIST(k,n,P,0);BINOMDIST(k,n,P,1)3.泊松分布:每点概率;累计概率和泊松分布:每点概率;累计概率和POISSON(k,λ=np,0λ=np,0);POISSON(k,λ,1λ,1) 4.正态分布:每点概率;累计概率和正态分布:每点概率;累计概率和NORMDIST(k,u, ,0); NORMDIST(k,u, ,1)。