
北邮概率统计课件5.2中心极限定理.ppt
26页概率统计 在概率论中,我们已经知道正态分布居在概率论中,我们已经知道正态分布居于头等重要的地位,许多随机变量都遵循于头等重要的地位,许多随机变量都遵循正态分布自从高斯指出测量误差服从正正态分布自从高斯指出测量误差服从正态分布之后,人们发现,正态分布在自然态分布之后,人们发现,正态分布在自然界中极为常见并且大量实验观察也表明界中极为常见并且大量实验观察也表明如果一个量是由大量相互独立的随机因素如果一个量是由大量相互独立的随机因素的影响所造成,而每一个别因素在总影响的影响所造成,而每一个别因素在总影响中所起的作用不大,中所起的作用不大, 则这种量一般都服从则这种量一般都服从或近似服从正态分布或近似服从正态分布第二节第二节 中心极限定理中心极限定理 问题的引出问题的引出 高斯高斯 9/17/2024北邮概率统计课件概率统计(1). 具有有限方差的一列独立同分布的随机变量的具有有限方差的一列独立同分布的随机变量的 和经过标准化后是以标准正态分布为极限的,和经过标准化后是以标准正态分布为极限的, 这就是独立同分布的中心极限定理这就是独立同分布的中心极限定理 或或 称为称为 林德贝尔格林德贝尔格---勒维中心极限定理勒维中心极限定理。
当同分布当同分布 为二项分布时就得出该定理的特例,即为:为二项分布时就得出该定理的特例,即为: 棣莫弗棣莫弗---拉普拉斯定理,拉普拉斯定理,它也是二项分布的它也是二项分布的 正态近似正态近似这仅仅是经验之谈呢,还是确有理论依据呢?对于这仅仅是经验之谈呢,还是确有理论依据呢?对于这样一个重要问题,在长达两个世纪内一直成为概这样一个重要问题,在长达两个世纪内一直成为概率论研究的中心问题数学家们经过卓越工作建立率论研究的中心问题数学家们经过卓越工作建立了一系列定理,解决了这一问题,并了一系列定理,解决了这一问题,并指出指出:9/17/2024北邮概率统计课件概率统计(2). 对对“由大量微小的独立的随机因素由大量微小的独立的随机因素”(不要求(不要求同分同分 布)引起并累积成的变量,当随机因素个数趋于布)引起并累积成的变量,当随机因素个数趋于 无穷时以正态分布为极限这就是无穷时以正态分布为极限这就是李雅普诺夫中李雅普诺夫中 心极限定理心极限定理比如:比如:一台机床已经调试良好,操作正常但由一台机床已经调试良好,操作正常。
但由于机床的微小震动、工具的微小变形、原材料质于机床的微小震动、工具的微小变形、原材料质量上的微小差异、工作操作上的微小偏差等等数量上的微小差异、工作操作上的微小偏差等等数不清的随机因素,它们每一个因素在总的影响中不清的随机因素,它们每一个因素在总的影响中所起的作用都是微小的而综合起来在产品质量所起的作用都是微小的而综合起来在产品质量上就形成一定的误差,这误差近似服从正态分布上就形成一定的误差,这误差近似服从正态分布9/17/2024北邮概率统计课件概率统计在一定条件下,大量的在一定条件下,大量的随机变量之和随机变量之和的概率分布的概率分布以正态分布为极限的定理称为中心极限定理以正态分布为极限的定理称为中心极限定理 在概率论中,习惯于把和的分布收敛于正态分在概率论中,习惯于把和的分布收敛于正态分布这一类定理都叫做布这一类定理都叫做中心极限定理中心极限定理故:故:研究独立随机变量研究独立随机变量之和之和所特有的规律性问题当所特有的规律性问题当 n 无限增大时,这个和的极限分布是什么?在什无限增大时,这个和的极限分布是什么?在什么条件下极限分布会是正态的呢?么条件下极限分布会是正态的呢?研究的问题:研究的问题:9/17/2024北邮概率统计课件概率统计 在实际问题中,常常需要考虑许多随机因素所产生在实际问题中,常常需要考虑许多随机因素所产生 的的总影响总影响::例如:例如:炮弹射击的落点与目标的偏差,就受着炮弹射击的落点与目标的偏差,就受着 许多随机因素的影响:许多随机因素的影响: 中心极限定理的客观背景中心极限定理的客观背景 如如,瞄准时的误差,空气阻力所产生的误,瞄准时的误差,空气阻力所产生的误 差,炮弹或炮身结构所引起的误差等等差,炮弹或炮身结构所引起的误差等等.而所要研究的是:这些而所要研究的是:这些随机因素的总影响随机因素的总影响。
9/17/2024北邮概率统计课件概率统计一一. 独立同分布中心极限定理独立同分布中心极限定理定理定理1. 设随机变量设随机变量 相互独立且服从同相互独立且服从同一分布,其数学期望与方差一分布,其数学期望与方差:(林德贝尔格(林德贝尔格---勒维勒维(Levy--Lindberg)定理)定理)则随机变量则随机变量之和之和的的标准化变量标准化变量::9/17/2024北邮概率统计课件概率统计的分布函数的分布函数 对于任意对于任意 满足满足: 证:证: (略略) 它要用到特征函数和傅利叶变换等等它要用到特征函数和傅利叶变换等等 注注:▲ 定理定理1 表明表明,当,当 n 充分大时,充分大时,n 个具有期望和个具有期望和方差的独立同分布的随机变量之和近似服从正方差的独立同分布的随机变量之和近似服从正态分布 虽然在一般情况下,很难求出虽然在一般情况下,很难求出 X1+ X2 + …+ Xn 的分布的确切形式,但当的分布的确切形式,但当 n 很大时,可以求很大时,可以求出其近似分布出其近似分布9/17/2024北邮概率统计课件概率统计定理定理1 表达表达了正态分布在概率论中的了正态分布在概率论中的特殊特殊地位地位:尽管尽管 分布是分布是任意任意的,但只要的,但只要 n 充充分大后,其样本平均值分大后,其样本平均值 的分布却是近似的分布却是近似服从正态分布的:服从正态分布的:▲或或这一结果是数理统计中这一结果是数理统计中大样本统计推断的基础大样本统计推断的基础9/17/2024北邮概率统计课件概率统计二二. 李雅普诺夫定理李雅普诺夫定理定理定理2. 设随机变量设随机变量 相互独立,它们相互独立,它们具有数学期望和方差为:具有数学期望和方差为:( Liapunov 中心极限定理中心极限定理)记记若存在正数若存在正数使得当使得当9/17/2024北邮概率统计课件概率统计则随机变量则随机变量之和之和的的标准化变量标准化变量::的分布函数的分布函数 对于任意对于任意 满足满足: 证明:证明:(略)(略)9/17/2024北邮概率统计课件概率统计注注:▲ 定理定理2表明表明,, 当当 n 充分大时,随机变量:充分大时,随机变量:近似服从标准正态分布。
近似服从标准正态分布 即,即,近似服从正态分布近似服从正态分布▲由此,由此, 定理定理2再次表达再次表达了正态分布在概率论中的了正态分布在概率论中的特殊特殊地位:地位: 无论各个随机变量无论各个随机变量 服从什么分服从什么分布,只要满足定理布,只要满足定理2的条件,那么的条件,那么它们的和它们的和当当n 充分大时就近似服从正态分布充分大时就近似服从正态分布9/17/2024北邮概率统计课件概率统计三三. 棣莫弗棣莫弗---拉普拉斯定理拉普拉斯定理定理定理3.((De Moivere—laplace 中心极限定理)中心极限定理)设随机变量设随机变量 相互独立,且服从相互独立,且服从参数为参数为 的二项分布,则对任的二项分布,则对任意意 恒有恒有:证明证明:服从参数为服从参数为 的二项分布的二项分布若随机变量若随机变量 相互独立,且服从相互独立,且服从同一同一(0—1)分布,分布,则则见教材见教材P125例例6 的结论的结论9/17/2024北邮概率统计课件概率统计由此由此 是是 n 个相互独立,服从同一个相互独立,服从同一 (0--1) 分布的分布的 之和。
即:之和即: 其中其中 的分布律为:的分布律为:由由定理定理1得:得:9/17/2024北邮概率统计课件概率统计注注:定理定理3表明表明,正态分布是二项分布的极限分布,,正态分布是二项分布的极限分布,当当 n 充分大时可以用正态分布来计算二项分充分大时可以用正态分布来计算二项分布的概率布的概率在第二章中已介绍当在第二章中已介绍当 时,二项分布以时,二项分布以泊松分布为极限分布;而在本章中二项分布又泊松分布为极限分布;而在本章中二项分布又以正态分布为极限分布这以正态分布为极限分布这两者的区别两者的区别是:是:▲▲在在泊松定理泊松定理中要求中要求在在中心极限定理中心极限定理中要求中要求所以在实际计算中,如果所以在实际计算中,如果 n 很大但很大但 np或或 nq 不不大大 ( 即即 p 很小或很小或 q =1-p 很小很小 ),那么应该用泊,那么应该用泊松定理去近似;如果松定理去近似;如果 n,,np 或或 nq 都较大,那都较大,那么应该用中心极限定理去近似么应该用中心极限定理去近似9/17/2024北邮概率统计课件概率统计中心极限定理的直观中心极限定理的直观图示图示例例: 20个服从(个服从(0—1)分)分布布 的随机变量的和的分布的随机变量的和的分布X1 ~ f ( x)X1 +X2 ~ g ( x )X1 +X2+X3 ~ h ( x )例例: 几个在几个在( 0, 1 )上服从均匀分上服从均匀分布的随机变量的和的分布。
布的随机变量的和的分布0123xfgh▲9/17/2024北邮概率统计课件概率统计例例1. 抽样检查产品质量时,如果发现次品多于抽样检查产品质量时,如果发现次品多于10个则个则认为这批产品不能接受认为这批产品不能接受解解: 设应检查产品个数为设应检查产品个数为 n ,其中次品数为,其中次品数为 X,则,则现要现要求求 n ,使得:,使得:求:求:应该检查多少个产品,可使次品率为应该检查多少个产品,可使次品率为 10% 的一的一 批次品不能接受的概率达到批次品不能接受的概率达到 0. 9?由由定定理理3近似服从近似服从N( 0, 1 )9/17/2024北邮概率统计课件概率统计 由由3σ准则,准则, 为为 1要要只要只要::即要即要::此时由于此时由于::9/17/2024北邮概率统计课件概率统计必定有必定有::只要只要::所以要所以要::因为因为即即查表得查表得:故故结论:结论:应检查应检查 146 个产品时,可使这批产品不被接受的概个产品时,可使这批产品不被接受的概 率为率为0. 99/17/2024北邮概率统计课件概率统计例例 2.计算机进行加法计算时,把每个加数取为最接计算机进行加法计算时,把每个加数取为最接近它的整数来计算。
设所有的取数误差是相互近它的整数来计算设所有的取数误差是相互独立的随机变量,并且都在区间独立的随机变量,并且都在区间[ --0.5, 0.5 ] 上服从均匀分布上服从均匀分布求求:(1) 现有现有1200个数相加,误差总和的绝对值小于个数相加,误差总和的绝对值小于 10(2) 的概率2) 应有多少个数相加时可使误差总和的绝对值小应有多少个数相加时可使误差总和的绝对值小 于于10 的概率大于的概率大于0. 9解解: 设设 为各个加数的取数误差为各个加数的取数误差则这是一列独立同分布的随机变量,其所有加则这是一列独立同分布的随机变量,其所有加数的误差总和为:数的误差总和为:9/17/2024北邮概率统计课件概率统计从而从而::(1).在在服从均匀分布服从均匀分布这里这里:9/17/2024北邮概率统计课件概率统计(2).由由定定理理1近似服从近似服从N ( 0, 1 )9/17/2024北邮概率统计课件概率统计只要只要:查表得查表得:解得解得:结论结论: 441 个个数相加时可使数相加时可使误差总和的绝误差总和的绝对值小于对值小于10 的的概率大于概率大于0. 9所以要所以要9/17/2024北邮概率统计课件概率统计例例3. 在人寿保险公司里,有在人寿保险公司里,有16000名同一年龄的人名同一年龄的人参加人寿保险。
一年里这些人的死亡率为参加人寿保险一年里这些人的死亡率为0.1%;参加保险的人在一年的第一天交付保;参加保险的人在一年的第一天交付保险费险费3元,死亡时家属可以从保险公司领取元,死亡时家属可以从保险公司领取2000元求求: (1). 保险公司因开展这项业务获利不少于保险公司因开展这项业务获利不少于10000 元的概率元的概率(2). 保险公司因开展这项业务亏本的概率保险公司因开展这项业务亏本的概率解解: 由题意,死亡人数由题意,死亡人数这里,这里,9/17/2024北邮概率统计课件概率统计保险公司一年内这项保险收入是:保险公司一年内这项保险收入是:获利不少于获利不少于10000元,即赔偿不大于元,即赔偿不大于 38000(元元),,即一即一 年内至多有年内至多有 (人)死亡(人)死亡 即该公司获利不少于即该公司获利不少于 10000(元元)的概率为的概率为 0.7734.(1).所以所以:9/17/2024北邮概率统计课件概率统计公司亏本即赔款大于公司亏本即赔款大于48000元,即一年内有多元,即一年内有多于于 (人)死亡(人)死亡 即该公司亏本的概率为即该公司亏本的概率为 0.02275(2).9/17/2024北邮概率统计课件概率统计 中心极限定理是概率论中最著名的结果之一,中心极限定理是概率论中最著名的结果之一,它它不仅不仅提供了计算独立随机变量之和的近似概率的提供了计算独立随机变量之和的近似概率的简单方法,简单方法,而且而且有助于解释有助于解释为什么很多自然群体的为什么很多自然群体的经验频率呈现出正态曲线经验频率呈现出正态曲线这一值得注意的事实。
这一值得注意的事实归纳归纳9/17/2024北邮概率统计课件。
