
概率论与数理统计第五章.ppt
36页第第5章概述章概述 大数定律和中心极限定理就是使用极限方法大数定律和中心极限定理就是使用极限方法研究大量随机现象统计规律性的研究大量随机现象统计规律性的 阐明大量重复试验的平均结果具有稳定性的阐明大量重复试验的平均结果具有稳定性的一系列定律都称为大数定律一系列定律都称为大数定律 论证随机变量(试验结果)之和渐进服从某论证随机变量(试验结果)之和渐进服从某一分布的定理称为中心极限定理一分布的定理称为中心极限定理 大大数数定律定律— 概率论中有关阐明概率论中有关阐明大量随机现象大量随机现象平均结果的稳定性平均结果的稳定性的一系列定理的一系列定理迄今为止迄今为止,人们已发现人们已发现很多很多大数定律大数定律(laws of large numbers)所谓大数定律,所谓大数定律,简单地说,就是大量数目的随机变量所呈现出的规律,简单地说,就是大量数目的随机变量所呈现出的规律,这种规律一般用随机变量序列的某种收敛性来刻画这种规律一般用随机变量序列的某种收敛性来刻画本章仅介绍几个最基本的大数定律本章仅介绍几个最基本的大数定律• 大数定律大数定律• 在叙述大数定律之前,首先介绍两个基本概念在叙述大数定律之前,首先介绍两个基本概念•定义定义5.1 设设 为一个随机变量序列,记为为一个随机变量序列,记为• ,若对任何,若对任何n≥2,,随机变量随机变量 都相互独立都相互独立•,则称,则称 是是相互独立的随机变量序列相互独立的随机变量序列。
• 定义定义5.2 设设 为一随机变量序列,为一随机变量序列,X为一随机变量为一随机变量•或常数,若对任意或常数,若对任意ε>>0,,有有•则称则称 依概率收敛于依概率收敛于X,记为记为 •或或 ,(,( )) .• 下面是一个带普遍性结果的大数定律下面是一个带普遍性结果的大数定律 定理定理1((切比雪夫大数定律)切比雪夫大数定律) 设独立随机变量设独立随机变量分别有数学期望及方差,分别有数学期望及方差,且且D((Xi))≤ C ((C为常数,为常数,i = 1,,2,,…))则对则对任意任意ε (>(>0),恒有),恒有或或((P·123))((5-3))证明证明 因因 为独立随机变量序列,故为独立随机变量序列,故 根据切比雪夫不等式可得根据切比雪夫不等式可得 利用计算极限的夹逼准则可知,上式成立。
利用计算极限的夹逼准则可知,上式成立 本结果由俄国数学家切比雪夫于本结果由俄国数学家切比雪夫于1866年年证明,是关于大数定律的普遍结果,许多大证明,是关于大数定律的普遍结果,许多大数定律的古典结果都是它的特例数定律的古典结果都是它的特例.●切比雪夫大数定律表明,当切比雪夫大数定律表明,当n n 很大时,很大时,X X1 1,,X X2 2,, ……,,X Xn n的算术平均值的算术平均值的取的取值,集中值,集中在其在其数学期望数学期望附近推论推论 设独立随机变量设独立随机变量服从同一服从同一分布,且有数学期望分布,且有数学期望μ 及及方差方差σ ² ,,则则对于对于任意任意ε (>(>0),),恒有恒有((5-4))即即 当当n n 很大时,很大时,设设 为为n 次独立试验中事件次独立试验中事件A发生的次数,发生的次数,p是是A在在一次试验中发生的概率,则对任意一次试验中发生的概率,则对任意ε (>(>0),),恒有恒有定理定理2 (贝努利大数定律)(贝努利大数定律)设设 为为n 次独立试验中事件次独立试验中事件A发生的次数,发生的次数,p是是A在在一次试验中发生的概率,则对任意一次试验中发生的概率,则对任意ε (>(>0),),恒有恒有((其中其中 为为A 发生的频率。
发生的频率●贝努利大数定律说明了贝努利大数定律说明了当重复独立试验次数当重复独立试验次数 n n 很大时,频率与其概率之差可为任意小,很大时,频率与其概率之差可为任意小, 即说明了其即说明了其频率的稳定性频率的稳定性推论推论1使我们关于算术平均值的法则有了理论上的依据使我们关于算术平均值的法则有了理论上的依据如我们要测量某段距离,在相同条件下重复进行如我们要测量某段距离,在相同条件下重复进行n次,得次,得n个测量值个测量值 ,它们可以看成是,它们可以看成是n个相互独立的个相互独立的随机变量具有相同的分布、相同的数学期望随机变量具有相同的分布、相同的数学期望μ和方差和方差 ,,由推论由推论1的大数定律知,只要的大数定律知,只要n充分大,则以接近于充分大,则以接近于1的概的概率保证率保证这便是在这便是在n较大情况下反映出的客观规律较大情况下反映出的客观规律,故称为故称为“大数大数”定律 比推论比推论1条件更宽的一个大数定律是条件更宽的一个大数定律是辛钦辛钦((Khintchine))大数定律大数定律,它不需要推论它不需要推论1条件中条件中“方差方差 存在存在”的限制,而在其它条件不变的情况下,仍有(的限制,而在其它条件不变的情况下,仍有(5-4)式的结论。
式的结论 人们已经知道,在自然界和生产实践中遇到大量随机变量人们已经知道,在自然界和生产实践中遇到大量随机变量都服从或近似服从正态分布,正因如此,正态分布占有特都服从或近似服从正态分布,正因如此,正态分布占有特别重要的地位那么,如何判断一个随机变量服从正态分别重要的地位那么,如何判断一个随机变量服从正态分布显得尤为重要如经过长期的观测,人们已经知道,很布显得尤为重要如经过长期的观测,人们已经知道,很多工程测量中产生的误差多工程测量中产生的误差X都是服从正态分布的随机变量都是服从正态分布的随机变量分析起来,造成误差的原因有仪器偏差分析起来,造成误差的原因有仪器偏差X1、大气折射偏差、大气折射偏差X2,温度变化偏差温度变化偏差X3、估读误差造成的偏差、估读误差造成的偏差X4等等,这些偏等等,这些偏差差Xi 对总误差对总误差 的影响都很微小,没有一个起到特别的影响都很微小,没有一个起到特别突出的影响,虽然每个突出的影响,虽然每个Xi的分布并不知道,但的分布并不知道,但 却服却服从正态分布类似的例子不胜枚举从正态分布类似的例子不胜枚举。
. ((5-6))在什么条件下,在什么条件下, , 这是十八世纪以来概率论研究的中心课题,因而,从二十世纪二这是十八世纪以来概率论研究的中心课题,因而,从二十世纪二十年代开始,习惯上把研究随机变量和的分布收敛到正态分布的十年代开始,习惯上把研究随机变量和的分布收敛到正态分布的这类定理称为这类定理称为中心极限定理中心极限定理((Central Limit Theorems) 设设 为一随机变量序列,其和的标准化随机变量为一随机变量序列,其和的标准化随机变量 中心极限定理中心极限定理— 概率论中有关论证概率论中有关论证独立随机独立随机变量的和的极限分布是正态分布变量的和的极限分布是正态分布的一系列定理。
的一系列定理林德贝格林德贝格-列维列维中心极限定理中心极限定理定理定理1(独立同分布的中心极限定理)(独立同分布的中心极限定理)设独立随机变量设独立随机变量服从同一服从同一分布,且有数学期望分布,且有数学期望E(( ))=μ 及方差及方差D(( ))=σ ² ,,则对于则对于任意任意ε (>(>0),),恒有恒有((P·122))(林德贝格林德贝格-列维列维中心极限定理中心极限定理)等价的描述:等价的描述:当当n很大时有如下结论:很大时有如下结论:定理定理1:独立同分布的中心极限定理的常用形式:独立同分布的中心极限定理的常用形式当当n很大时,很大时,定理定理2(德莫佛(德莫佛—拉普拉斯中心极限定理)拉普拉斯中心极限定理)设随机变量设随机变量则对于则对于任意区间(任意区间(a, b ),,恒有恒有—E(( ))= npD(( ))= p(1-p) ((两点分布)两点分布) D(( ))= np(1-p) (二项(二项分布)分布)—之和之和下面的图形表明下面的图形表明:正态分布是二项分布的逼近正态分布是二项分布的逼近.中心极限定理的意义中心极限定理的意义 在后面的课程中,我们还将经常用到中心在后面的课程中,我们还将经常用到中心极限定理极限定理. 中心极限定理是概率论中最著名的结果中心极限定理是概率论中最著名的结果之一,它不仅提供了计算独立随机变量之和之一,它不仅提供了计算独立随机变量之和的近似概率的简单方法,而且有助于解释为的近似概率的简单方法,而且有助于解释为什么很多自然群体的经验频率呈现出钟形曲什么很多自然群体的经验频率呈现出钟形曲线这一值得注意的事实线这一值得注意的事实.关于这些近似公式的使用,现作如下说明:关于这些近似公式的使用,现作如下说明: ((1)注意到)注意到 ,则推论表明,对固定,则推论表明,对固定的的p和较大的和较大的n,,二项分布可用正态分布逼近;二项分布可用正态分布逼近; ((2))“较大的较大的n”是一个较为模糊的概念,究竟是一个较为模糊的概念,究竟多大才是较多大才是较“大大”要依据实际问题来定。
一般地要依据实际问题来定一般地,如果如果n≥50((有时亦可放宽到有时亦可放宽到n≥30),),就可认为是就可认为是较大的较大的n;; ((3))第二章泊松定理表明,当第二章泊松定理表明,当p很小(可设想成很小(可设想成p随随n的变化趋于的变化趋于0)、)、n较大且较大且np不太大时,二项不太大时,二项分布可用泊松分布逼近在实际中,当分布可用泊松分布逼近在实际中,当p≤0.1、、n较较大且大且np≤5时,常用泊松分布时,常用泊松分布(见附表见附表1)逼近二项分逼近二项分布;当布;当n较大且较大且np>5时,常用正态分布做二项分布时,常用正态分布做二项分布的近似计算的近似计算最后,我们指出大数定律与中心极限定理的区别:设 为独立同分布随机变量序列,且 , •则由定理5.1的推论1,对于任意的ε>0有• .大数定律并未给出 的表达式,但保证了其极限是1.• 而在以上条件下,中心极限定理5.2(林德伯格—莱维)亦成立•.•由于 •因此,在所给条件下,中心极限定理不仅给出了概率的近似表达式,而且也能保证了其极限是1,可见中心极限定理的结论更为深入。
这时,对于任意的ε>0及某固定的n,有 例例 计算机进行加法计算时,把每个加数取为最计算机进行加法计算时,把每个加数取为最接近于它的整数来计算,设所有的取整误差是相互接近于它的整数来计算,设所有的取整误差是相互独立的随机变量,并且都在区间独立的随机变量,并且都在区间[- 0·5,,0·5]上服从上服从均匀分布,求:均匀分布,求: ((1)) 1200个数相加时误差总和的绝对值小于个数相加时误差总和的绝对值小于 10的概率;的概率;((2)多少个数相加时可使误差总和的绝对值)多少个数相加时可使误差总和的绝对值 小于小于10 的概率大于的概率大于0·9??解解 设设表示取整误差,则表示取整误差,则在在区间区间[- 0·5,,0·5]上上服从均匀分布,服从均匀分布,于是有于是有~B((20000,,0.0005))P1263,5,6,7。












