
正态分布的若干理论及其应用本科毕业论文.doc
38页摘 要大量的实践经验和理论分析表明,自然界与工程技术中服从正态分布的随机变量是最常见的.诸如机械加工中零件的几何尺寸(直径、长度、宽度、高度)、强度、重量、使用寿命;随机测量误差;人的身高、体重;农作物的收获量;健康人的红血球数目;纤维的强力;炼铁厂每炉铁水的含碳量;学生考试分数;机床维修保养时间;某地区酌年降雨量;炮弹弹落点的分布等等,都可以看作是服从或近似服从的正态分布.数学和经验都证明:受大量、独立、均匀小效应影响的随机变量服从正态分布.在数理统计中用于统计推断的许多统计量,不管资料的原分布是什么,只要样本容量充分地大,它都近似于正态分布某些统计量即使偏离了正态分布,只要偏离量不大,也可以按正态分布处理.因此,正态分布的应用是十分广阔的.关 键 字 正态分布;概率密度函数;标准差;误差II目 录引言: 11.正态分布概念 12.正态曲线的特性 23.参数 m 和 s 的意义 34.标准正态分布及正态分布表 44.1.标准正态分布 44.2.标准正态分布的分布函数和正态分布表 44.3.正态分布表的几种形式 55.正态随机变量落在区间(x1,x2)内的概率计算 75.1.当值机变量ξ~N(0,1)时的概率计算 85.2.当随机变量 ξ~N(m,s) 时的概率计算 95.2.1.服从一般正态分布的随机变量ξ~N(m,s )的分布函数 95.2.2.概率计算 106.正态分布在几个领域内的应用实例 126.1.已知m, s求某条件下的概率[8] 126.2.已知某条件下的概率,求参数和 s ? 146.3.已知 m,s 和区问(a,b)内的变量数,求总变量数 156.4.已知m,s及各范围内的概率,求某范围的上、下限 166.5. 用标堆差确定所需测量次教 17参考文献 19致谢 20正态分布的若干理论及其应用数学系2004级1班 王文瑞 数学与应用数学 04104141指导老师 李海增引言:正态分布是一种最常见的连续型随机变量的分布,它在概率论和数理统计中无论在理论研究还是实际应用上都占有头等重要的地位,这是因为它在误差理论、无线电噪声理论、自动控制、产品检验、质量控制、质量管理等领域都有广泛应用,数理统计中许多重要问题的解决都是以正态分布为基础的.正态分布也具有许多良好的性质,因此在理论研究中正态分布十分重要.1.正态分布概念设连续型随机变量的密度函数(也叫分布密度,概率密度,概率密度函数)为: (1.1) (其中是常数,且 ,为正态总体的平均值,为正态总体的标准差,为正态总体中随机抽取得的样本值).则称随机变量服从参数为的正态分布,记作,式(1.1)是德国著名数学家高斯在找误差分布时于1795年推导发现的,因此正态分布又称高斯分布、误差分布或常态分布.正态分布密度函数的图形如图1所示,这条曲线称“正态分布密度函数曲线”或“正态分布曲线”,简称“正态曲线”,由于它的形状象只钟,又称“钟形曲线”,为纪念高斯又称“高斯曲线”[1].2.正态曲线的特性对式(1.1)进行数学处理,可得正态曲线特性.对式(1.1)求导,有 (2.1)令,则有,即当时, 有极大值对式(2.1)求导有: (2.2)令,则有 ,即曲线在:处有两个拐点.将正态曲线的特性列入表1.表1 正态曲线特性0---0---0 ¯¯曲线凹拐点凸极大值凸拐点凹由表1和图1可知正态曲线有以下特性:1) 曲线以为对称轴,且在时取得极大值,曲线由起向左右延伸时,不断降低,呈现中间高,两头低的钟的形状.2) 曲线在对称轴两侧 处有两个拐点.3) 的取值范围为整个轴,离越远, 越小,当时,曲线以轴为渐进线.4) 曲线总在轴上方,它于轴所围面积等于l,对称轴两边曲线下的面积相等各为0.5.机械加工得到的尺寸是服从正态分布的,如在机床上加工100件中的轴,则这100件轴的尺寸有以下统计规律.1) 100个尺寸中,在10附近的占的数量最多、这是正态分布的单峰性.2) 在这100个尺寸中,约有50个左右大于10,有50个左右小于10,这是正态分布的对称性.3) 在这100个尺寸中,大于10.03的个数和小于9.97个数都很少,这是正态分布的有界性.4) 这100个尺寸与标准尺寸10的差的平均值趋与零,这是正态分布的抵偿性.上述四条规律,零件数量越多就越准确[2].3.参数 m 和 s 的意义和是正态分布的两个参数,当和确定后,正态曲线就完全确定了.和 不同,正态曲线的位置和形状则不同.是位置参数,它的大小决定曲线在轴上的位置,是形状参数,它的大小决定曲线的高矮胖瘦.若不变只让变,则曲线形状不变,仅在轴上平行移动如图2所示;若不变只让变,则曲线在轴上的位置不变,仅形状发生变化,越小则曲线越显的高瘦陡峭;越大则曲线越显得矮胖平缓,如图3所示:从几何角度看,是正态曲线极大值的横坐标、是曲线拐点的横坐标到之间的距离,或者说是凸、凹曲线连接点的横坐标;从物理角度看,是正态曲线与轴之间的平面图形重心的横坐标.在数理统计中,是正态分布的数学期望或叫均值,是标准偏差.在计量学中,是被测量的真值,是表征测量值分散特性的一个度量指标.越大,观测值落在附近的概率越小,即观测值分散,测量精度低;越小,观测值落在附近的概率越大,即观测值集中,测量精度高.总之,表明了观测值的集中趋势,反映了观测值的分散程度.显然我们希望越小越好[3].4.标准正态分布及正态分布表4.1.标准正态分布称的正态分布为标准正态分布,将代入(1.1)式有: (4.1.1)式(4.1.1)为标准正态分布的密度函数,服从标准正态分布的随机变量[1].4.2.标准正态分布的分布函数和正态分布表概率论告诉我们,随机变量的分布函数等于密度函数在无穷区间 上的广义积分,于是标准正态分布的分布函数(也叫概率分布函数)为: (4.2.1)通常用表示标准正态分布的分布函数,即: (4.2.2)取不同的的值,由式(4.2.2)可得不同的的数值,这就得到“标准正态分布函数数值表”简称“标准正态分布表”或“正态分布表”.有些文献也叫“正态概率曲线下的面积”、“概率积分函数表”、“正态分布积分值”、“误差函数表”、“正态曲线下的面积函数表”、“拉普拉斯函数的值”等不同的名称.式(4.2.2)的几何意义是在区间内正态曲线与轴之间所围曲边梯形的面积,如图(4)所示,这也是将“正态分布表”称作“正态概率曲线下的面积”的道理.由于密度函数可以在整个轴上取值,由密度函数性质得: 即正态曲线性质4:曲线与轴所围面积为l[4].4.3.正态分布表的几种形式式(4.2.2)通常称概率积分.由于积分的上下限不同,可得到以下几种不同形式的正态分布表. (4.3.1) () (4.3.2) (4.3.3) (4.3.4) (4.3.5) (4.3.6) 均有现成表可查.一种文献只附有一种形式的正态分布表.这六种不同形式的正态分布表,形式虽异,但实质相同,对同一问题,无论用那种形式的表都会得到同一结果.这六种表中,其较为常见.而则出现较少[5].式(4.3.2)的几何意义如图5所示,式(4.3.3)式(4.3.4)和式(4.3.5)的几何意义如图6,式(4.3.6)的几何意义如图7.只有弄清了这六种表的含义,工作中无论碰到哪种形式的表,都可以运用自如.对式(4.3.1)、式(4.3.2)所定义的这两种形式的正态分布表,由正态曲线的对称性和曲线与横轴所围面积为l可知:当,则有,即:当则有,即:当且均为正值时有:当为的相反数时有:当时,有:令,由各相应正态分布表查得:,,,,,,可以看出: ,这从图5、图7及曲线性质4(对称轴两边面积各为0.5)容易得出.由正态曲线的对称性和曲线与轴所围面积为1还可以得到以下关系式: (4.3.7) (4.3.8)式(4.3.7)式(4.3.8)的几何意义如图8,如图9所示 其实由的几何意义可直接得出式(4.3.7)和式(4.3.8) [4]. 5.正态随机变量落在区间(x1,x2)内的概率计算概率统计指出,连续随机变量落在区间内的概率等于它的密度函数在该区间上的定积分,即: 对有: (5.1)对有: ()式(5.1)的几何意义如图10所示.x1x2有了正态分布表,计算上面两个积分就十分容易了 对服从标准正态分布的随机变量,可直接查正态分布表,对服从一般正态分布的随机变量,通过变量置换也可以直接查正态分布表.5.1.当值机变量ξ~N(0,1)时的概率计算若 ,则 落在区间内的概率由式(5.1)和式(4.2.2)得: (5.1.1) 可由式(4.2.2)所定义的正态分布表查得.以后若无特别指明,文中的正态分布表均指式(4.2.2)定义的那种形式的正态分布表.倒1.设 ,求:①;②;③解:① 由式(5.1.1)得:由正态分布表查得:,故有:② 由式(4.2.2)得:③ 由式(4.3.7)和式(4.2.2)得:显见: 因为在整个轴上取值,故概率必1.这也证明了正态曲线与轴所围面积为1[5].5.2.当随机变量 ξ~N(m,s) 时的概率计算若,则落在区间()内的概率,原则上讲只要对它的密度函数在区间()上积分即可求得.但是实际上这个积分的计算是比较麻烦的,并且由于它有两个参数,也不可能对不同的和 一一造表备查.于是设法将服从一般正态分布的随机变量化为服从标准正态分布,利用已有的“正态分布表”,以解决所有正态分布的概率计算问题[6].5.2.1.服从一般正态分布的随机变量ξ~N(m,s )的分布函数由分布函数的定义可知,服从一般正态分布的随机变量的分布函数为:作变量置换,令由上式化为: (5.2.1.1)上式说明通过变量置换可将对服从一般正态分布的随机变量的密度函数的积分化为对服从标准正态分布的密度函数的积分.这为利用“标准正态分布表”打开了大门[1].5.2.2.概率计算 设,则落在区间内的概率为: (5.2.2.1)这里,可由正态分布表查得.仿式(4.3.7)对一般正态分布。
