(精编资料推荐)还原正态分布之高斯推导过程.doc
5页《概率论与数理统计》大作业题 目:还原正态分布之高斯推导过程学 院:化学工程学院姓 名:赵振华学 号: 1403020128班级序号: 14专业班级:装控 1407任课教师: 李明2016 年 4月 27日1还原正态分布之高斯推导过程摘要:正态分布是概率中最重要的分布, 其发现极大的促进了概率论和数理统计的发展, 虽然正态分布的获得过程本身包含着大量的数理统计思想,对之有详尽的了解有益于对其他理论的理解, 但其推导过程一般少见于统计著作, 因此本文将正态分布函数形式的推导过程还原与众,弥补众多著作的正态分布的发现和推导过程背景前言正态分布又称高斯分布, 是由数学家棣莫弗和数学王子高斯各自独立发现的, 1733 年,棣莫弗有二项分布的逼近推导出正态分布, 1809 年高斯在推导误差分布函数是发现正态分布, 两位数学家在不同的数学文化背景下, 采用不同的方式得到相同的正态分布, 可谓知识都是相同的,两种方式可相互证明,更体现正态分布的客观性和科学性中心极限定理表明: “任何随机分布当样本足够大时,都会逼近正态分布 ”正态分布在数理统计研究历史上具有里程碑式的意义但是正态分布的推导过程能被统计学著作提到的少之又少, 又有许多想本人一样的学生对正太分布的来源和其推导过程有着强烈的兴趣, 于是几费周折在陈希孺院士 《数理统计学简史》 一书上找到一两百字的有关介绍,再结合其他资料整理得到两种推导过程, 但是本人还是大二,目前只能理解和深入研究高斯的推导过程, 故本主要介绍了高斯的正态分布的推导过程。
21、 高斯正态分布之推导最初的高斯密度分布函数思想动机来源于对误差规律的认识 众所周知,随机误差属于一种典型的随机变量 直觉上,对一个物体的测量,用多次测量的结果的算术平均数作为总体平均真值的估计肯定优于用单次测量结果作为其估计值, 而且似乎并不存在其它更好的估计量那么误差随机变量所服从的分布或者说其密度函数一定是这么一个“周密”的函数,它总能使样本的算术平均数成为总体真值估计量中最优良的估计量设总体真值为 X,测量误差的随机样本为 X1,X2,X3,X4, ·,Xn,设误差密度函数为 f(x),那么这些误差的出现概率为L(x)=f(X1-X)f(X2-X)f(X3-X) ·f(Xn-X) (1)要找出最有希望的误差函数应使 L(x) 达到最大,高斯认为 (X 的算术平均数)就是 X 的估计值,并使 L(X) 取得极大值对( 1)式两边同时取对数( )对(2)式两边同时求导( )引入辅助函数 ,又因为 X= 时 L(x)取最大值,所以伽利略认为:观测误差对称的分布在 0 的两侧,拉普拉斯给出误差分3布 f(x) 应满足 ,又因为 f(x)是连续函数,所以 f ’(x)是奇函数,所以 g(x)也是奇函数,有 -g(x)=g(-x),g(0)=0。
X1,X2,X3,X4, ·,Xn 是随机变量,可任意取值,不妨取自然是 m 使得n=m+1,且令 X1=X2=X3=X4= ·=Xm=-X,Xn=mX,所以所以 (4)式可转化为 ,因为是奇函数所以(5)(5)式对一切自然数 m 和实数 X 都成立,而唯一满足 (5)式的连续方程是 即 ,积分可得由 ,应有 ,取 ,则有 ,所以推导完毕!2、 正态推导过程之思考高斯的推导过程有几个极具创新性的地方2.1 在给定总体密度 f(x)的条件下,什么样的 X 才能使 L(x)的至最大,则这个取值就是总体真值的估计值, 在这个基础上非常创新的让样本空间的算术平均值作为 X 的估计值,然后逆向思维确定 之后再寻找这么一个密度函数 f(x)2.2 确定 f(x)之后求解 方程时得出结果,这中间的过程是一个值得思考的过程,也是本人在阅读文献4时理解起来比较费劲的一部分,不是一般人能想到的3、结论将正态分布的高斯推导过程还原与众, 尽管只是站在一个角度、 一个方面还原了正态分布, 但其实际意义远不止对该推导过程本身的掌握,更是在于对高斯核心统计思想的深刻体会, 学习他创新性的研究视角和研究手段,具有极高的显示理论价值。
参考文献[1] 徐传胜 ,张梅东 .正态分布两发现过程的数学文化比较 [J].纯粹数学与应用数学[2] 李津委.正态分布源泉的追溯与启示[J].成都教育学院学报[3] 尉迟江.对高斯分布函数形式的推导[J].统计与信息论坛[4] 陈希孺.数理统计学简史 [M] .长沙:湖南教育出版社, 1998: 125— 127.[5] 李贤平 . 概率论基础学习指导书 . 北京:高等教育出版社, 2011.15。





