
统计分布形态关系的研究[精选].doc
15页统计分布形态关系的研究摘要:在现在科技水平大幅提升的环境下,数据收集愈发便捷,社会各界对分析数据及统计分布形态的需求提升,但对其关系的研究较少,难以对收集的数据以需求为导向,进行更恰当的统计分析本文将以统计分布形态发展历史为始,概述统计分布形态的性质、定理及统计分布形态间逻辑关系,同时以我国保险公司闲置资金投放为案例,进行统计分布形态关系的综合应用,并得到保险公司各个投放方向不存在差异,保险公司闲置资金利用较为稳妥的结果关键词:发展历史;统计分布形态;逻辑关系;案例应用Study on the Morphological Relation of Statistical DistributionAbstract:In the present environment where the level of science and technology is greatly improved, data collection is becoming more and more convenient, and the demand for analyzing data and statistical distribution patterns from all walks of life has increased, but there is less research on the relationship between them and it is difficult to take the data collected as demand-oriented. Taking the development history of statistical distribution form as the starting point, this paper will summarize the nature, theorem and logical relationship of statistical distribution form, and take the investment of idle funds of insurance companies in China as a case study. The comprehensive application of statistical distribution form relation is carried out, and the results are obtained that there is no difference in each direction of investment of insurance companies, and that the idle funds of insurance companies are used more safely. Key words: development history;statistical distribution form;logical relation;case application引言十九大中提出,现在我国的经济呈现中高速增长的趋势,位列世界前列,国内生产总值已经达到八十万亿元,占据世界第二,经济增长贡献率已超百分之三十。
在如今这样一个大背景下,统计分布在人们的经济社会生活中的重要性愈发凸显,例如,人们可以通过(0-1)分布检查产品的质量是否合格、通过泊松分布探讨经过计数器的粒子数、利用卡方分布进行适应性分析及独立性鉴定等但,由于人们对统计分布形态关系的研究较少,更多的是对单个分布形态的研究和应用,缺少避免社会资源不必要支出的系统性,造成极大浪费统计分布是数理统计中由理论推演出来的随机变量的概率分布模型[[] 周世国,齐祥来,杨松华.χ~2分布与F分布间的关系研究[J].南阳师范学院学报,2007, 6(3):21-23.]统计分布可以分为离散型分布、连续型分布和抽样分布,(0-1)分布、二项分布、泊松分布和几何分布属于离散型分布连续型分布则包括均匀分布、指数分布和正态分布等而卡方分布、t分布和F分布等,则是抽样分布的内容1统计分布形态发展历史1.1 在概率论方面的发展概率论的来源和赌博有一定关系,早在16世纪,卡当诺发现赌博的输赢结果会呈现出一种偶然性,但当赌博的次数达到一定数量时,其结果就会表现出一种规律性在文艺复兴之后,人们希望通过研究大规模的偶然事件,来寻找其中的规律荷兰数学家惠更斯和法国的费尔马与帕斯卡都对其中所呈现的概率论原理法则进行讨论,塑造了概率论的雏形。
[[] 赖景耀.概率论的起源和发展[J].西北师范大学学报(自然科学版),1984(3):13-19.]概率论真正形成并发展是处于18世纪1713年伯努利在其著述《推想的艺术》中点明概率论中具备重要地位的大数定律也因此,概率论发展到了普适性的理论概括阶段[[] 赵晓芬.评贝叶斯方法对概率逻辑的继承和发展[J].安徽警官职业学院学报,2011, 10(4):98-100.]法国数学家德莫佛所著的《机遇原理》一书在1781年发表,其内容包含乘法法则和正态分布律的概念,为后来中心极限定理的提出与发展提供基础随着牛痘在欧洲的广泛接种,疫苗所带来的副作用在人群中引起广泛关注,丹尼尔伯努利以大量统计数据为根据,发现接种牛痘可以延长寿命,缓解了社会恐慌和人们的怀疑同时伯努利还曾经提出了伯努利试验该试验作为一种在相同条件下周而复始地进行实验的数学模型,每一次试验会产生发生或者不发生两种可能,在随机一次试验中,事件发生呈现相同概率,实验结果相互独立、互不干涉0-1)分布、二项分布和几何分布可由伯努利试验、n重伯努利试验和扩展的伯努利试验得出0-1)分布作为一种离散型机率分布,为使后人铭记瑞士科学家詹姆斯伯努利,也被称为伯努利试验。
二项分布由伯努利提出,二项分布其实质就是周而复始做了多次的伯努利试验几何分布也是一种离散型概率分布,即在n次伯努利试验中做k次试验才能够成功一次的概率对于几何分布的研究,70年代的时候,就已经得到许多科学家的重视,Arnold在1976年利用顺序统计量来进行研究,随后EL-Neweihi、Shanbbag、Govindarajulu等科学家也对此进行了研究,马本成等人在前者基础上,以矩和顺序统计量为基点来探讨几何分布中的特征[[] 刘丹.关于几何分布高阶矩的计算问题的研究[J].吉林师范大学学报(自然科学版),2009, 30(2):129-131.]作为物理学家、数学家和力学家的泊松,年少时就进行有限差分研究,有数百篇论文发表,并积极对概率论的应用,特别是用在统计方面的应用,做出一定的发展以及改良,1837年《关于判断的概率之研究》发表问世,在这篇文章中特别地首次阐述了泊松分布,这是一种描述随机现象的离散型的概率分布,对后世有巨大影响的泊松分布自此诞生,同时泊松还广泛推行了大数定律,以此为基础上导出了泊松积分,对后来影响重大在数理统计学方面的发展统计开始是被运用于社会人口普查,但这并不等同现代认为的统计学,严格来说,18世纪时,由于概率论的影响,统计才开始以独立学科的地位演进。
1733年,德国科学家Moirvre首次提出正态分布的概念后来,高斯研究天文观测的误差时,在其中采用了最小二乘法,并且首次将正态分布的概念应用其中,这意味着近代数理统计学开始发展,因而正态分布又可以称为高斯分布后来,凯特勒在数据拟合时采用了正态分布,接着生物统计学派的奠基人在研究亲子间的身高数据时,发现它们呈现同一的正态分布形态,为了进行深入研究,设计了高尔顿钉板,引进了回归直线和相关系数的定义,回归分析诞生在20世纪时,数理统计学发展很快,物理学家麦克斯韦在进行空气分子运动速度分布的研讨时,发现空气分子速度呈现为正态分布,而其平方则契合卡方分布同时期,皮尔逊在其研究对物种进行区分所需求的数据分布理论时,提出“概率”和“相关”概念,以及标准差、均方根误、正态曲线差等术语表达,后又发现有些数据有显著的偏态,正态分布无法很好利用,于是将麦克斯韦的发现与分布曲线和数据的拟合优度测验相结合,提出卡方统计量,并肯定卡方分布是其极限分布其学生戈塞特跟随其学习了一年的统计学,利用工厂的条件,对小样本进行研究,探讨其均值和标准差以及它们之间比值的关系,并画出分布图来对其在图表中的特点加以调查,因其工作原因,戈塞特化名学生氏,提出了t分布,该分布是样本均值和标准差比值,且样本为正态样本,并编制出此分布表,为小样本统计的发展提供了基础条件。
同为其学生的费歇尔,曾提出了极大似然估计,且在1924年阐释了F分布,也因其是F分布的提出者,故命名时,直接以其姓氏首字母命名戈塞特、费希尔等人提高了正态分布在统计学中的地位,促进了小样本统计的发展,为诸多的概率统计分析方法的产生奠定了基础,同时也促进了现代统计学的发展2随机变量及其分布在对统计分布的研究之前我们先要了解几个关于随机变量及其分布的概念首先是随机试验的概念随机试验是对自然现象中的随机事件进行的观察和试验,具有可在相同条件下进行、试验全部可能结果可列清、试验之前人们无法预测会产生什么样可能结果的特点其次是样本点和样本空间的概念人们把随机实验中能够呈现的不同结果叫做样本点,记作或,而整体样本点的集合被叫做样本空间,以或进行表示然后是随机事件与随机变量样本空间中的子集被叫做随机事件,就是在随机试验中有可能发生也或者不发生的事件当样本点构成的子集为不可分的单点集或称为基本事件,即相对于观察目标不能再分的事件设为随机变量的样本空间,如果对的每个基本事件,都能有且仅有一个实数和它相对,则是定义在上的随机变量最后是期望和方差的概念所谓数学期望(也可以称为均值),是用来表现随机变量的平均取值高低的数学特征之一,通常是将每次可能产生的结果概率与结果相乘得到的和值。
所谓方差是用来权衡随机变量与其均值(数学期望)的偏离水平值2.1 离散型随机变量如果某些随机变量能够取到有限个或无限多个但可数清时的值,就可以叫做离散型随机变量例如某个城市的报警平台一天内接到的求助次数就可以表现为离散型随机变量假设我们要把握某个离散型随机变量呈现的规律,就要了解的所有可能取值,和这些可能取值的分别概率设离散型随机变量所有可能值是,呈现每个可能值的概率,也就是事件的概率,为也可叫做随机变量的分布律(分布列)[[] 盛骤,谢式千,潘承毅.概率论与数理统计.3版[M].高等教育出版社,2001:32-33.]且这些概率相加为1,换言之,就是概率1以某种的规律表现在可能值上,而这,就是分布律名称的由来对于离散型变量而言,其期望为,其方差为,其中2.2 连续型随机变量与离散型随机变量不同,连续型随机变量的取值可以充满整个样本空间,甚至整段数轴换言之,连续型所取的可能值无法通过一一列举的方式予以展示同时,在我们的日常生活中,出于经济以及合理性、恰当性等多方考虑,人们对于这种非连续型随机变量往往从区间的角度进行考量,且这些变量取某个值时的概率有可能是0例如在考虑误差时,人们更关注的是误差低于某一个临界值的概率;在候车问题中,人们更关心花费某个段时间等待的概率;在降水问题上,人们更重视某段降水量的概率等等。
连续型随机变量定义:连续型随机变量关于随机变量的分布函数,有非负函数对于任意一个实数有,那么就被叫做连续型随机变量,其中函数就是的概率密度函数,简单称之为概率密度[[] 冯卫国,武爱文编.概率论与数理统计[M].上海交通大学出版社,2014:64-65.]由定义可知假如变化密度函数在某个点上的函数值,并不能使分布函数的取值变化,故而密度函数并不是有且仅有一个的,其图形。












