
女士品茶-读后感11600字.docx
17页女士品茶读后感11600字 《女士品茶》读书心得学 院: 国际学院 专 业 班 级: 国际金融113班 学 生 姓 名: 霍启超 学 号: 0114810《女士品茶》读书心得霍启超江西财经大学国际学院国际金融专业《女士品茶》是当代国际著名的统计学家大卫? 萨尔斯伯格的一部通俗的关于统计学原理的普及论著本书以“女士品茶”的故事为开始,但却并非是一本女性读物或者关于品茶的书,而是以这位喝茶的英国女士的假设说法为起点,介绍并引出了近代数理统计的开创者费歇尔,以及费歇尔为解决类似问题而发明的实验设计法,并介绍了20世纪统计学的发展是如何变革了科学全书总共29章,以时间、空间、事迹等相互穿插来讲述发生在统计这个世界里的事件,作者在书中提到的所有科学的学科调查与决策和统计之间的关联都是由一系列实例来说明的,他细数了二十世纪参与这场科学变革的代表性人物与事迹,通过生动有趣却不失严谨的实例论述了统计学原理,并使用大量的非专业语言通俗地阐述了统计学的基本概念和方法,不仅证明了统计学是一门最严格、最合理的认识论和方法学,还深刻地揭示了现代统计学发展的过程,特别是那些很深刻的理论,都是从一些非常简单实际的问题中发展起来的。
在书中他平缓而幽默的叙述,让读者饱览统计学世界的风光,体验这一奇妙的认知之旅,并值得留待慢慢消化与回味,非常适合统计学入门学生和大众读者读完本书,我有以下感受:一、对20世纪统计学发展的了解最初的统计学主要是在英国,而后才蔓延到世界在这一过程中,英国浓厚的学习氛围为统计学的发展提供了肥沃的土壤,得以孕育一批又一批优秀的统计学家,发展出多元而丰富的学说在19世纪,科学家们相信所发生的任何事情都预先地决定于两点:(1)宇宙的初始条件;(2)描绘其运动的数学公式而对于预测值与观测值之间的差异通通归为误差相信只要实验数据越来越精确,这种误差是可以消除的然而,到了19 世纪末,误差并没有消失,反倒是增加了当测试越来越精确,误差也越来越多机械宇宙观处于动摇之中,而统计模型作为一种新的范式在20世纪末期被科学家在各个领域越来越广泛地运用相关、胜率、风险等统计术语也渗入到大众词汇中年轻的费歇尔深入研究了女士品茶问题,并得出了惊人的结论然而,这只是他丰富的统计学说的一小部分,他对于实验设计的研究,同样为当代及后世的统计学家提供了借鉴从对农业的研究,他得出结论:科学家需要从潜在试验结果的数据模型开始工作,这是一系列数据公式,其中一些符号代表试验中将被收集的数据,其它则代表试验的全部结果。
科学家从试验数据开始,并计算与所考虑科学问题相应的结果与费歇尔同样活跃在统计学界的K·皮尔逊,在老师高尔顿的引导下,在非常完整的意义上第一个规范地阐明了“相关系数”这个概念,发现了“偏斜分布”,而他的革命所留下来的则是这样一个观念:科学的对象并不是不可观测事物本身,而是数学分布函数,以描述与所观测事物相联系的概率K·皮尔逊关于分布函数和参数的思想统治了20世纪的科学,并在21世纪仍保持着优势另外,皮尔逊最伟大的成就之一就是创造出第一个“拟合优度检验”在这一时期,他不断地深入探索,最终发明了假使优度检验,而这也为女士品茶这事件的判定起到了很好的辅助作用随后,《生物期刊》问世,成了统计学界的权威刊物戈赛特所写的一系列精彩的论文,几乎都是发表在该刊物上,包括著名的“学生的t检验”这一时期也涌现出了大量杰出的统计学家,如蒂皮特、刚贝尔、耶日??在各个学说蓬勃发展的时候,难免产生出分歧与矛盾最显著的莫过于费歇尔学派与皮尔逊学派的矛盾,两种统计观念的激烈碰撞萨尔斯伯格把这种分歧的原因归结为哲学上的分歧,他这样写道:“哲学上的分歧使费歇尔与K·皮尔逊在研究统计分布的方法上分道扬镳K·皮尔逊把统计分布视为对他所分析数据集合的真实描述。
而按照费歇尔的观点,真实分布只是一个抽象的数学公式,搜集的数据只能用来估计这个真实分布的参数既然所有估计都有误差,那么费歇尔提出来的一些分析的手段,可以把这种误差的程度降到最低,或者可以更经常地得出比其他任何手段都更接近真实分布的答案所以,在20世纪30年代,看上去是费歇尔在这场辩论中获胜了,但到了70年代,皮尔逊学派的观点东山再起直到作者写作本书时,这两个学派的争论仍没有停止所以统计学,抑或说科学的世界展示给我们的是它爱憎分明的一面,即使真理,也要经过质疑与检验奈曼的置信区间也曾被人称为“置信诡计”,贝叶斯的贝叶斯定理被称为“贝叶斯异论”,挫折与磨难才能造就真理正是在不断地对矛盾的探究与发现中,在人们不断地辩证与统一中,飞速地向前发展另外,在人才济济的20世纪统计学界,即使是在二战发生,学术饱受政治干扰与破坏的这样艰苦的环境下,仍有许多统计学家和数学家为统计学发展孜孜不倦的辛勤付出,他们仍然坚持着自己的研究,决不向困难妥协布利斯即使是在人心惶惶的列宁格勒也醉心于他的研究,斯堪的纳维亚地区、德国、法国和苏联的一批数学家则倾心于中心极限定理的研究,霍夫丁在白林创办了《德国数学》,随后威尔克斯、古达克、古德、加德纳、图基等一大批杰出的人物活跃在统计这一广阔的世界。
他们高度的学术牺牲精神,令人肃然起敬在第14章中,萨尔斯伯格称柯尔莫哥洛夫为“数学界的莫扎特”柯尔莫哥洛夫凭借其惊人的数学才华,在数理统计与概率论方面留下了不朽的成就他在思考了概率计算的本质之后,最后终于发现,求一个事件的概率完全就像求一个不规则形状的面积他把新产生的数学测试理论应用到概率的计算上有了这些工具,他就能定出一套公理,再用这些公理构建出整个概率理论这就是柯尔莫哥洛夫的“概率论的公理化”,至今仍是学校中讲授概率论时采用的唯一方法这种方法永久性地解决了有关概率计算有效性的所有问题虽然柯尔莫哥洛夫和他的学生在概率和统计的数学理论上有重大的贡献,但随着20世纪30年代斯大林肃反运动的到来,苏联从这场统计革命中获益甚少,官方的观点制约了统计学的发展 作为入门的著作,作者在每一次引入一个新的概念的时候都会有一定篇幅的背景介绍和相关奇闻异事,比如把女士品茶这个看似很简单并且从某些角度看起来仅仅是一个很无关重要的消遣的实验作为一个引子,并将这个例子作为一条线索贯穿了整本书,从第一章的纯粹的验证这位女士的结论是否正确开始,如何在这位女士没有区分能力的情况下设计实验让她无法仅凭猜测正确,如何在这位女士有区分能力的时候容忍区分出错的概率,比如十次重复实验之后区分对了九次的情况下是否值得我们相信这个女士是有区别能力。
这些对于这个很简单的实验设计形象化了数理课中很多的概念化的东西,最大似然估计,假设检验,中心极限,大数定律作者以非数学的语言描述出统计革命带来的基本哲学观念层面上的重大转变,并超越一般的观念介绍的层面而具体地展示给读者某些精彩的统计研究工作是如何进行的,就这个目的而言本书是确实达到了要求,它并未说清楚很多具体工作的基本思想,也就影响了读者对统计观念的全部力量所能理解的深度作为一个没有系统学习过统计学的学生来说,虽然在很多的时候我不明白这些公式是怎么推出来的,也不知道这些变量是怎么求,怎么算,但能基本上明白这些公式,这些变量的设置是要做什么用的而书中对于真实世界的描述,我们所见的都是一个概率内发生的事情,“充满随即性的大自然里,真实性只存在分布函数之中”费歇尔大师把观测的现象认为是随即的映像,真正我们想把握的只是分布的四个参数所以统计学具有广泛的研究领域,不论是农、工、理、文,艺,包括精算、农学、动物学、人类学、考古学、审计学、晶体学、人口统计学、牙医学、生态学、经济计量学、教育学、选举预测和策划、工程、流行病学等,几乎无所不包,甚至日常生活,几乎没有不用统计学的地方,自K·皮尔逊发现偏斜分布的100多年里,统计革命不仅扩展到大多数的科学领域中,而且其许多思想已经传播到一般的文化当中,统计是一种认知世界的方法。
所以统计学是任何学科进行科学研究的工作母机,没有统计学就没有科学研究、没有创新 现实是复杂的,是绝对不可能由一个有组织的科学模型来完全描述出来的他认为科学就是试图模拟建立一个描述现实的模型,符合可用的数据,并且可以用来预测新实验的结果因为没有任何一个模型是完全真实的,所以,数据越来越多,要求不断地配合新的发现去修正模型以修正对现实的认知这样,模型因为带有特例的直觉上难以置信的延伸,变得越来越来复杂,最终,这个模型不再适用了这时,有创新精神的人将会考虑建立一个全新的模型,一场新的革命在科学领域即将展开统计革命就是模型变换的例子用19世纪决定论的科学观,牛顿物理学已经成功地描述了行星、月球、小行星和彗星等天体的运动,运动都是遵守几个明确的运动和引力定律;在寻找化学规律方面也取得了一些成功;并且达尔文的自然选择学说为理解进化提供了有利的依据;甚至有些人试图将这种寻找科学规律的模型研究引入社会学、政治科学以及心理学等领域 另外统计学不仅是科学的研究方法,还是管理工作的工具任何科学都是研究客观规律的,规律可以在反复试验中重复,而没有重复的事物不是科学研究的对象我们周围的事物每天都在重复,太阳每天东升西落,春夏秋冬四季更替,宏观经济每天运行,只有运行、重复,才有规律。
但人不能两次踏入同一条河,事物的每一次重复决不是前一次的克隆统计学就是变化中研究规律的科学而统计学政治家无法脱离统计而施政,军事家无法脱离信息而指挥,企业家无法脱离统计而决策,任何管理工作都要做到心中有数学好统计,是搞好任何工作的前提日常生活中也充满着统计的科学与艺术,所以需要学习统计二、对统计学的认识统计学是一门研究数据的科学,任务是如何有效地收集、整理、和分析这些数据,探索数据内在的数量规律性,对所观察的现象做出推断或预测,直到为采取决策提供依据统计数据的收集是取得统计数据的过程,它是进行统计分析的基础离开了统计数据,统计方法就失去了用武之地统计数据的整理是对统计数据的加工处理过程,目的是使统计数据系统化、条理化,符合统计分析的需要数据整理是介于数据收集与数据分析之间的一个必要环节在收集和整理数据后,特别需要认清数据自身特点对其进行分析统计数据的分析是统计学的核心内容,它是通过统计描述和统计推断的方法探索数据内在规律的过程: 第一,弄清楚要分析的数据属于什么类型是连续型,还是非连续型?对于连续型数值,均值具有实际意义,对于非连续性的数值,均值并不具备实际意义,而是频数,百分比才有意义,所以,数据属于连续型时,适用比较均值的显著性检验,若是非连续型的级数类,则适用比较频数、比例的检验方法;其实,数据也可以根据不同情况进行灵活处理,例如:对于满意度的衡量,可以根据不同的需求看为连续型分值,也可以看为几个等级的级数;第二,需要了解样本数据的分布特点,弄清楚样本数据是否服从某一分布,对于分布明确的,可以采用参数检验,而不清楚分布情况的则可以采用非参数检验法;第三,判断要检验差异的两组样本的关系,属于独立样本,还是属于配对样本。
独立样本即指在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本,样本之间相互独立;而配对样本可以是同一个体在前后两种状态下某种属性的两种状态,也可以是对某事物两个不同侧面或方面的描述,两样本不是相互独立,而是具有相关性比如《女士品茶》第17章“当部分优于总体时” 中提到: 1937 年,政府想得到有关失业率的准确数据,要在全国进行有史以来第一次严肃的随机调查,同时国会授权在1937 年进行失业普查国会通过了议案,号召失业者填写登记卡,送到当地的邮局那时,全国失业人口数估计在300万到1500万之间,依据对整个调查所作的规划设计,普查局从邮递线路中随机选取2%,然而,即使按2%的比例抽样,普查局也被这样大量的调查问卷难住了:美国邮政服务局曾计划帮他们把问卷分类整理,并制作了一些原始的表格问卷在最初设计时,还希望收集被调查人口统计和工作经历的详细资料,。
