
222用样本的数字特征估计总体的数字特征(2)方差标准差讲解课件.ppt
25页2.2.2用样本的数字特征估计总体用样本的数字特征估计总体的数字特征(的数字特征(2))方差、标准差方差、标准差学习目标学习目标1.1.明确标准差、方差等数字特征的意义,深刻明确标准差、方差等数字特征的意义,深刻体会它们所反映的样本特征体会它们所反映的样本特征2.2.会用样本的数字特征估计总体的的数字特征,会用样本的数字特征估计总体的的数字特征,初步体会样本的数字特征的随机性初步体会样本的数字特征的随机性复习回顾复习回顾一一.什么是一组数据的众数、中位数及平均数?什么是一组数据的众数、中位数及平均数?中位数:中位数:把数据从小到大排列,若数据个数为奇数把数据从小到大排列,若数据个数为奇数个,最中间的数据就是中位数;若数据个数为偶数个,最中间的数据就是中位数;若数据个数为偶数个,则最中间两位数据的平均数就是中位数个,则最中间两位数据的平均数就是中位数平均数平均数:各数据总和除以数据个数所得的商.:各数据总和除以数据个数所得的商. 众数:众数:一组数据中出现次数最多的数据一组数据中出现次数最多的数据二二 、众数、中位数、平均数与频率分布直方图的关系、众数、中位数、平均数与频率分布直方图的关系1、、众数众数在样本数据的频率分布直方图中,在样本数据的频率分布直方图中,就是最高就是最高矩形的中点的横坐标矩形的中点的横坐标。
2、在频率分布直方图中,、在频率分布直方图中,中位数左边和右边的直方中位数左边和右边的直方图的面积相等图的面积相等!!3、将、将频率分布直方图中每个小矩形的面积与小矩形底频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加边中点的横坐标之积相加,就是样本数据的,就是样本数据的估值平均估值平均数数.小明是班里的小明是班里的优秀学生,他的秀学生,他的历次数学成次数学成绩是是96,98,95,93分,但最近的一次考分,但最近的一次考试成成绩只有只有45分,原因是他分,原因是他带病参加了考病参加了考试.期末.期末评价价时,,怎怎样给小明小明评价?价?•[错因分析错因分析] 这种评价是不合理的,尽管平均这种评价是不合理的,尽管平均分是反映一组数据平均水平的重要特征,但分是反映一组数据平均水平的重要特征,但任何一个数据的改变都会引起它的变化,而任何一个数据的改变都会引起它的变化,而中位数则不受某些极端值的影响.本题中的中位数则不受某些极端值的影响.本题中的5个成绩从小到大排列为:个成绩从小到大排列为:45,93,95,96,98;中;中位数是位数是95,较为合理地反映了小明的数学水,较为合理地反映了小明的数学水平,因而应该用中位数来衡量小明的数学成平,因而应该用中位数来衡量小明的数学成绩.绩.•[正解正解] 小明小明5次考次考试成成绩,从小到大排列,从小到大排列为45,93,95,96,98,中位数是,中位数是95,,应评定定为““优秀秀””.. 样本的众数、中位数和平均数常用来表示样本样本的众数、中位数和平均数常用来表示样本数据的数据的“中心值中心值”,其中众数和中位数容易计算,,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据不受少数几个极端值的影响,但只能表达样本数据中的少量信息中的少量信息. 平均数代表了数据更多的信息,但受平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的样本中每个数据的影响,越极端的数据对平均数的影响也越大影响也越大.当样本数据质量比较差时,使用众数、当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的况,因此,我们需要一个统计数字刻画样本数据的离散程度离散程度. 新课引入新课引入 有两位射击运动员在一次射击测试中有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数如下:各射靶十次,每次命中的环数如下:甲甲 7 8 7 9 5 4 9 10 7 4乙乙 9 5 7 8 7 6 8 6 7 7 如果你是教练,你应当如何对这次射击情如果你是教练,你应当如何对这次射击情况作出评价?如果这是一次选拔性考核,你应况作出评价?如果这是一次选拔性考核,你应当如何作出选择?当如何作出选择? 两人射击两人射击 的平均成绩是一样的的平均成绩是一样的. 那么两个那么两个人的水平就没有什么差异吗人的水平就没有什么差异吗?问题提出:问题提出: 4 4 5 7 7 7 8 9 9 10 5 6 6 7 7 7 7 8 8 945678910环数频率频率0.10.20.3(甲)456789 100.10.20.30.4环数频率频率(乙)发现什么?发现什么?为此,我们还为此,我们还需要从另外一需要从另外一个角度去考察个角度去考察这两组数据!这两组数据! 直观上看,还是有差异的.如:甲成绩比较分散, 直观上看,还是有差异的.如:甲成绩比较分散,乙成绩相对集中乙成绩相对集中(如图示如图示).因此,我们还需要从另外的.因此,我们还需要从另外的角度来考察这两组数据.例如:在作统计图,表时提到角度来考察这两组数据.例如:在作统计图,表时提到过的极差.过的极差. 甲的环数极差甲的环数极差=10-4=6 乙的环数极差乙的环数极差=9-5=4. 它们在一定程度上表明了样本数据的它们在一定程度上表明了样本数据的分散程度分散程度,与,与平均数一起,可以给我们许多关于样本数据的信息.显平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以然,极差对极端值非常敏感,注意到这一点,我们可以得到一种得到一种“去掉一个最高分,去掉一个最低分去掉一个最高分,去掉一个最低分”的统计的统计策略策略. 考察样本数据的分散程度的大小,最常用的统计量 考察样本数据的分散程度的大小,最常用的统计量是是标准差标准差.. 标准差是样本平均数的一种平均距离,一般用标准差是样本平均数的一种平均距离,一般用s表示.表示.所谓所谓“平均距离平均距离”,其含义可作如下理解:,其含义可作如下理解:课程讲授课程讲授 方差、标准差方差、标准差是样本数据到平均数的一种是样本数据到平均数的一种平均距离。
它用来描述样本数据的分散程度平均距离它用来描述样本数据的分散程度在实际应用中,标准差常被理解为稳定性在实际应用中,标准差常被理解为稳定性1、方差、方差(标准差的平方)公式为:公式为:假设样本数据是假设样本数据是平均数是平均数是2、标准差、标准差公式为:公式为:在刻画样本数据分散程度上,两者是一致的!在刻画样本数据分散程度上,两者是一致的!如如 试比较以下两组样本数据的分散程度试比较以下两组样本数据的分散程度 101,,98,,102,,100,,99 1 ,,3 ,,5 ,,7 ,,9经验总结经验总结: 标准差标准差用来用来描述样本数据的分散程度描述样本数据的分散程度标准差标准差 方差、标准差方差、标准差是样本数据到平均数的一种平均是样本数据到平均数的一种平均距离它用来描述样本数据的离散程度在实际应距离它用来描述样本数据的离散程度在实际应用中,标准差常被理解为稳定性用中,标准差常被理解为稳定性规律:标准差越大,规律:标准差越大,则则a越大,数据的越大,数据的离散程度越大;反离散程度越大;反之,数据的离散程之,数据的离散程度越小。
度越小性质归纳:性质归纳:数学应用:数学应用:例例1、已知有一个样本的数据为、已知有一个样本的数据为1,,2,,3,,4,,5,求平均数,方差,标准差求平均数,方差,标准差例例2 甲乙两人同时生产内径为甲乙两人同时生产内径为25.40mm的一种零件的一种零件.为为了对两人的生产质量进行评比了对两人的生产质量进行评比,从他们生产的零件中各从他们生产的零件中各抽出抽出20件件,量得其内径尺寸如下量得其内径尺寸如下(单位单位:mm)甲 25.46, 25.32, 25.45, 25.39, 25.36 25.34, 25.42, 25.45, 25.38, 25.42 25.39, 25.43, 25.39, 25.40, 25.44 25.40, 25.42, 25.35, 25.41, 25.39乙 25.40, 25.43, 25.44, 25.48, 25.48 25.47, 25.49, 25.49, 25.36, 25.34 25.33, 25.43, 25.43, 25.32, 25.47 25.31, 25.32, 25.32, 25.32, 25.48 从生产的零件内径的尺寸看从生产的零件内径的尺寸看,谁生产的质量较高谁生产的质量较高?解解:用计算器计算可得用计算器计算可得:说明:说明:1.1.生产质量可以从总体的平均数与标准差两个生产质量可以从总体的平均数与标准差两个角度来衡量,但甲、乙两个总体的平均数与标准差都角度来衡量,但甲、乙两个总体的平均数与标准差都是不知道的,我们就用样本的平均数与标准差估计总是不知道的,我们就用样本的平均数与标准差估计总体的平均数与标准差体的平均数与标准差. . 2. 2.问题中问题中25.40mm25.40mm是内径的标准值,而不是总是内径的标准值,而不是总体的平均数体的平均数. .当堂当堂训练::一次数学知一次数学知识竞赛中,两中,两组学生成学生成绩如下表:如下表:•已已经算得两个算得两个组的平均分都是的平均分都是80分,分,请根据根据你所学你所学过的的统计知知识,,进一步判断一步判断这两个两个组这次次竞赛中成中成绩谁优谁次,并次,并说明理由.明理由.分数5060708090100人数甲组251013146乙组441621212(3)甲、乙两组成绩的中位数、平均数都是甲、乙两组成绩的中位数、平均数都是80分,分,其中甲组成绩在其中甲组成绩在80分以上分以上(含含80分分)的有的有33人,乙人,乙组成绩在组成绩在80分以上分以上(含含80分分)的有的有26人,从这一角人,从这一角度看,甲组成绩总体较好.度看,甲组成绩总体较好.(4)从成绩统计表看,甲组成绩大于或等于从成绩统计表看,甲组成绩大于或等于90分的分的人数为人数为20人,乙组成绩大于或等于人,乙组成绩大于或等于90分的人数为分的人数为24人,所以乙组成绩在高分阶段的人数多,同时,人,所以乙组成绩在高分阶段的人数多,同时,乙组得满分的比甲组得满分的多乙组得满分的比甲组得满分的多6人,从这一角人,从这一角度看,乙组成绩较好.度看,乙组成绩较好.1.甲、乙两中学生在一年里学科平均分相等,.甲、乙两中学生在一年里学科平均分相等,但他但他们的方差不相等,正确的方差不相等,正确评价他价他们的学的学习情况情况是是( )A.因.因为他他们平均分相等,所以学平均分相等,所以学习水平一水平一样B.成.成绩平均分平均分虽然一然一样,方差,方差较大的,大的,说明潜明潜力大,学力大,学习态度端正度端正C.表面上看.表面上看这两个学生平均成两个学生平均成绩一一样,但方差,但方差小的成小的成绩稳定定D.平均分相等,方差不等,.平均分相等,方差不等,说明学明学习不一不一样,,方差方差较小的同学,学小的同学,学习成成绩不不稳定,忽高忽低定,忽高忽低•[答案答案] C2.在某次.在某次测量中得到的量中得到的A样本数据如下:本数据如下:82,84,84,86,86,86,88,88,88,88,若,若样本本B数据数据恰好是恰好是样本本A都加上都加上2后所得数据,后所得数据,则A、、B两两样本的下列数字特征本的下列数字特征对应相同的是相同的是( )A.众数.众数 B.平均数.平均数C.中位数.中位数D..标准差准差[答案答案] D[解析解析] B样本数据恰好是样本数据恰好是A样本数据加上样本数据加上2后后所得的众数、中位数、平均数比原来的都多所得的众数、中位数、平均数比原来的都多2,而标准差不变.,而标准差不变.3.已知样本9,10,11,x,y的平均数是10,方差是2,则xy=( )A.98B.88 C.76D.96[答案] D课程小结课程小结1、方差、方差(标准差的平方)公式为:公式为:2、标准差、标准差公式为:公式为:方差、标准差方差、标准差是样本数据到平均数的一种平均是样本数据到平均数的一种平均距离。
它用来描述样本数据的分散程度在实距离它用来描述样本数据的分散程度在实际应用中,标准差常被理解为稳定性际应用中,标准差常被理解为稳定性 3.对同一个总体,可以抽取不同的样本,相应的平对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变均数与标准差都会发生改变.如果样本的代表性差,则如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性可见抽样方法的重要性. 4.在抽样过程中,抽取的样本是具有随机性的,如在抽样过程中,抽取的样本是具有随机性的,如从一个包含从一个包含6个个体的总体中抽取一个容量为个个体的总体中抽取一个容量为3的样本的样本就有就有20种可能抽样,因此样本的数字特征也有随机性种可能抽样,因此样本的数字特征也有随机性. 用样本的数字特征估计总体的数字特征,是一种统计用样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案思想,没有惟一答案.。
