第七章__参数估计课件
第七章 参数估计,点估计、区间估计与标准误 总体平均数的估计 标准差与方差的区间估计,参数估计在统计方法中的地位,什么是参数估计,当在研究中从样本获得一组数据后,如何通过这组数据信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况,称为总体参数估计。 参数估计可分为点估计和区间估计两种。,统计推断的过程,第一节 点估计、区间估计与标准误,一、点估计的定义 点估计是指在进行参数估计时,直接用一个特定点值作为总体参数的估计值。 二、良好估计量的标准 无偏性:即用多个样本的统计量作为总体参数的估计值,其偏差的平均数为0。 有效性:当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好。 一致性:当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数,估计值越来越精确,逐渐趋近于真值。 充分性:指一个容量为n的样本统计量,是否充分地反映了全部n个数据所反映总体的信息。,三、区间估计与标准误,区间估计的定义 是根据样本统计量,利用抽样分布的原理,在一定的可靠程度上,估计出总体参数所在的范围,即以数轴上的一段距离表示未知参数可能落入的范围。 置信区间与显著性水平 置信区间:也称置信间距,指在一定可靠程度上,总体参数所在的区域距离或区域长度。 置信界限(临界值):置信区间的上下两端点值。 显著性水平:指估计总体参数落在某一区间时,可能犯错误的概率,用符号 表示。有时也称为意义阶段、信任系数等。 置信度(置信水平): 。,区间估计时, 某一概率下,总体参数所在的区间称为置信区间,区间的端点值称为临界值,这个概率称为置信度,以概率 表示,又称显著性水平,表示该区间估计的不可靠程度。,三、区间估计与标准误,区间估计的原理与标准误 区间估计是根据样本分布理论,用样本分布的标准误计算区间长度,解释总体参数落入某置信区间可能的概率。 区间估计存在成功估计的概率大小及估计范围大小两个问题。 妥协办法:在保证置信度的前提下,尽可能提高精确度。规定正确估计的概率即置信度为0.95和0.99,则显著性水平为0.05和0.01。小概率事件在一次抽样中不可能出现。 区间估计的原理是样本分布理论。在计算区间估计值解释估计的正确概率时,依据的是该样本统计量的分布规律及样本分布的标准误。样本分布可提供概率解释,而标准误的大小决定区间估计的长度。一般情况下,加大样本容量可使标准误变小。,区间估计的图示,置信区间与置信水平,置信度和置信区间的意义:,两点说明:,第二节 总体平均数的估计,一、总体平均数估计的计算步骤: 利用抽样的方法抽取样本,计算出样本的平均值 和标准差S。 计算样本平均数的标准误 : 当总体方差已知时,样本平均数的标准误的计算为: 当总体方差未知时,样本平均数的标准误的计算为:,一、总体平均数估计的计算步骤:,确定显著性水平和置信水平 根据样本平均数的抽样分布确定查何种分布表,确定理论值。 确定置信区间: 解释总体平均数的置信区间。,二、总体方差已知时,对总体平均数的估计,当总体分布为正态分布时,(无论样本容量n的大小,从该总体抽取的样本分布均成正态分布。)对总体平均数的估计可以依正态分布进行估计。 例1 已知某市6岁正常男童体重的总体方差为6.55公斤,从该市随机抽取15 名6岁男童,其平均体重为20.4公斤,试求该市6 岁男童平均体重的95%和99%的置信区间。,例1的计算,解: 95%的置信区间的显著性水平=0.05, 因此,的95%的置信区间为: 即: 的99%的置信区间为: 即: 故该市6岁男童平均体重的95%的置信区间为19.11,21.69;99%的置信区间为18.7,22.1。,二、总体方差已知时,对总体平均数的估计,当总体为非正态分布时(只有当样本容量n30时,此时样本抽样分布渐近正态分布。这时可依正态分布进行估计,否则不能对总体平均数进行估计。) 例2 已知某区15 岁男生立定跳远的方差为 ,现从该区抽取58名15岁男生,测得该组男生立定跳远的平均数为198.4cm,试求该区15岁男生立定跳远平均成绩的95%和99%的置信区间。,例2,解:由题意知:由于样本容量(n=58)大于30 ,该样本的抽样分布为渐进正态分布。 因此,的95%的置信区间为: 198.41.962.75198.41.962.75 即 193.01203.79 的99%的置信区间为: 198.42.582.75198.42.582.75 即 191.3205.5 故该区15岁男生立定跳远的平均成绩有95%的可能落入193.01,203.79内,有99%的可能落入191.3,205.5内。,三、总体方差未知,对总体平均数的估计,1.假定条件 总体服从正态分布,且方差() 未知 使用 t 分布统计量,总体均值 在1-置信水平下的置信区间为,t 分布, t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布,三、总体方差未知,对总体平均数的估计,当总体分布为正态分布时(无论样本容量n的大小,从该总体抽取的样本所形成的分布均服从自由度为n-1的t分布,对总体平均数的估计可依t分布进行估计) 例3 从某市抽取20 名7 岁女童,经测量,这20 名女童的平均身高为116cm,标准差为5cm,试求该市7岁女童总平均身高的95%和99%的置信区间。 例4 从某市抽取36 名7 岁女童,经测量,这36 名女童的平均身高为115.8cm,标准差为4.8cm,试求该市7岁女童总平均身高的95%和99%的置信区间。,例3,解:由题意知,其总体方差未知,但其总体分布为正态分布,则此样本均数的分布服从t分布,可以依t分布对总平均身高进行估计。,例4,解:由题意知,其总体方差未知,但其总体分布为正态分布,则此样本均数的分布服从t分布, 可以依t分布对总平均身高进行估计。,三、总体方差未知,对总体平均数的估计,当总体为非正态分布时(只有当样本容量n30时,此时样本抽样分布服从自由度为n-1的t分布,这时可依t 分布对总体平均数进行估计,否则不能对总体 平均数进行估计。) 例5 某校进行一次数学考试,从中抽取40名考生,经计算,这40 名考生的平均成绩为82分,标准差为7 分,试求全体考生平均成绩的95%和99%的置信区间。,例5,解:由题意知,其总体方差未知,其总体分布也未知,但n=4030, 因此可以依t分布对全体考生平均成绩进行估计。,第三节 总体标准差与总体方差的估计,一、总体标准差的区间估计 估计总体标准差的步骤与估计总体平均数的步骤大致相同。但有两点需要说明: 从抽样分布的讨论已知,样本标准差的抽样分布在n30时为渐近正态分布,总体标准差可依正态分布来估计。当n<30时,总体标准差则无法估计。 从理论上讲,样本标准差分布的标准差标准误可由 来计算,但由于总体标准差未知,可用总体标准差的无偏估计量Sn-1作为替代来计算标准误。即,标准差的区间估计,1.假定条件 样本容量大于30,样本标准差分布近似服从正态分布。 2、总体标准差 在1-置信水平下的置信区间为,例7 某区一次英语统考中,随机抽取40名考生,计算其英语成绩的标准差为15.6,试求该区英语统考成绩总标准差的95%和99%的置信区间。 解:由题意知,由样本标准差估计总体标准差,且n30,可依正态分布估计。,二、总体方差的估计,根据对抽样分布的讨论可知, 分布的特征之一是从正态分布总体中,随机抽取容量为n的样本, 其样本方差与总体方差比值的分布为 分布。即:,总体方差的区间估计(不受样本容量限制),二、总体方差的估计,例8 在某市进行的一次智力测验中,随机抽取20名12岁学生,经计算其智力测验的方差为72.25,试求该市12岁学生智力测验分数总体方差的95%和99%的置信区间。 解:由于智力测验分数一般认为服从正态分布, 由该总体中抽出的样本在估计总体方差时符合 分布。,例9 根据例7的资料, 用估计总体方差的办法来估计该区英语统考成绩的总标准差的95%和99%的置信区间。,解:已知n=40,S=15.6,df=n-1=39,查 值表得:,作业,2、从某年高考随机抽102份作文试卷,算得平均分为26,标准差为1.5,试估计总体平均数95%的置信区间。,