
心理与教育统计学课件(张厚粲版)ch7参数估计.ppt
41页第七章 参数估计当在研究中从样本获得一组数据后,如何 通过这组数据信息,对总体特征进行估计,也 就是如何从局部结果推论总体的情况,称为总 体参数估计参数估计可分为点估计和区间估计两种1第一节 点估计、区间估计与标准误一、点估计的定义 点估计是指在进行参数估计时,直接用一个特定点值作为 总体参数的估计值 二、良好估计量的标准 ⑴无偏性:即用多个样本的统计量作为总体参数的估计值 ,其偏差的平均数为0 ⑵有效性:当总体参数的无偏估计不止一个统计量时,无 偏估计变异小者有效性高,变异大者有效性低,即方差 越小越好 ⑶一致性:当样本容量无限增大时,估计值应能够越来越 接近它所估计的总体参数,估计值越来越精确,逐渐趋 近于真值 ⑷充分性:指一个容量为n的样本统计量,是否充分地反 映了全部n个数据所反映总体的信息2三、区间估计与标准误㈠区间估计的定义 是根据样本统计量,利用抽样分布的原理,在一定的 可靠程度上,估计出总体参数所在的范围,即以数 轴上的一段距离表示未知参数可能落入的范围 ㈡置信区间与显著性水平 ⑴置信区间:也称置信间距,指在一定可靠程度上,总体参 数所在的区域距离或区域长度 ⑵置信界限(临界值):置信区间的上下两端点值。
⑶显著性水平:指估计总体参数落在某一区间时,可能犯错 误的概率,用符号 表示有时也称为意义阶段、信任 系数等 ⑷置信度(置信水平): 3三、区间估计与标准误㈢区间估计的原理与标准误 ⑴区间估计是根据样本分布理论,用样本分布的标准误计算区 间长度,解释总体参数落入某置信区间可能的概率 ⑵区间估计存在成功估计的概率大小及估计范围大小两个问题 妥协办法:在保证置信度的前提下,尽可能提高精确度规定 正确估计的概率即置信度为0.95和0.99,则显著性水平为0.05 和0.01小概率事件在一次抽样中不可能出现 ⑶区间估计的原理是样本分布理论在计算区间估计值解释估 计的正确概率时,依据的是该样本统计量的分布规律及样本 分布的标准误样本分布可提供概率解释,而标准误的大小 决定区间估计的长度一般情况下,加大样本容量可使标准 误变小 4一、参数估计的原理㈡区间估计的原理和方法 ⒈置信区间和显著性水平区间估计时, 某一概率下,总体参数所在 的区间称为置信区间,区间的端点值称为临界 值,这个概率称为置信度,以概率 表示 , α又称显著性水平,表示该区间估计的不 可靠程度。
⒉区间估计的原理和方法56第二节 总体平均数的估计一、总体平均数估计的计算步骤: ⒈利用抽样的方法抽取样本,计算出样本的平均 值 和标准差S ⒉计算样本平均数的标准误 : ①当总体方差已知时,样本平均数的标准误的计 算为:②当总体方差未知时,样本平均数的标准误的计 算为:7一、总体平均数估计的计算步骤:⒊确定显著性水平和置信水平 ⒋根据样本平均数的抽样分布确定查何种分布表,确定理论值 ⒌确定置信区间:⒍解释总体平均数的置信区间8二、总体方差已知时,对总体平均数的估计⒈当总体分布为正态分布时,(无论样本容量n的大 小,从该总体抽取的样本分布均成正态分布对 总体平均数的估计可以依正态分布进行估计 例1 已知某市6岁正常男童体重的总体方差为6.55公斤,从该 市随机抽取15 名6岁男童,其平均体重为20.4公斤,试求该 市6 岁男童平均体重的95%和99%的置信区间 例2 已知某市6岁正常男童体重的总体方差为6.55公斤,从该 市随机抽取40 名6岁男童,其平均体重为20.4公斤,试求该 市6 岁男童平均体重的95%和99%的置信区间9例1的计算 • 解: 95%的置信区间的显著性水平α=0.05, 因此,μ的95%的置信区间为:即: μ的99%的置信区间为:即: 故该市6岁男童平均体重μ的95%的置信区间为[19.11 ,21.69];99%的置信区间为[18.7,22.1]。
10二、总体方差已知时,对总体平均数的估计⒉当总体为非正态分布时(只有当样本容量n>30 时,此时样本抽样分布渐近正态分布这时可依 正态分布进行估计,否则不能对总体平均数进 行估计 例3 已知某区15 岁男生立定跳远的方差为 ,现从该区抽取58名15岁男生,测得该组男生 立定跳远的平均数为198.4cm,试求该区15岁 男生立定跳远平均成绩的95%和99%的置信区 间11例3解:由题意知:由于样本容量(n=58)大于30 ,该样本的抽样分布为渐进正态分布因此,μ的95%的置信区间为:198.4-1.96×2.75≤μ≤198.4+1.96×2.75 即 193.01≤μ≤203.79 μ的99%的置信区间为:198.4-2.58×2.75≤μ≤198.4+2.58×2.75 即 191.3≤μ≤205.5 故该区15岁男生立定跳远的平均成绩有95%的可 能落入[193.01,203.79]内,有99%的可能落入 [191.3,205.5]内12三、总体方差未知,对总体平均数的估计⒈当总体分布为正态分布时(无论样本容量n的 大小,从该总体抽取的样本所形成的分布均服 从自由度为n-1的t分布,对总体平均数的估计 可依t分布进行估计) 例4 从某市抽取20 名7 岁女童,经测量,这20 名女童的 平均身高为116cm,标准差为5cm,试求该市7岁女童 总平均身高的95%和99%的置信区间。
例5 从某市抽取36 名7 岁女童,经测量,这36 名女童的 平均身高为115.8cm,标准差为4.8cm,试求该市7岁女 童总平均身高的95%和99%的置信区间13例4 解:由题意知,其总体方差未知,但其总体分布为正态分 布,则此样本均数的分布服从t分布,可以依t分布对总 平均身高μ进行估计14例5解:由题意知,其总体方差未知,但其总体分布为正态分布 ,则此样本均数的分布服从t分布, 可以依t分布对总 平均身高μ进行估计15三、总体方差未知,对总体平均数的估计⒉当总体为非正态分布时(只有当样本容量n>30 时,此时样本抽样分布服从自由度为n-1的t分 布,这时可依t 分布对总体平均数进行估计, 否则不能对总体 平均数进行估计 例6 某校进行一次数学考试,从中抽取40名考生 ,经计算,这40 名考生的平均成绩为82分,标 准差为7 分,试求全体考生平均成绩的95%和 99%的置信区间16例6解:由题意知,其总体方差未知,其总体分布也未 知,但n=40>30, 因此可以依t分布对全体考生 平均成绩μ进行估计17第三节 总体标准差与总体方差的估计一、总体标准差的区间估计估计总体标准差的步骤与估计总体平均数的 步骤大致相同。
但有两点需要说明: ⒈从抽样分布的讨论已知,样本标准差的抽样分 布在n>30时为渐近正态分布,总体标准差可依 正态分布来估计当n30,可依正态分布估计19二、总体方差的估计根据对抽样分布的讨论可知, 分布的特征之一是 从正态分布总体中,随机抽取容量为n的样本, 其 样本方差与总体方差比值的分布为 分布即:20二、总体方差的估计 例8 在某市进行的一次智力测验中,随机抽取20名12岁 学生,经计算其智力测验的方差为72.25,试求该市12 岁学生智力测验分数总体方差的95%和99%的置信区间 解:由于智力测验分数一般认为服从正态分布, 由该总 体中抽出的样本在估计总体方差时符合 分布21例9 根据例7的资料, 用估计总体方差的办法来 估计该区英语统考成绩的总标准差的95%和99% 的置信区间 解:已知n=40,S=15.6,df=n-1=39,查 值表得:22例9(续)由例9的结果来看,与例7的结果相近但值 得注意的是,用总体方差的估计方法的一个前 提条件是总体应服从正态分布,若总体不服从 正态分布,则不适用此方法因此,当总体为 正态,样本容量n30时,且 总体分布未知,则仍采用总体标准差的估计方法 较为合适。
23三、两总体方差之比的区间估计24三、两总体方差之比的区间估计例10 某区对该区所辖三年级小学生进行身 体检查,在检查时,从中随机抽取了男 生50名,女生40名,经测量,50名男生 体重的标准差为1.8公斤,40名女生体重 的标准差为1.7公斤,试求该区三年级小 学生男女体重的方差之比的95%和99%的 置信区间25例10 解:由题意和抽样分布的理论,两样本方差之比应 服从F分布26例10(续)• 则得两方差之比的95%的置信区间:• 同理可得两方差之比的99%的置信区间:故该区三年级小学生男女体重的方差之比有95%的可能在 区间[0.6,2.05]之中,有99%的可能落在区间[0.5,2.5] 之中 在估计两总体方差之比时,如果两方差相等,则 . 那么从这两总体抽取的两样本方差之比值大多数在1上下 波动,此时就可以通过判定两总体方差的比值是否在1 的上下波动来判定两总体方差是否相等因此两总体 方差之比的区间估计了可作为检验两总体方差是否相 等的另一种方法27第四节 总体相关系数的估计一、积差相关系数的估计 ㈠积差相关系数的抽样分布 ⒈当总体相关系数ρ=0时,样本相关系数的分布 一般服从自由度为n-2的 t 分布,随着样本容量 的增大,样本相关系数的分布渐近正态分布。
⒉当总体相关系数 时,其样本相关系数的 抽样分布情况较为复杂,⑴当样本容量小于 500时,相关系数为正值,其分布为正偏态, 相关系数为负值,其分布为负偏态⑵当样本 容量足够大(即n>500),样本相关系数的抽样分 布才渐近正态分布28一、积差相关系数的估计㈡积差相关系数的区间估计 ⒈当总体相关系数 时,可依 t 分布估计总 体相关系数利用下列公式求其标准误:⒉当总体相关系数 、且n>500时,可依正态 分布估计总体相关系数其标准误可按上面公 式(8-8)计算,总体相关系数的置信区间为:29一、积差相关系数的估计 ㈡积差相关系数的区间估计 ⒊当总体相关系数 时,且容量小于500时 ,其样本相关系数的抽样分布极不稳定,人们 常用费舍法费舍利用下面公式将 r 转换为Z 值,而Z值渐近正态分布一般不使用公式(8-9)来计算Z值,统计学家 已经根据公式编制出 r 与Z的转换表,见附表 30利用费舍Z函数估计总体相关系数的步骤 ⒈查附表8把 r 转换为Zr值; ⒉利用公式(8-10)计算Zr的标准误; ⒊在不同的显著性水平下确定Zρ的置信区 间:⒋将Zρ的置信上下限查附表8,从而得到 ρ的置信区间。
31利用费舍Z函数估计总体相关系数的例题例11 某校给学生进行体验时,抽取40名作样本, 计算得到他们的身高、体重的相关系数为0.55 ,试求该学校学生身高与体重的相关系数的置 信区间 解:由题意知,该学校学生身高,体重的相关情况 未知,且样本容量n20时,样本相关系数的抽样分布服从正态 分布 ㈡等级相关系数的区间估计 根据样本容量的不同选择不同的抽样分布进行估 计,其方法现与总体平均数的方法相似在计 算标准误时,两种情况的标准误计算公式均为 :34二、等级相关系数的估计例12 某市进行数学与物理统考,从中各抽取15名 和60名学生作为样本,经计算这两个样本的等 级相关系数分别为0.42和0.45,试分别求出该 市数学与物理成绩的相关系数的置信区间 解:①当n=15时,该样本相关系数的抽样分布服从 自由度为13的t分布,可依t分布对总体相关系 数进行估计 样本相关系数的标准误:35例12 (解续)因此,ρ的95%的置信区间为:ρ的99%的置信区间为:②当n=60时,该样本相关系数的抽样分布服从正态分布 ,可依正态分布对。
