第六章参数估计课件
第六章 参数估计,参数估计:用样本统计量来估计总体的参数,参数估计的两条途径:,点估计:,区间估计:,用由样本数据所计算出来的单个数值对总体参数直接估计,例如利用样本平均数的值估计总体平均数参数。,所谓的区间估计就是在一定的概率保证下指出总体参数的可能范围,这个可能的范围称为置信区间,相应的概率保证保证称为置信水平或置信度。如:某一研究发现猪仔出生重平均数的置信水平为95%的置信区间为(1.02kg,1.38kg),第一节 点估计(Point Estimation),点估计就是用样本特征数来估计相应的总体特征数,如用样本平均数,中位数或众数来估计总体平均数 估计同一个参数的样本统计量(常称为估计量estimator)可能有好几个,如何决定哪个最好?,一个好的估计量应满足三个条件:,3.相容(consistent),1.无偏(unbiased),2.有效(efficient),无偏估计量(unbiased estimator),如果一个统计量的理论平均数等于总体参数,这个统计量就被称为无偏估计量。,1、 是的无偏估计值。 2、s2是2的无偏估计值。,有效估计量(efficient estimator),在样本含量相同的情况下,如果一个统计量的方差小于另一个统计量的方差,则前一个统计量是更有效的估计量。 从一个整体总体中,抽取含量为n的样本,样本平均数的方差为 当n充分大时,中位数m的方差为,相容估计量(consistent estimator),若统计量的取值,任意接近于参数值的概率随样本含量n的无限增加而趋于1,则该统计量称为参数的相容估计量。(样本越大,估计量越好) 样本平均数是总体平均数的相容估计量。 样本方差也是总体方差的相容估计量。,第二节 区间估计 (Interval Estimation),1.区间估计的基本方法,定义:根据样本统计量,以一定的可靠程度推断总体参数所在的区间范围。1-(置信区间)就是区间估计的可靠程度。,一般求法:依据样本统计量的分布来求,这里,我们主要讨论总体分布为正态的情形. 若样本容量很大,即使总体分布未知,应用中心极限定理,可得总体的近似分布,于是也可以近似求得参数的区间估计.,例一,已知原来成年对虾的平均体长0=10.0cm,标准差为=0.40cm。改善饲养方法后,随机抽取10个对虾,测得体长平均数为10.23cm。问改善饲养方法后对虾体长变化是否显著?显著性水平=0.05,2. 平均数 的置信区间,2.1 已知时, 的置信区间,所以 的 1 的置信区间为,或写成,说明:,(1)置信区间不唯一,在置信度固定的条件下,置信区间越短,估计精度越高.,(2)在置信度固定的条件下,n 越大,置信区间越短,估计精度越高.,(3)在样本量n固定时,置信度越大,置信区间越长,估计精度越低.,例2,与北京“全聚德”烤鸭店订立的合同上要求鸭子尽量2.0公斤/只,按只付钱。养鸭户送来100只,平均1.88公斤/只,烤鸭店说太轻了。带回去又养了几天,平均2.12公斤/只。烤鸭店又说太肥了。鸭子合格的平均重量范围应该是多少?显著性水平为0.05,样本含量不同,要求范围不同,每次送4只鸭子,要求的重量范围是1.802.20kg/只 每次送16只鸭子,要求的重量范围是1.902.10kg/只 每次送100只鸭子,要求的重量范围是1.962.04kg/只 每次送400只鸭子,要求的重量范围是1.982.02kg/只,2.2 未知时, 的置信区间,所以 的 1的置信区间为,或写成,例3,晚稻良种汕优63的千粒重027.5g。现育成一高产品种协优辐819,在9个小区种植,得其千粒重为:32.5, 28.6, 28.4, 24.7, 29.1, 27.2, 29.8, 33.3, 29.7(g)(1)(原来的问题)试问新育成品种的千粒重与汕优63有无显著差异?(2)求置信水平为95的新育成品种千粒重的置信区间?,注意: (a) 置信区间也可以用来进行假设检验。以上述例子为例,因为95的置信区间是(27.266, 31.244),它包含了零假设中待检验的27.5,所以我们没有理由拒绝 H0:27.5。,(b) 利用置信区间进行假设检验的基本方法:如果置信区间包含了H0中的数值,则不拒绝H0;如果置信区间不包含H0中的数值,则拒绝H0。,(c) 置信区间和假设检验的结论是一致的。,3. 方差2 和标准差的置信区间,4. 平均数差1 2 的置信区间,自由度为 n1n22的t分布,例4 对两批黄连中小檗碱的含量进行比较,分别随机抽取出4个150g的样品,在同样条件下测定含量为:,(1)(原来的问题)试检验这两批黄连小檗碱含量的总体方差是否有显著差异?,(2)试求两批黄连小檗碱含量差值1 2的95的置信区间,并回答两批黄连小檗碱含量是否有显著差异?(提示:利用求得的置信区间进行假设检验),5. 配对数据的置信区间,参数估计与假设检验的关系,统计的置信区间不同:区间估计通常求的是以样本估计值为中心的双侧置信区间;而假设检验不仅有双侧检验也常常采用单侧检验,视检验的具体问题而定。 统计的方法不同:区间估计立足于大概率,通常以较大的把握程度(置信度)去估计总体参数的置信区间;而假设检验立足于小概率,通常是给定很小的显著性水平去检验对总体参数的原假设是否成立。在假设检验中,人们更重视拒绝域。 统计的基本原理相同:根据样本信息对总体参数进行推断;以 抽样分布为理论依据;建立在概率的基础上的推断;推断结果具有一定的可信程度和风险。,