第6章《统计学原理》.ppt
30页统计学原理统计学原理 华东交通大学经济管理学院华东交通大学经济管理学院 P P159159 第六章第六章 参数估计参数估计6.1 6.1 参数估计的概念及点估计参数估计的概念及点估计6.2 6.2 参数区间估计参数区间估计6.3 6.3 样本容量的确定样本容量的确定6.1.1 参数估计的概念(一)参数估计的定义和种类n 由于总体参数具有未知性、唯一性,而必须用具有可知性、非唯一性的样本统计量来对总体参数进行估计,这就是参数估计n 估计例子:新时装、居民的购买力、药品疗效n 参数估计有两种基本形式:点估计和区间估计点估计:又称定值估计,就是用一个样本统计量的具体数值来作为总体参数的估计值区间估计:用一个具有上限和下限的区间范围来估计总体参数,即认为总体参数包括在此区间范围内6.1 参数估计的概念及点估计6.1.2 参数的点估计n 点估计的方法有很多,如矩估计、顺序统计量法、最大似然法、最小二乘法等n 一般主要使用矩估计法,其它方法不作要求不作要求!n 所谓矩估计法简单来说就是用我们计算得到的样本平均数、样本方差和样本成数的具体数值作为总体平均数、总体方差和总体成数的估计值比如:6.1.3 评价估计的标准n可用来估计参数的样本统计量可能有多个,这时判断最优的估计量的标准有三个:1、无偏性:估计量的数学期望等于待估计参数的真值,即: 如:2、有效性:该统计量的方差最小,即3、一致性:当样本容量越来越大时,估计量接近被估计参数的概率为1。
即统计学原理统计学原理 华东交通大学经济管理学院华东交通大学经济管理学院 P P163163 n 点估计只能给出总体参数的具体数值,但无法给出估计值的可靠性有多大,区间估计可弥补这一点n 区间估计以 和 分布作为总体参数 区间估计的下限和上限,同时要求该区间将 包含在内的概率应达到一定程度即n 式中被 和 框定的区间叫做置信区间n 叫做抽样极限误差或抽样允许误差,它反映可允许的抽样估计误差的最大范围,它决定了置信区间的大小比如“允许误差等于20的时候、”6.2 参数的区间估计统计学原理统计学原理 华东交通大学经济管理学院华东交通大学经济管理学院 P P166166 n 置信区间是以估计量为基础来构造的,由于估计量是随机变量,所以置信区间的位置也是随机的这样在多次抽样当中,有的置信区间会包含 ,而有的则不会n 把置信区间能够包含 的概率叫做置信度,即上式中的1-,它代表了区间估计的可靠程度或可信度n 置信度1-的含义:如果做了多次抽样(如100次),大概有1-次找到的区间包含真值,有次找到的区间不包括真值所以称为显著性水平,它代表区间估计犯错的概率大小n 如1-=95%时,抽取了1000个样本,根据每一个样本均构造了一个置信区间,由1000个样本构造的总体参数的1000个置信区间中,有95%的区间包含了总体参数的真值,而5%的置信区间则没有包含。
这里,95%这个值被称为置信水平(或置信度)一个重要的结论:n 所谓精度要求就是估计误差必须控制在一定的范围之内极限误差为允许误差的最大值,与估计精度之间呈反向变化n 所谓可靠性是指估计结果正确的概率保证,可用置信度来表示,而显著性水平则代表了区间估计的不可靠概率n 重要结论:区间估计的精确性(准确性)与可靠性程度之间是矛盾的,是反向变化的n 如果要同时提高精度与可信度,只有扩大样本容量才可能办到在第3节中讨论)证据统计学原理统计学原理 华东交通大学经济管理学院华东交通大学经济管理学院 P P166166 【例】 根据前一章的例子从总体5个工人的日工资重置抽样的方法抽取样本容量为2人的样本平均工资的抽样分布如下:(总体平均数为42元)样本日平均工资343638404244464850频率(概率)1/252/253/254/255/254/253/252/251/25求出样本日平均工资落在各种区间的概率P:6.2.1 总体均值的估计n 设随机变量XN(,2),(X1,X2,Xn)是取自X的简单随机样本各个Xi(i=1,2,n)独立,且与X有相同分布,即XiN(,2)下面对总体均值进行估计。
一、总体方差2已知的情况1、点估计2、区间估计n 由上一章可知 为进行区间估计,把 标准化n Z是标准正态变量,在分布的两个尾部各取面积/2,临界值(把截取尾部面积的横坐标点叫做临界值)分别为-Z /2和+ Z /2,那么显然有-Z /2Z /2n 将标准化变量Z带入上式可得到:n 对括号内的不等式进行等价变换后可得到:n 区间估计通常的计算步骤:先给出置信度1-的具体数值,根据这个数值查标准正态分布表求得 值,然后计算置信区间的上下限n 有放回抽样的场合, 总体均值的置信度为1-的区间估计为:n 抽样极限误差为n 不放回抽样的场合,例n 【例6-4】、P167页、已知该厂生产的矩形工艺品的黄金比例X服从正态分布,总体标准差为0.04,试建立该工艺品平均黄金比例值的置信区间,给定置信水平为0.95答:以95%的概率保证、n 【例6-5】某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟试以95%的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为36)答:以95%的概率保证、二、总体方差2未知的情形1、点估计2、区间估计n 由于总体方差2未知,需用总体方差的无偏估计量S2来代替2 。
仍然对 进行标准变换后得到:n 此时,t服从自由度为n-1的t分布何为t分布?)n 在自由度为n-1的t分布的两个尾部各自截取面积/2,查表得到各尾部临界值 ,于是可得到:t分布的唯一参数为自由度v=n-1,当n30时,t分布逐渐逼近正态分布,并可以被正态分布替代所以“附表中、”统计学原理统计学原理 华东交通大学经济管理学院华东交通大学经济管理学院 P P169169n对括号内的不等式进行等价变换后可得到:n有放回抽样的场合,总体均值的置信度为1-的区间估计为:n抽样极限误差为:例n 【例6-6】在例6-4中,将总体方差改为未知,其它条件不变,求平均黄金比例的置信区间答:以95%的概率保证、统计学原理统计学原理 华东交通大学经济管理学院华东交通大学经济管理学院 P P169169n 【例6-7】在例6-5中,假定XN(,2),但总体方差未知,已知样本方差S2=34,试进行区间估计想想:如果改用正态分布,怎么作?Z分布与t分布的选择n只有在下面这一种情况下,我们不得已必须选择t分布来进行区间估计:n总体服从正态分布且总体方差未知且小样本n其它情况下,均可选择Z分布进行区间估计想想:哪些其它情况?统计学原理统计学原理 华东交通大学经济管理学院华东交通大学经济管理学院 P P170170三、两总体均值之差的置信区间(不作要求!)6.2.3 总体成数的估计1、点估计2、区间估计n 由于总体的分布是(0,1)分布,只有在大样本的情况下,才服从正态分布。
总体成数可看成是一种特殊的平均数,类似于总体均值的区间估计,总体成数的区间估计为n 式中的样本比率标准差在有放回抽样中n 在无放回抽样中需多乘以修正因子n 在实践中,由于总体成数P常常未知,所以样本成数标准差公式中的总体成数一般用样本成数代替统计学原理统计学原理 华东交通大学经济管理学院华东交通大学经济管理学院 P P174174n 【例6-11】某企业在一项关于寻找职工流动原因的研究中,研究者从企业前职工的总体中随机抽取了200人组成样本在对他们进行访问时,有140人说他们离开该企业是由于同他们的管理人员不能融洽相处试求由于这种原因离开该企业的人员的真正比例构成95%的置信区间答:以95%的概率保证、【例】在一项新广告活动的跟踪调查中,在被调查的400人中有240人会记起广告的标语试求会记起广告标语占总体比率的95%置信度的估计区间答:以95%的概率保证、二、两个总体成数之差的置信区间(不作要求)6.2.3 总体方差的估计(不做要求)统计学原理统计学原理 华东交通大学经济管理学院华东交通大学经济管理学院 P P1761766.3 样本容量的确定一、问题的提出n参数估计中的精度要求和可靠性要求是一对矛盾。
比如根据 可知,当抽样标准差不变时,极限误差与临界值之间呈同向变化n通过增加样本容量可降低样本平均数的标准差,从而实现既保证一定的估计精度,又具有较高的置信度的目的n这时,就需要考虑在估计精度、置信度既定的前提下,样本容量应该多大才合适?二、估计总体均值时样本容量的确定1、总体方差已知,放回抽样,这时有n 上式两边平方整理后可得2、总体方差已知,不放回抽样时有统计学原理统计学原理 华东交通大学经济管理学院华东交通大学经济管理学院 P P180180n由以上式子可得出以下结论:1)在保证精度和可靠性的前提下,总体方差越大,必要的样本容量越大,即二者呈正比2)在给定的置信水平下,必要的样本容量n 与允许的极限误差2成反比3)必要的样本容量n与可靠性的平方成正比例统计学原理统计学原理 华东交通大学经济管理学院华东交通大学经济管理学院 P P180180【例6-15】一家广告公司想估计某类商店去年所花的平均广告费用,经验表明,总体方差为1800000如置信度95%,并要使估计值处在总体平均值附近500元的范围内,这家广告公司应取多大的样本?答:、统计学原理统计学原理 华东交通大学经济管理学院华东交通大学经济管理学院 P P180180注意:上面的公式计算结果如果带小数,这时样本容量不按四舍五入取整数,取比这个数大的最小整数代替。
三、估计总体成数时样本容量的确定n 采用与推导总体均值的样本容量相类似的方式,可推导出:(1)放回抽样(2)不放回抽样【例6-16】一家市场调研公司想估计某地区有彩电家庭所占的比例该公司希望对P的估计误差不超过0.05,要求可靠程度为95%,应取多大的样本容量? 注意:比率方差在完全缺乏资料的情况下,用成数方差的最大可能值0.25代替答:、本章结束!。





