好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

中级调查分析师(调查概论)考试指南:抽样估计.doc

7页
  • 卖家[上传人]:hs****ma
  • 文档编号:393790540
  • 上传时间:2023-06-16
  • 文档格式:DOC
  • 文档大小:1,008.50KB
  • / 7 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 中级调查分析师《调查概论》考试指南:抽样估计第一节 抽样估计的基本原理一、抽样估计是统计学中参数估计的具体应用抽样估计是根据对样本的观察结果来估计推断总体的某些特征的在抽样调查的抽样估计中它与传统的统计学中的参数估计的区别:1.在传统的统计学中往往假设被研究的总体是个无限总体,建立在可实验观察的基础上,是可以无限进行的而抽样调查在现实中通常是有限总体,而且大都是社会经济现象,无法重复进行2.在传统的统计学中,假定样本观察值是独立同分布的,而抽样调查的观察值通常是在有限总体中不重复抽样,因而观察值之间是不独立的,使得一些抽样方差的计算比较复杂3.参数估计的理论中通常假定总体分布的形态是已知的,从而在理论上比较侧重于讨论小样本的精确分布而抽样调查中研究对象的总体分布是未知的,使用比较多的是大样本情况下估计量的近似分布,即正态分布4.参数估计中讨论的样本,通常是等概率的随机抽样,而抽样调查中往往由于抽样单元的大小不同或分层抽样等原因而实施不等概率抽样和多种方式的抽样最后,传统的参数估计主要是考察抽样误差,而抽样调查除了考察抽样误差外,还要注意非抽样误差二、抽样分布在抽样估计中,要得到总体参数的估计是从样本出发,对样本数据进行必要的加工处理和计算,所得到的结果称为统计量或估计量,用相应的估计量来估计总体参数。

      然而,估计量是一个随机变量,它的具体估计值是随着不同的样本单元而变化的,因而就有一定的分布,这个分布就叫做抽样分布抽样调查主要是根据估计量的抽样分布来对总体进行区间估计三、大数定律和中心极限定理大数定律是用样本估计总体的理论基础其直观含义是随机事件的规律性是在大量观察中才能显露出来,虽然在每次试验中不可避免地出现随机误差,但随着观察次数的增加,随机影响将相互抵消而使规律具有稳定的性质中心极限定理则奠定了样本估计量对总体参数进行区间估计的理论基础其直观含义是不论总体服从什么分布,只要方差有限,在观察值足够多时,许多估计量的分布,就趋向正态分布四、置信区间和置信概率之间的关系若从总体中抽取一个样本,用样本的估计值直接对总体的有关参数作一个数值点的估计,这种估计方法称做点估计区间估计是给出总体参数的一个取值范围,说明这一结论的可靠性置信区间表达了参数的取值范围,而置信概率表达了这一结论的可靠性第二节 加 权设计权数指的是每个样本单元所代表的调查总体的单元数,它由抽样设计所决定以 表示设计权数,其中下标d表示设计的意思设计权数其实就是样本单元的入样概率的倒数一、等概率抽样加权如果所有样本单元的设计权数都相同,那么称这样的抽样设计为自加权设计,这种情况发生在当每个单元都有相同的入样概率的时候,对于自加权的抽样设计,如果没有随后的权数调整,那么在计算诸如总值、均值等估计量时可以将其忽略。

      二、不等概率抽样设计的加权当采用的抽样方法不是等概率抽样时,正确的使用权数就显得尤为重要三、对无回答的权数调整无回答是指由于某些原因,从抽中的样本单元无法获得所需要的信息它可以是样本单元没有提供或者没有完全提供所需的信息,也可以是提供的信息中有一部分无法使用无回答有两种主要类型:单元无回答和项目无回答项目无回答是指被调查者虽然接受了调查,但是仅仅回答了问卷的一部分,因而不能得到某些项目的信息,在这种情况下,最常用的调查方法就是对缺失数据的进行插补单元无回答主要是指一个样本单元所有或几乎所有的数据都缺失处理无回答最简单的办法就是忽略它在一些特殊的情况下对无回答进行调整后所得的均值或比例的估计值,与未作任何调整的估计值相比并没有任何改进然而对总值的估计则不同,此时如果不对无回答进行弥补,则会导致对总值的低估由无回答所导致的这种低估称做无回答偏差如果发现忽略单元无回答是不适当的,最常用的办法是对进行调整当回答单元和无回答单元具有相似的调查指标时,这是一个合理的假定此时无回答的设计权数需在回答单元之间进行重新分配,通常的做法是将一个设计权数乘以一个无回答调整因子,由此得到无回答的调整权数无回答调整因子是原样本单元的权数之和与给出回答的单元的权数之和的比值。

      如果可以假定所有的无回答单元与回答单元具有相似的调查指标,那么可以对所有的回答单元使用相同的无回答调整因子第三节 总体均值、比例及总量的简单估计一、数据类型样本单元可以按某些指标划分成不同的类别,所得的数据就称为分类数据或定性数据如果度量的单位是诸如米或年这种数量形式,就称这样的数据为定量数据定量数据一般是对“多少”或“多大”这样的问题所作的回答二、等概率抽样设计的比例、平均数与总量的估计假设所有回答单元都有相同的最终权数,有一个定量变量(年龄)和两个定性变量(性别和婚姻状况)对两个定性变量取值的编码如下:性别:1=男性;2=女性婚姻状况:1=已婚;2=单身1.对总体或总体中某个域的总量估计总体的估计值为样本总数乘以公共的无回答调整权数:2.如果忽略权数,对总体的比例和平均数的估计如下:总体中男性所占比例的估计值即为样本中男性所占的比例:总体中平均年龄的估计值既是样本的平均年龄:3.对总体中的子组或域的比例和均值的估计:女性总体中单身女性所占比例的估计值,即样本中婚姻状况回答为“单身”的女性在所有女性样本中所占的比例:总体中男性平均年龄的估计值即样本中男性的平均年龄:使用权数,重复上述所作的各项估计:1.对总体或总体中域的总量的估计:总体总人数的估计值为:2.对总体的比例和平均数的估计如下:总体中男性所占比例的估计值为总体中男性总数的估计值与总体总人数的估计值的比值:总体平均年龄的估计值,为总体所有年龄和的估计值与总体人数的估计值的比值(它等于样本平均年龄):三、不等概率抽样设计的比例、平均数与总量的估计在估计过程中,正确使用最终权数不仅对计算不等概率抽样设计的估计值非常重要,而且对于当最终(经调整后的)权数不全相等时,计算自加权设计的估计值也非常重要。

      计算域估计值的一种比较方便的办法是定义一个新的变量,当单元属于该域时,它等于指标的原值,其他情况下则取值为0一些常用的定量数据估计方法也可用于计算定性数据的估计值方法是对定性变量的每一个类别,定义一个特殊变量:当单元属于该类别时取值为l,否则取值为0于是,属于该类别的也即具有相应特征的单元总数的估计,即是对所有回答单元,这个新变量的值与权数的乘积的总和通过这种变换,定性变量与定量变量的估计方法就完全相同第四节 辅助信息的使用使用辅助信息主要有两个原因:(1)为使调查估计值与已知的总体总值,或者从另一调查所得的估计值相匹配2)为了提高估计值的精度若想在估计阶段成功地使用辅助信息,应具备以下三个基本条件:(1)有关总体的外部信息必须是准确的;(2)应收集所有样本的辅助信息;(3)辅助信息与调查变量之间存在相关性一、事后分层如果可能从其他方面获得分层信息,或者抽选样本后可以得到更新、更可靠的分层信息,那么在数据收集后,可以利用数据收集的结果,选用其中合适的变量对收集到的样本进行分层,从而对样本的权数进行调整,这就是通常所说的事后分层 当研究的目标变量与一个已知的辅助变量之间存在相关关系时,采用比率估计方法,也可以用来改进调查的估计量。

      在调查当中,利用这些外部辅助信息的一种常用方法是比率估计方法,或称比估计当使用比率估计时,用一个乘数因子对各类权数进行调整,这个乘数因子就是各类辅助变量值与同类样本的估计值的比率三、更复杂的权数调整:广义回归和校正广义估计方法超出了本书的范围,这里从略第五节 调查估计量的抽样误差估计一、抽样方差及其估计抽样方差的大小取决于以下一些因素:(1)样本量与总体的大小;(2)在总体中所研究指标的变异程度;(3)抽样设计;(4)使用的估计量;(5)调查的无回答情况1.如果其他因素不变,抽样方差的大小一般随样本量的增大而减少2.指标值会随总体单元的不同而变化3.在样本量给定的情况下,抽样方差还依赖于其他一些抽样设计因素4.一些估计量可能比另一些估计量具有更小的变异性5.无回答将使有效的样本量减少,从而导致抽样方差的增加,这是因为样本越小,方差越大总体方差的计算公式如下:二、抽样误差的其他度量估计量的标准差,也称标准误它是抽样方差的平方根,由于它的量纲与估计值相同,故用标准差来衡量误差大小可能更加直观有用变异系数是估计值的标准差与估计值本身之比,通常用百分比来表示当比较不同规模、不同量纲单元的样本估计值的精度时,变异系数非常有用。

      四、复杂抽样设计的方差估计复杂抽样设计的方差估计的一种方法是进行重复抽样也就是使用相同的抽样设计从总体中抽取两个或两个以上的样本,对每一个样本分别构造所感兴趣的总体参数的估计量,然后利用这些估计量与基于全样本之间的离散程度计算抽样方差。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.