
第九章二重抽样.docx
4页第十章 二重抽样第一节 二重抽样综述一、二重抽样的概念二重抽样也称二相抽样其基本做法是:对于一个大总体,先从总体中随机抽取一个较大的样本(第一重样 本),由此估计有关总体的结构或辅助指标以及其他有关信息,为第二重抽样估计提供条件;然后再从第一重样 本中随机抽取一个较小的样本(第二重样本),利用这第二重样本,对总体所研究变量进行抽样推断在某些情况下,也可在第二重样本中再抽第三重、第四重样本,由此形成多重抽样其中二重抽样是最为常 用的二、二重抽样的作用在社会经济抽样调查中,二重抽样的主要作用有下列几方面: 第一,用于从总体所有基本单元中筛选确定出主调查对象第二,用于经常性调查第三,用于了解陌生总 体内在结构或分布的大致情况,为抽样方法和抽样组织形式的选择提供依据第四,为分层抽样推断提供层权资 料第五,为比率估计和回归估计提供辅助资料第六,在经常性的多项目抽样调查中,用于解决不同调查项目 需要不同样本容量的问题第七,用于研究样本轮换中的某些问题第二节 二重分层抽样一、二重分层抽样概述在分层抽样中,我们要求总体各层的层权应事先已知,如果层权未知或不能事先确定,则分层抽样在精度上 的得益可能会在很大程度上被抵消掉,此时,选择二重分层抽样可以较好地解决层权问题。
二重分层抽样是先在总体中随机抽取第一重样本『,对这个样本各单元进行分层后求各层的层权,然后从 第一重样本中用分层随机抽样法抽取第二重样本n用于估计总体指标由于第一重简单随机抽样,第二重分层 抽样,故其误差同二重的抽样都有关二、估计量及其方差总体均值估计量为y = y =乂 w ystD stD h h h=1其中yh=丄 bh n hjh j =1为第一重样本第 h 层均值的无偏估计可以证明y是总体均值r的无偏估计量stD stD 如果第一重样本是随机样本,第二重样本为第一重样本的随机子样本,则估计量的方差为八v(Y)= v(y')+ e [V(y)]stD 1 1 2S 2 n y S2 n '= (1 - ) + 乙 W 2 ( 4 - 1)n' N h n' nh =1 h—1 1) yw s2(1 1)n' N n' vh=1 h其中v(y')为第一重抽样之方差,v(y)为第二重抽样之方差12以各层的样本方差代替各层的总体方差,以样本各层间方差代替总体方差,则可得方差的近似无偏估计量为V(Y )=(丄- 正w(y -y )2 +y w2s2( - )stD n' N h h stD h h n n'h=1 h =1 h h第三节 二重比估计与回归估计一、二重比估计在使用比估计量时,要求作为辅助变量的总体均值或总和应事先已知,但在实际中可能并不掌握关于辅助变 量的资料,此时,就要考虑采用二重比估计的方法。
二重比估计的基本思路是先在总体中抽第一重样本用以估计总体辅助变量指标,再在一重样本中抽第二重样 本按比估计法推断总体调查变量的数值用二重比估计法估计F的一般形式为旷=兰 X' = Rx 'RD y其中R =兰,是总体比率R的有偏估计量,X' = 1兰x,因为R是有偏的,故歹 也为有偏的,但当n充分大时, y n i RDi=1Y为近似无偏的当n‘和n均为简单随机样本时,其方差为RDV(Y ) = V [E (Y )] + E [V (Y )]RD 1 2 RD 1 2 RD沁(--丄)S2 +1 -丄(S2 - 2RS + R2S2)n' N y n n' y xy x=i(S2 -2RS + R2S2)+ 丄(2RS -R2S2)- — S2n y xy x n ' xy x N y当n为n‘的子样本时,方差估计量为2 1 1V(Y ) = (s2 一2Rs + R2s2) + (2Rs 一R2s2)RD n y xy x n' xy x科克伦曾经证明,在n‘与n相互独立,且均为简单随机样本时,方差估计量为仝 1 1八V(Y ) = (s2 一2Rs + R2s2) + R2s2RD n y xy x n' x显然:① 当n‘远大于n时,两种估计之间的差异很小,并且当n是n‘的子样本时的方差比n与n‘相互独立时 的方差要小。
② 二重比估计的结果歹卩和讥歹)都是有偏估计量,但随样本量的增大,这些偏差会减小,故它们是近似无偏RR的,且当n‘较大时,二重比估计的精度比较高③ 当n‘ =N时,二重比估计的估计精度与一般的估计相同但由于n‘ 若n,=n,则二重回归估计的估计效果同简单随 机抽样的相同因为,在一般情况下,回归估计优于简单随机抽样,所以,n,越大,则估计效果越好② 相关系数p对抽样方差影响较大,p越大,抽样方差越小,所以有效地利用辅助变量,对提高抽样估计效 果是很有帮助的③通常二重回归估计的估计精度是低于一般回归估计,原因是二重抽样中,以第一重抽样所估计的X'代替 了总体X,因而使抽样方差增加,故二重回归估计精度总比一般回归估计差但当n,增大时,特别当n'T N, 或者当X' = X时,二重回归估计与一般回归估计精度一致三、二重分层估计、比估计和回归估计的比较1、 在回归估计中,一般要求调查变量与辅助变量之间要有很高的相关关系,并且用于辅助资料的费用很低 实际中,这些条件常常难以满足另外,回归估计的计算过程远比比估计和分层估计要复杂2、 比估计不是无偏的,一般比回归估计有较大的方差3、 如果调查变量与分层变量是线性相关的,则按比例分层的得益与回归估计基本一致此时,使用分层方 法还是回归估计法取决于回归方法的计算量带来的费用和分层方法的分层费用的多少4、 分层抽样常比回归和比率均值有特殊的优越性,特别是在调查变量与辅助变量为非线性关系时,按比例 分层能得到更大的得益;若分层变量不是数值型时,分层方法仍然可以使用,而回归和比估计方法则不能用。 5、 如果辅助变量的总体均值是已知的,则回归和比估计可以在独立于辅助变量的n次抽选的样本上进行, 而在分层抽样中,样本n必须是第一重样本n,的子样本。












