
[精选]第六章 不等概率抽样.pptx
17页第六章 不等概率抽样,1 概述,一、不等概率抽样的定义和特点,(一)定义: 如果总体中每个单元进入样本的可能性是不相等的,则这种随机抽样方式就称为不等概率随机抽样,简称不等概率抽样二)特点:将总体中每个单元的入样概率与其“规模”大小联系起来,使得“大单元”被抽到的概率大,“小单元”被抽到的概率小二、不等概率抽样的优点和局限性,(一)优点:能够大大提高抽样精度,减少抽样误差二)局限性:必须具有能够说明单元规模大小的辅助变量来确定各个单元的入样概率或包含概率三、不等概率的适用场合:总体单元之间的差异较大四、不等概率抽样分类:,我们最关心也是最重要的情形是抽样容量 n固定时,单元入样的概率(不放回抽样)或每次抽样的概率(有放回抽样)与单元的大小严格成比例这种情况下的有放回抽样称为 抽样不放回抽样称为 抽样2 放回的不等概率抽样,1、多项抽样、 抽样及其实施方法,既然是不等概率抽样,那么就应该在抽样之前给总体中 的每一个单元赋予一定的抽取概率,在放回抽样的每一次抽 取中,设第 个单元入样的概率为 且 ,按此规定有放回地独立抽取 n 次,形成所谓 的多项抽样假设第 个单元在 n次抽样中被抽中 次,则 是一个随机向量,其联合分布为:,这是我们熟悉的多项分布,多项抽样其名正出于此。
7.1),多项分布(7.1)具有如下性质:,倘若单元有一个数值度量其大小,诸如职工人数、工厂产值 商店销售额等,或者感兴趣的调查指标在上一次普查时的数 据也可以作为其单元大小的一种度量记 为第 个单元的 “大小”,并记,多项抽样是最简单的不等概率抽样,它的实施方法通常有两种,以pps抽样为例则可取,此时多项抽样体现了每次抽样时单元的入样概率与单元的大 小成比例,即为pps抽样1)代码法 它适合于 N不太大的情形假定所有的 为整数,倘若在实际中存在 不是整数的话,则可以乘以一个倍数使一切 为整数(对一般的多项抽样,也总可找到整数 ,使一切 成为整数)对于具整数 的第 个单元赋予一个与 相等的代码数,见表71每次抽样前,先在整数 里面随机等可能的选 取一个整数,设为m ,若代码 m 属于第 j个单元拥有的代码 数,则第 j个单元入样整个过程重复 n次,得到 n个单元 入样(当然存在重复的可能性)构成 pps 样本例7.1 设某总体共有N=8个单元,相应 及代码如表所示,若取 n=3,在1203中随机有放回地产生3个随机整数,不 妨设为45、89、101,则第 3 个单元入样一次,第 5 个单 元入样 2 次。
2)Lahiri(拉希里) 方法,2、Hansen-Hurwitz (汉森赫维茨)估计量,若 是按 为入样概率的多项抽样而得的样 本数据,它们相应的 值自然记为 ,则对总 体总和, Hansen-Hurwitz 给出了如下的估计量:,(7.4),且 ,即 是总体总和 的无偏估计7.6),的无偏估计为,(7.7),2 不放回的不等概率抽样,上一节讲述了有放回不等概率抽样,无论从实施上还是从估计计算以及精度估计都显得十分方便但是,一个单元被抽中两次以上总会使样本的代表性打折扣,从而引起抽样误差的增加因此,实际调查工作者一般倾向于使用不放回形式最简单的不放回不等概率抽样方式自然会想到逐一抽样这在第一次抽样时不会发生问题,但在抽第二个样本时面临的情况与有放回时大不相同,余下的 ( N-1 ) 个单元以什么样的概率参与第二次抽样就是个问题;再在抽第三个样本时又面临新问题,如此下去,一是抽样实施的复杂,二是估计量及其方差计算的复杂,因此,在本节仅讨论 n固定,尤其是n=2时的情形同时,我们只对使总体中每个单元的入样概率严格地与其“大小”成比例感兴趣,这就是所谓的 抽样1、包含概率,不放回不等概率抽样中,总体中每个单元被包含到样本的概率,即入样概率 是个重要的概念,而且任意两个单元包含到样本中去的概率 也是个重要的概念,可以想象,估计量的方差等计算会与 有着密切的关系,既然 表示第 个单元在 n个样本中出现的可能性,那么所有 N个单元在样本中出现的可能性之和自然等于 n,这就是 的一个众所周知的性质:,我们所考虑的严格 抽样,既然 与 成比例,若n固定的话,显然有:,(7.8),(7.9),2、HorvitzThompson(霍维茨汤普森)估计量,(7.12),HT估计量与HH估计量是及其相似的。
因为 ,它 们在形式上似乎完全一样,但是HH估计量中的 可以互相 重复,而HT中的 却是绝对地互不相同对于不放回不等概率抽样,关于总体总和 由Horvitz和 Thompson提出如下的估计量:,当 n 固定时,HT估计量的方差为:,(7.13),3、几种严格的不放回 抽样方法,前面已经指出,所谓“严格不放回 ”是指样本容量 n 固定,严格不放回、 的抽样仅介绍n=2的情形1)Brewer(布鲁尔)方法(1963),假设对所有 ,均有 ,现抽取两个样本,最通常的 方法是逐个选取这种抽样方法可以保证每个单元入样概率为:,其中,(2)Durbin(德宾)方法(1967),于是可以计算出,(7.19),(7.18),Durbin方法中的 与Brewer方法中的 完全一样 这表明两种不等概率抽样方法其实是等价的7.20),谢谢观看/欢迎下载,BY FAITH I MEAN A VISION OF GOOD ONE CHERISHES AND THE ENTHUSIASM THAT PUSHES ONE TO SEEK ITS FULFILLMENT REGARDLESS OF OBSTACLES. BY FAITH I BY FAITH,。












