
抽样调查第4章分层抽样课件.pptx
44页4.1 估值法(一)4.2 估值法(二)组合比估计和回归估计4.3 样本量的分配4.4 与简单随机抽样之比较4.5 如何适当分层4.6 后分层估计和定额抽样分层抽样的提法估值法(一)分层抽样的提法u分层抽样的步骤l分层:l抽样:从每层抽取一个样本构成总的样本u采用分层抽样的理由l可同时对子总体进行参数估计 l便于组织实施,可根据各层特点采用不同抽样方式 l可使样本在总体中分布均匀,从而具有更好代表性 l适当分层可提高参数估计的精度 (Stratified sampling)分层抽样的提法u分层抽样的问题l如何分层 l如何确定各层样本量 l如何估值 u记号估 值 法(一)估 值 法(一)估 值 法(一)估 值 法(一)例1 调查某地区居民的奶制品消费支出,以居民户为抽样单元.根据经济收入水平将居民划分为4层,每层抽取样本量为10的简单随机样本,调查数据如下表,试估计该地区居民奶制品的月消费总支出及其置信度为95%的置信区间.例2 对某地区的居民拥有家庭电脑的情况进行调查,以居民为抽样单位,根据收入水平将居民户划分为4层,每层按简单随机抽样抽取10户调查数据如表估计该地区居民拥有家庭电脑的比例及抽样标准误。
估 值 法(一)例3 已知某公司一般职员及高级管理人员刚进入公司时的工资总额分别为5523965元、2541660元,欲通过抽样调查估计当前该公司职员的工资总额Y抽样按照一般职员与高管层进行分层随机抽取一般职员共390人,抽取15人;高管层共84人,抽取10名调查数据如表给出Y的分别比估计量,估计其精度估 值 法(一)练习1 为调查某地区住户的平均家庭成员数,将该地去分为城市和乡村2层,每层按照简单随机抽样抽取10户调查数据如表估计该地区住户的平均家庭成员数及其95%的置信区间估 值 法(一)组合比估计组合回归估计组合比估计 有辅助变量X用于估值分析的,先分别对各层进行简单估计,再用比估值法获得目标指标量的估计u组合比估计的含义组合比估计的含义(Ratio combined)组合比估计定理4.2.1 对分层抽样的组合比估计,有u估值定理估值定理组合比估计例3续:给出Y的组合比估计量,估计其精度,与分别比估计进行比较组合比估计u分别比估计与组合比估计的比较分别比估计与组合比估计的比较分别回归估计u分别回归估计分别回归估计组合回归估计u组合回归估计组合回归估计组合回归估计组合回归估计u分别回归估计与组合回归估计的比较分别回归估计与组合回归估计的比较比估计与回归估计小结uu当当Y Y与与X X高度相关时,采用比估计和回归估计都高度相关时,采用比估计和回归估计都是有效的。
在选择估计方法时,有以下原则:是有效的在选择估计方法时,有以下原则:uu(1 1)由于分别估计(分别比或者分别回归估计)要求各层的样)由于分别估计(分别比或者分别回归估计)要求各层的样本量都比较大,所以当某些层的样本量不够大时,建议采用联合估本量都比较大,所以当某些层的样本量不够大时,建议采用联合估计uu(2 2)当回归系数需要由样本进行估计时,回归估计是有偏的,)当回归系数需要由样本进行估计时,回归估计是有偏的,尤其当样本量较小的时候,采取联合比估计更好尤其当样本量较小的时候,采取联合比估计更好uu(3 3)如果各层的样本量都比较大,每层的比估计或回归估计有)如果各层的样本量都比较大,每层的比估计或回归估计有效,此时用分别比估计,方差更小效,此时用分别比估计,方差更小uu(4 4)如果各层的样本量不大,各层的)如果各层的样本量不大,各层的RiRi差异较小,采用联合估计差异较小,采用联合估计uu(5 5)如果各层的)如果各层的RiRi之间的差别不是太大,而且并不是每层的样本之间的差别不是太大,而且并不是每层的样本量都相当大,采用联合估计量都相当大,采用联合估计uu(6 6)如果各层的回归系数都接近于)如果各层的回归系数都接近于1 1,则可采用差估计。
则可采用差估计例3(续)已知某公司一般职员及高级管理人员刚进入公司时的工资总额分别为5523965元、2541660元,欲通过抽样调查估计当前该公司职员的工资总额Y抽样按照一般职员与高管层进行分层随机抽取一般职员共390人,抽取15人;高管层共84人,抽取10名调查数据如表给出Y的分别回归估计量、联合回归估计以及差估计,同时估计其精度估 值 法(一)等额样本量按比例分配奈曼最优分配考虑费用的最优分配等额样本量各层的样本量相等特点:实施方便,便于管理例1 对各乡收入数据,采用分层抽样,各层采用简单随机抽样,计划抽取8个乡,按照下列样本量分配方式,确定各层的样本量(1)等额分配(2)按比例分配(3)Neyman最优分配按比例分配若总体总值或均值的一个无偏估计量可以表示成样本总值或均值的常数倍,这种估计量称为自加权估计量(proportional allocation)(proportional allocation)适用于Ni已知而其他信息很少的情形奈曼(Neyman)最优分配考虑费用的最优分配例 某市有甲、乙两个地区,现要进行家庭收入的调查令n=500,已知甲地区共有20000户居民,乙地区共有50000户居民;甲地区和乙地区居民收入标准差估计分别为s1=2500,s2=2000;同时对甲地和乙地每户的平均抽样费用之比为2:3,请分别计算出甲地和乙地进行比例分配、一般最优分配(考虑费用因素)以及奈曼最优分配的样本量。
分层抽样的精度层权误差分层抽样的精度=+层 权 误 差例 题 与 练 习3.011.21013109121333.910.7121289131022.011.0131110129111654321jK分层的思路D-H方法分层的思路最小.若采用奈曼最优分配,忽略抽样比,则使最小.D-H 方 法uY的概率密度函数uV的近似表达式D-H 方 法u适当的分层界限为一常数,达到最小值.D-H 方 法例1 以某地区2001年企业出口数据中截取的904个企业构成的总体为例,说明分层的操作程序.练习 表列出了美国13435家银行组成的总体内银行贷款中工业贷款占的百分数的频数分布.将13435家银行分为5层.分层时一般只能调查与Y相关的辅助变量,很少用到Y本身,因而分层界限值无需十分精细用辅助变量分层时,辅助变量引起的误差会使分层过细失去意义,经验表明使用五或六个层是适宜的后分层估计定额抽样后分层估计u后分层估计的背景l要调查某地区居民对某一问题的意向,以年龄为辅助变量分层l要调查某校学生每月的话费支出,以家庭收入水平为辅助变量分层现实有些情况下,缺少层内抽样框,无法实施分层抽样,此时可采用后分层估计u后分层估计的含义 对总体实施不分层简单随机抽样,在调查中明确每个样本单元属于哪个层,将全部单元在调查后按分层变量分入各层,按分层抽样估值后分层估计u估值定理后分层估计的精度低于按比例分层估计的精度,但当n很大时,两者精度差别不大.后分层估计例 某地市对载货汽车进行调查,调查目标量为当月全地市发生的总运量Y.对总共19730辆货车抽取一个178辆车的样本,由于单车运量与车核定标识吨位(X)密切相关,为提高精度,对样本采用后分层,相关数据如表.估计Y及该估计的精度.采用后分层应注意“事后层”数目不宜多.定 额 抽 样u定额抽样的含义l适用于有辅助变量用于分层而按此辅助变量分层抽样不现实的情况l按分层比例抽取样本量:抽样过程中简单随机抽样与典型抽样结合,在调查后阶段,调查人员注意控制样本,使各层样本量到达定额多用于民意测验和市场调查由于带有典型抽样色彩,无法估计其精度实验名称:分层抽样实例实验题:估计某中学学生某次期末考试的平均分,以期中考试成绩为辅助变量将该校学生分为5个层,抽取100个样本,采用后分层估计估值,并给出该估计均方偏差的估计值。
优质精神,全员参与,持续改进,持之以恒10月-2210月-22Saturday,October 1,2022扳紧一颗螺钉,消灭隐患一批04:40:44 04:40:44 04:40 10/1/2022 4:40:44 AM关爱生命,安全发展10月-2204:40:44 04:40 Oct-2201-Oct-22以管理保质量、以质量保进度、以进度求效益04:40:44 04:40:44 04:40 Saturday,October 1,2022塑企业形象,创优质名牌10月-2210月-2204:40:44 04:40:44 October 1,2022安全生产,生产蒸蒸日上,文明建设,建设欣欣向荣2022 年10月1日4:40 上午10月-2210月-22消防安全是幸福的保障,治理隐患保障消防安全01 十月 20224:40:44 上午04:40:44 10月-22坚持一流管理,生产一流产品,提供一泫服务,创建一流企业十月 224:40 上午10月-2204:40 October 1,2022综合治理,保障平安2022/10/1 4:40:4404:40:44 01 October 2022产品若要无缺点,全面品管不可免。
4:40:44 上午4:40 上午04:40:44 10月-22用户是上帝,下道貌岸然工序就是用户10月-2210月-2204:40 04:40:45 04:40:45 Oct-22父母望您遵章守纪、妻儿盼您毫发无损2022/10/1 4:40:45Saturday,October 1,2022自主检验做得好,生产顺畅不得了10月-222022/10/1 4:40:4510月-22谢谢大家!谢谢大家!。












