
【新编】抽样设计概述.ppt
38页第6章 抽样设计 本章主要内容 抽样设计概述1 概率抽样方式2 非概率抽样方式3 抽样中的误差问题4 样本量的确定5 抽样设计概述1 概率抽样方式2 非概率抽样方式3 抽样中的误差问题4 样本量的确定5 抽样设计概述 一 抽样的作用与特点 抽样的作用 1 解决数据来源 2 进行质量检验 如普查以后的抽样质量检验 抽样设计概述 抽样的特点 1 节省费用 2 调查周期短 时效快 3 有助于提高原始数据质量 v 抽样调查适合于大规模的总体 对规模小的总体进行抽 样 为达到同样精度 一般需要较大比例的样本 从经 济角度考虑就不合算 抽样设计概述 二 抽样中的基本概念 总体 样本 总体参数 样本统计量 抽样框 基本概念基本概念 三 概率抽样与非概率抽样 抽样设计概述 概率抽样 随机原则抽取样本 可以构造置信区间 总体中每个单位 都有机会被抽中 可以用样本统计量对 总体参数进行估计 样本统计量遵循 一定的概率分布 三 概率抽样与非概率抽样 抽样设计概述 非概率抽样 抽取样本不是依据随机原则 不具备用样本统计量对 总体参数进行推断 的理论依据 操作简便 成本低 无法计算抽样误差 样本统计量分布未知 抽样设计概述1 概率抽样方式2 非概率抽样方式3 抽样中的误差问题4 样本量的确定5 概率抽样方式 v五种常用概率抽样方式 分层抽样 整群抽样 简单随机抽样 系统抽样 多阶段抽样 概率抽样方式 一 简单随机抽样 v 无放回简单随机抽样和有放回简单随机抽样两种 无放 回简单随机抽样具有代表意义 v 抽样程序可以通过三种方式实现 抽签法 随机数表法 计算机抽取 概率抽样方式 二 分层抽样 v 先将总体单位分层 在各层中随机抽取样本 v 样本在各层分配可以分为两类 v 分层抽样可以提高估计的效率 不等比例分配 等比例分配 概率抽样方式 三 整群抽样 v 对抽中群中的所有单位进行调查 特点 构造抽样框相对容易 被调查单位分布相对集中 调查成本低 单位之间同质性高 影响估计效率 对特定构造的群 有好的估计效果 概率抽样方式 四 系统抽样 v 将总体单位排列 计算抽样间距 每隔一定距离进行抽 取 v 总体单位排列的类型会影响估计效率 v 主要的排列方式有 按无关标志排列 按有关标志排列 v 当 时 估计量是有偏的 v 若排列存在周期性变化 要选择恰当的抽样间隔 概率抽样方式 五 多阶段抽样 v 通过多个阶段抽到最终接受调查的单元 特点 构造抽样框相对容易 抽样误差大小与抽样阶段多少有关 总抽样误差是各阶段抽样误差的累加 v 抽样设计时尽可能减少抽样阶段 抽样设计概述1 概率抽样方式2 非概率抽样方式3 抽样中的误差问题4 样本量的确定5 非概率抽样方式 一 方便抽样 v 依据方便原则抽取样本 v 适合于探索性研究 非概率抽样方式 二 判断抽样 v 在判断的基础上确定样本 如何判断取决于研究目的 v 不具备用样本调查结果对总体进行推断的依据 非概率抽样方式 三 配额抽样 v 按一定标准划分类别 分配样本数额 v 不需要抽样框 按单一变量控制配额分配表 年龄人数 20 30岁150 30 40岁150 40 50岁100 50岁以上100 合计500 性别人数 男250 女250 合计500 非概率抽样方式 交叉变量控制配额分配表 v 交叉变量配额控制保证样本分布更均匀 更具有代表性 但操作的难度要大 性别 年龄 男女合计 20 30岁7080150 30 40岁7575150 40 50岁5545100 50岁以上5050100 合计250250500 非概率抽样方式 四 自愿样本 v 被调查者自愿填写调查问卷 如网络调查 v 优点 实施方便 调查成本低 v 缺点 容易形成被调查者集中于某类特定群体 对总体缺乏代表 性 可以反映特定群体的信息 但难以对总体进行推断 抽样设计概述1 概率抽样方式2 非概率抽样方式3 抽样中的误差问题4 样本量的确定5 抽样中的误差问题 一 描述误差的一些概念 估计量方差 描述估计精度的重要指标 抽样中的误差问题 一 描述误差的一些概念 偏差 反映估计量的系统性误差 抽样中的误差问题 一 描述误差的一些概念 均方误差 更综合地反映估计误差的情况 抽样中的误差问题 二 抽样误差 v 抽样中的误差可以分为抽样误差和非抽样误差两类 v 抽样误差 由于抽样的随机性造成的误差 定义式 影响因素 总体分布 样本量 抽样方式和估计方式 抽样中的误差问题 三 非抽样误差 v 除抽样误差以外由其他原因引起的误差 v 主要类型 抽样框误差 无回答误差 调查人员误差 受访者误差 抽样设计概述1 概率抽样方式2 非概率抽样方式3 抽样中的误差问题4 样本量的确定5 样本量的确定 一 影响样本量的因素 v 1 调查精度 v 2 总体变异度 v 3 总体规模 v 4 无回答情况 v 5 调查经费情况 样本量的确定 二 确定样本量的方法 v 非概率抽样 样本量确定主要根据经验判断 v 概率抽样 需要在计算的基础上确定 样本量的确定 v三 样本量的计算 无放回简单随机抽样 样本量的计算 有放回简单随机抽样 样本量的确定 v 绝对误差的表达式为 v 其中t为概率度 其数值与 有关 v 由此可以解出样本量计算公式 样本量的确定 v 上式中 为有放回条件下的样本量 既 样本量的确定 v 还可以采用相对误差的要求计算样本量 样本量的确定 v 若采用变异系数 样本量的确定 v 若估计总体比例P 则 v 若使用相对误差要求 则 样本量的确定 v设计效应Deff v 利用设计效应 可以计算复杂抽样设计所需要的样本量 。












