精编制作概率抽样和非概率抽样PPT课件
概率抽样和非概率抽样 好样本必须 1 针对研究的问题2 具有最好的性能价格比 1 概率抽样遵循随机原则进行的抽样 总体中每个单位都有一定的机会被选入样本 排除主观上有意识的抽取调查单位每个单位被抽中的概率是已知或可计算的当用样本对总体目标量进行估计时 要考虑到每个样本单位被抽中的概率 1 简单随机抽样 只适用于总体单位数量有限的情况 否则编号工作繁重 对于复杂的总体 样本的代表性难以保证 不能利用总体的已知信息等 每个样本单位被抽中的概率相等 样本的每个单位完全独立 彼此间无一定的关联性和排斥性 从总体N个单位中任意抽取n个单位作为样本 使每个可能的样本被抽中的概率相等的一种抽样方式 EXCEL产生随机数 用excel提供的统计函数 RAND 可以生成0 1之间的均匀分布随机数 若要生成a与b之间的随机实数 请使用 RAND b a a利用 RANDBETWEEN 函数则可以生成位于任意两个指定数之间的一个随机数 例如 要生成100 150之间的整数方法1 RANDBETWEEN 100 150 方法2 ROUND RAND 50 100 或 INT RAND 50 100 其中INT取整ROUND四舍五入 2 分层抽样 先将总体的单位按某种特征分为若干次级总体 层 然后再从每一层内进行单纯随机抽样 组成一个样本的方法 分组减小了各抽样层变异性的影响 抽样保证了所抽取的样本具有足够的代表性 当总体是由差异明显的几部分组成时 往往选择分层抽样的方法 例如 一个单位的职工有500人 其中不到35岁有125人 35岁至49岁的有280人 50岁以上的有95人 为了了解这个单位职工与身体状况有关的某项指标 要从中抽取一个容量为100的样本 由于职工年龄与这项指标有关 决定采用分层抽样方法进行抽取 因为样本容量与总体的个数的比为1 5 所以在各年龄段抽取的个数依次为125 5 280 5 95 5 即25 56 19 3 整群抽样 优点是实施方便 节省经费 缺点是抽样误差往往大于简单随机抽样 例如 调查中学生患近视眼的情况 抽某一个班做统计 进行产品检验 每隔8h抽1h生产的全部产品进行检验等 4 系统抽样 首先将总体中各单位按一定顺序排列 根据样本容量要求确定抽选间隔 然后随机确定起点 每隔一定的间隔抽取一个单位的一种抽样方式 是纯随机抽样的变种 最主要的优势就是经济性 最大的缺陷在于总体单位的排列上 一些总体单位数可能包含隐蔽的形态或者是 不合格样本 调查者可能疏忽 把它们抽选为样本 先将总体从1 N相继编号 并计算抽样距离K N n 式中N为总体单位总数 n为样本容量 然后在1 K中抽一随机数k1 作为样本的第一个单位 接着取k1 K k1 2K 直至抽够n个单位为止 5 多阶段抽样 2 非概率抽样又称为不等概率抽样或非随机抽样 就是调查者根据自己的方便或主观判断抽取样本的方法虽然根据样本调查的结果也可在一定程度上说明总体的性质 特征 但不能从数量上推断总体 非概率抽样 方便抽样 判断抽样 自愿样本 滚雪球抽样 配额抽样 调查人员本着随意性原则去选择样本的抽样方式两种最常见的方法 街头拦人法 空间抽样法 一般在调查总体中每一个体都是同质时 才能采用此类方法 1 方便抽样 2 判断抽样 根据调查人员的主观经验从总体样本中选择那些被判断为最能代表总体的单位作样本的抽样方法例如 要对安徽省旅游市场状况进行调查 有关部门选择黄山 九华山等旅游风景区做为样本调查 这就是判断抽样 3 自愿样本被调查者自愿参加 成为样本中的一份子 向调查人员提供信息 如 网络调查 先随机选择一些被访者并对其实施访问 再请他们提供另外一些属于所研究目标总体的调查对象 根据所形成的线索选择此后的调查对象在特定总体的成员难以找到时最适合的一种抽样方法 4 滚雪球抽样 5 配额抽样 将调查总体样本按一定标志分类或分层 确定各类 层 单位的样本数额 在配额内任意抽选样本的抽样方式 与分层抽样的区别 分层抽样是按随机原则在层内抽选样本 而配额抽样则是由调查人员在配额内主观判断选定样本 3 概率抽样与非概率抽样的比较 概率抽样 非概率抽样 抽样原则 特点 非随机原则 统计量的分布不确定 无法进行参数估计 操作简便 时效快 成本低 适用于探索性研究 抽样原则 特点 随机原则 可以据以对总体参数进行估计 更精确 技术含量高 调查成本高