好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

常见概率抽样方式解析与综述.doc

9页
  • 卖家[上传人]:gg****m
  • 文档编号:225547806
  • 上传时间:2021-12-17
  • 文档格式:DOC
  • 文档大小:71.13KB
  • / 9 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 常见概率抽样方式解析与综述概率抽样是按照概率原理进行的,它要求样本的抽取具有随机性前面已经 提到,概率抽样有若干种不同的形式,每一种具体的形式有着各自不同的特点 而在研究中对不同抽样方式的选择将涉及研究问题的性质、完善的抽样框的获 得、研究经费的多少、样本精确性的要求,以及资料的收集方法等因素下面我 们就结合这些因素,对几种基木的概率抽样方法逐一进行介绍一、简单随机抽样简单随机抽样(simple random sampling)又称纯随机抽样,是概率抽样的最 基木形式它是按等概率原则直接从含有N个元素的总体中随机抽取n个元素组 成样本(N>】】)常用的办法类似于抽签,即把总体的每一个单位都编号,将这些 号码写在一张张小纸条上,然后放入一容器(如纸盒、口袋)中,搅拌均匀后, 从中任意抽取,直到抽够预定的样木数目这样,由抽中的号码所代表的元素组 成的就是一个简单随机样木比如,某系共有学生300人,系学生会打算采用简单随机抽样的办法,从中 抽取出60人进行调查为了保证抽样的科学性,他们先从系办公室得到一份全 系学生的名单,然后给名单中的每个学生都编上一个号(从001到300)抽样框 编好后,他们又用300张小纸条分别写上001, 002, ・・・,300o他们把这300张 写好不同号码的小纸条放在一个盒子里,搅乱后,随便摸出60张小纸条。

      然后, 他们按这60张小纸条上的号码找到总体名单上所对应的60位同学这60位同 学就构成了他们本次的样本这种方法简便易学但当总体元素很多时,写号码 的工作量就很大,搅拌均匀也不容易,因而此法往往在总体元素较少时使用对于总体元素很多的情形,我们则采用随机数表来抽样木书后就附有一张 随机数表,表中的数码和排列都是随机形成的,没有任何规律性(故也称为乱数 表)利用随机数表进行抽样的具体步骤是:(1)先取得一份总体所有元素的名单(即抽样框);(3) 根据总体规模是几位数来确定从随机数表中选几位数码;(4) 以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;(5) 根据样本规模的要求选择出足够的数码个数;(6) 依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素按上述步骤选择出来的元素的集合,就是所需要的样本举例来说,某总体 共3 000人(四位数),需要从中抽取100人作为样本进行调查首先,我们要得 到一份总体成员的名单;然后对总体中的每一个人从1到3000进行编号;再根 据总体的规模,确定从随机数表中选择四位数具体的选法是从随机数表的任意 一行和任意一列的某一个四位数开始,按照从上到下的顺序,或者从左到右的顺 序,以3 000为标准,对随机数表中依次出现的每个四位数进行取舍:凡小于或 等于3 000的数码就选出来,凡大于3 000的数码以及已经选出的数码则不要, 直到选够100个数码为止;最后按照所抽取的数码,从总体名单中找到它们所对 应的100个成员。

      这100个成员就构成一个随机样本表6—2就是对3 000人 的总体进行抽样时,我们采用随机数表对四位数码进行取舍的例子(采用后四位 数,并按从上往下的顺序)表6—2随机数表抽样例随机数表中的数码选用的数 码不选用的原因 843299090609061053873020 后而四位数大于 300094274100410041013902250725079361404310 后 而四位 数大于 30001359866042 后而四位数大于 3 000632191268326839420582507 与所选的第 三个数码重复27256511761176如果采用前四位数字,仍按从上往下的顺序,那么从表6-2中我们又可以 抽取出1 053、0 139、1 359、2 725这四个号码;如果取中间的四位数字,所 得到的则是2 990、1 404、1 912和0 582这四个号码了二、系统抽样系统抽样(systematic sampling)又称等距抽样或间隔抽样它是把总体的 单位进行编号排序后,再计算岀某种间隔,然后按这一固定的间隔抽取个体的号 码来组成样本的方法它和简单随机抽样一样,需要有完整的抽样框,样本的抽 取也是直接从总体中抽取个体,而无其他中间环节。

      系统抽样的具体步骤是:(1) 给总体中的每一个个体按顺序编号,即制定出抽样框2) 计算出抽样间距计算方法是用总体的规模除以样本的规模假设总体 规模为N,样本规模为门,那么抽样间距K就由下列公式求得:K (抽样间距)=N (总体规模)n (样本规模)(3) 在最前而的K个个体中,采用简单随机抽样的方法抽取一个个体,记下 这个个体的编号(假设所抽取的这个个体的编号为A),它称做随机的起点4) 在抽样框中,自A开始,每隔K个个体抽取一个个体,即所抽取个体的编 号分别为 A, A+K, A+2K,…,A+(n-l)Ko(5) 将这n个个体合起来,就构成了该总体的一个样本例如,要在某大学总共3 000名学生中,抽取一个容量为100的大学生样本 我们先将3 000名学生的名单依次编上号码,然后按上述公式可求得抽样间距为:K = 3 000 / 100 = 30即每隔30人抽一名为此,我们先在1〜30的数码中,采用简单随机抽样 的方法抽取一个数字,假如抽到的是12,那么就以12为第一个号码,每隔30 名再抽一个这样,我们便可得到12, 42, 72,…,2 982总共100个号码我 们再根据这100个号码,从总体名单中——对应地找岀100名学生,这100名学 生就构成本次的一个样本。

      从上而的过程中我们不难看出,系统抽样较之于简单随机抽样来说,显然简 便易行多了,尤其是当总体及样本的规模都较大时更是如此这也正是社会研究 较少采用简单随机抽样而较多采用系统抽样的原因值得注意的是,系统抽样的一个十分重要的前提条件,是总体中个体的排列, 相对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布; 否则,系统抽样的结果将会产生极大的偏差因此,我们在使用系统抽样方法时, 一定要注意抽样框的编制方法特别要注意下列两种情况:一是总体名单中,个体的排列具有某种次序上的先后、等级上的高低的情况 比如,我们要抽取若干家庭的样本进行消费状况调查而家庭户的名单是按每个 家庭总收入的多少由高到低顺序排列的这样,如果有两个研究者都采取系统抽 样的方法从这个总体中进行抽样,假设捕样间距为40, —个抽到的随机起点号 较靠前为3;而另一个抽到的随机起点号较靠后为38那么,从前一个研究者所 抽样本中算出的家庭平均收入,一定大大高于后者所抽样本中算出的家庭平均收 入因为第一个样本中的每一个家庭都要比第二个样本中的每一个家庭在收入等 级中靠前35个位置,即前者中的每一个家庭都比后者中的每一个家庭在总收入 上高出35户家庭。

      如果我们事先注意到这种情况,就可以采用抽取中间位置, 即20号的方法二是总体名单中,个体的排列上有与抽样间隔相对应的周期性分布的情况 比如,前而关于大学生一例中,我们计算出间距为30o如果此时总体名单是按 教学班排列、每班也是30个左右的学生,并且每班的名单都是按学生学习成绩 高低排列,或是按班干部、一般学生、较差学生的顺序排列的那么,当所抽的 随机起点号靠前时,样本就由各班上成绩优秀的学生组成,或是全由各班的班干 部组成;而当所抽的初始号靠得较后时,样本就会由各班中成绩较差的学生或是 各方而表现较差的学生组成显然,无论是哪种情况,都不符合总体的全而情况, 都是一个有着严重偏差的样本此时,就应打乱原来的总体排列顺序,比如按姓 氏拼音顺序进行排列三、分层抽样分层抽样的概念分层抽样(stratified sampling)又称类型抽样,它是先将总体中的所有单 位按某种特征或标志(如性别、年龄、职业或地域等)划分成若干类型或层次;然 后再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取一个子样本; 最后,将这些子样本合起来构成总体的样本例如,在一个企业抽取职工样本时, 我们可以先把职工总体分为工人、干部和技术人员三大类;然后,采用简单随机 抽样或系统抽样的方法,分别从这三类职工中抽取三个子样本;最后,将这三个 子样本合起来构成全体职工的样本。

      分层抽样的优点分层抽样方法的一个优点,就是在不增加样本规模的前提下降低抽样误差, 提高抽样的精度前而我们曾经指出,总体的同质性程度越高,样本就越容易反 映和代表总体的特征和而貌;而总体的异质性程度越高,样本对总体的反映和代 表就越困难,对抽样的要求也越高采用分层抽样的最基本冃的,正在于把异质 性较强的总体分成一个个同质性较强的子总体,以便提高抽样的效率,达到更好 的抽样效果用统计的语言来说,通过分层,使得各层内元素之间的变异程度变 小,各个层内的方差变小(比总体的方差要小),因而在样本规模相同时,分层抽 样的抽样误差往往比简单随机抽样的抽样误差要小分层抽样方法的另一个优点,就是非常便于了解总体内不同层次的情况,以 及对总体中不同的层次进行单独研允,或者进行比较比如,在《中国妇女社会 地位调查》中,研究者为了能分析比较城乡差别,提高抽样精度,并能保证城市 分析具有足够的样本容量,他们采取了各个省在省内进一步按城乡分域(实际上 是作为研究域的层),分别进行抽样的做法,并使城乡两域的样本规模相等这 表明,该调查采用的是不按比例的分层抽样方式分层抽样的运用在实际运用分层抽样的方法时,研究者需要考虑下列两个方而的问题。

      1)分层的标准问题同一个总体可以按照不同的标准进行分层,或者说, 根据不同的标准可以将一个总体分成不同的类别或层次那么,在实际抽样中究 竟应该按什么标准来分层呢?通常采用的原则有:第一,以所要分析和研究的主要变量或相关的变量作为分层的标准比如, 若要研究居民的消费状况和消费趋向,可以以居民家庭人均收入作为分层标准; 又如,要了解社会研究中不同职业的人员对社会经济改革的看法,就可以以人们 的职业作为分层的标准第二,以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的 变量作为分层变量比如在工厂进行,可以以工作性质作为分层标准,将全厂职 工分为干部、工人、技术人员、勤杂人员等几类来进行抽样第三,以那些已有明显层次区分的变量作为分层变量比如在社会研究中, 性别、年龄(当然是分段以后,如老、中、青)、文化程度、职业等等,就经常被 用作分层的标准;其他如学生按年级、专业、学校类型分层,城市按人口规模分 层等等2)分层的比例问题分层抽样中有按比例和不按比例分层两种方法按比 例分层抽样是指按总体中各种类型或层次的比例来抽取子样本的方法即在单位 多的类型或层次中所抽的子样本就大一些,在单位少的类型或层次中所抽的子样 本就小一些。

      比如,某厂有工人600人,按性别分层则有男工500人,女工100 人总体中两类工人人数的比例为5: lo因此,若要抽60人作样本,那么,按 比例的抽法就是根据上述比例,分别从500名男工中随机抽取50人,而从100 名女工中随机抽取10人这样,样本中男女工人之比与总体中男女工人之比完 全相同,均为5: lo可以说,样本的性别结构是总体中性别结构的一种缩影采取按比例分层抽样的方法,可以确保得到一个在某种特征上与总体结构完 全一样的样本但是,在有些情况下,又不宜采用这种方法例如,有时总体中 有的类型或层次的单位数冃太少,若以按比例分层的方法抽样,则有的层次在样 本中个案太少,不便于了解各个层次的情况,这时往往要采取不按比例抽样的方 法比如上例中,样本中女工人数过少,此时我们可以采取不按比例抽样的方法, 在500名男工中抽30人,在100名女工中也抽30人这样,样本就能较好地反 映出男女两类工人的一般状况,我们也能很好地对男女两。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.