
[参考实用]常见的随机抽样方法介绍.docx
9页抽样方法介绍朱一军福建省产品质量检验研究院一、随机方法选择及随机数产生按照GB/T10111-20XX《随机数的产生及其在产品质量抽样检验中的应用程序》的要求,并根据受检单位的产品堆放形式、基数(批量)大小,确定抽样方法(通常包括简单随机抽样、分层随机抽样、系统抽样、整群抽样、全数抽样五种方法)随机数一般可使用随机数表、骰子或扑克牌中任选一种方式产生一)简单随机抽样(抽签法、随机样数表法)常常用于总体个数较少时,它的主要特征是从总体中逐个抽取;优点:操作简便易行缺点:总体过大不易实行1.定义:—般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nWN),如果每次抽取式总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样2. 简单随机抽样方法(1)抽签法一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本抽签法简单易行,适用于总体中的个数不多时当总体中的个体数较多时,将总体“搅拌均匀”就比较困难,用抽签法产生的样本代表性差的可能性很大)(2)随机数法随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样。
二)分层抽样(StratifiedRandomSampling)主要特征分层按比例抽样,主要使用于总体中的个体有明显差异共同点:每个个体被抽到的概率都相等N/M定义一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样(stratifiedsampling)三)系统抽样当总体中的个体数较多时,采用简单随机抽样显得较为费事这时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样步骤:—般地,假设要从容量为N的总体中抽取容量为n的样本,我们可以按下列步骤进行系统抽样:(1)先将总体的N个个体编号2)确定分段间隔k,对编号进行分段当N/n(n是样本容量)是整数时,取k=N/n;(3)在第一段用简单随机抽样确定第一个个体编号l(l 是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小整群抽样的优缺点:整群抽样的优点是实施方便、节省经费;整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样整群抽样的实施步骤:先将总体分为i个群,然后从i个群钟随即抽取若干个群,对这些群内所有个体或单元均进行调查抽样过程可分为以下几个步骤:一、确定分群的标注二、总体(N)分成若干个互不重叠的部分,每个部分为一群三、据各样本量,确定应该抽取的群数四、采用简单随机抽样或系统抽样方法,从i群中抽取确定的群数例如,调查中学生患近视眼的情况,抽某一个班做统计;进行产品检验;每隔8h抽1h生产的全部产品进行检验等整群抽样与分层抽样在形式上有相似之处,但实际上差别很大分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大;分层抽样的样本是从每个层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取二、常见的简单随机抽样方法介绍1.1随机数表简介随机数表是一组由0到9数字组成的表,每个数字都有相同的概率出现在每个位置上。 附录A提供了五张50x50的随机数表(见表A.1~表A.5)如表A.1不敷使用也可选择其他合适的随机数表1.2获得随机数R0的方法a)确定随机数表号与初始点:首先在第一张表上随机指定一点,以它为起点依次向右读取5个数字,第一个数字若小于5,则取该数加1作为选定的随机数表号,若第一个数字大于或等于5,则取该数减4之差作为选定的随机数表号第2~3位和4~5位组成两个两位数,若两位数小于50,则加上1,若两位数大于或等于50,则减去49,最后所得的数表示初始点所在的行数和列数b)获得R0的方法:从初始点依次向下读取所需m位数得到所需的随机数R在读取过程中,若读到该页的最后一行则转到第一行依次读取后m列,若最后剩下的几列不足m列则从下一号表的第一列开始依次补上1.3读取样本单元编号Ra)如获得的随机数R0 一般取M=2x10m-i25x10m-i,3X10m-1或5X10m-1o设R0=K2M+R2,其中K2=[R0/M],则当(K2+1)M>10m时,舍弃并重新生成随机数R0;当(K2+1)M<10m时则R=R2(若0vR2 2产生随机数R0的方法2.1确定骰子个数根据总体大小或批量N选定m个彀子,如表1所示表1总体大小或批量N与骰子个数m的对应关系N的范围m1MNM10111MNM10021O1MNM10OO310O1MNM10O00410001MNM10000O510OOO1MNM10OOO006当m>6或个别骰子丢失、损坏时,可通过重复摇骰子的方法获得随机数R0例如,可用一个骰子摇m次来代替m个骰子摇一次规定第一次摇骰子所得数字为随机数的最高数位,摇第二次骰子所得数字为随机数的第二高数位,依此类推2•3读取随机样本单元号R的方法2.3.1方法一如获得的随机数R0 若R0>N,则取一个大于N的适当整数M一般取M=2x10m-i,2.5x10m-i,3x10m-i或5x10m-i设R0=K2M+R2,其中K2=[R0/M],则当(K2+1)M>10m“时,舍弃并重新生成随机数R0;当(K2+1)M40m时,则R=R2(若0vR2 注:在生成随机数的过程中,每次必须把抽出的牌放回去,并经过彻底切洗以后才能抽取下一张牌3扑克牌法示例设批量N=90,样本量n=5,试对其进行随机抽样将批中的单位产品按自然数从“1”开始顺序编号到90用扑克牌获得随机数R0并读取样本单元编号Ra)若抽出的第一个随机数R0=23,则取R=R0=23;b)若抽出的第二个随机数R0=08,则取R=Ro=8;c)若抽出的第三个随机数R0=23,则应舍弃重抽;d)若抽出的第三个随机数R0=40,则取R=R0=40;e)若抽出的第四个随机数R0=12,则取R=Ro=12;f)若抽出的第五个随机数R0=85,则取R=R0=85O从批中取出编号为8、12、23、40、85的5个单位产品[重点实用参考文档资料]。
