好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

(抽样检验)抽样调查教案系统抽样_.doc

19页
  • 卖家[上传人]:精****库
  • 文档编号:136132788
  • 上传时间:2020-06-24
  • 文档格式:DOC
  • 文档大小:1.02MB
  • / 19 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 抽样检验)抽样调查教案系统抽样 第6章系统抽样6.1引言6.1.1定义定义6.1/6.2系统抽样(systematicsampling)又称为等距抽样、机械抽样按照这种抽样方法,从总体中抽取第壹个样本点(随机起点),然后按某种固定的顺序和规律依次抽取其余的样本点,最终构成样本这种抽样被称为系统抽样是因为这种抽样的第壹个样本点虽然随机,但其余样本点的抽取见起来好像不再随机,因而是系统的牵壹发而动全身”比如要对居民用户抽样,可按户口册每隔多少户抽壹户;工厂为检查产品质量,在连续的生产线上每隔20分钟抽选壹个或若干个样品进行检查;农业上为估计农作物产量或病虫危害,对壹大片农田每隔壹定距离抽取壹块进行实际测量或调查,等等本章只作简单方法介绍更多内容参见文献2、文献36.1.2系统抽样的壹般方法定义6.3直线等距抽样假设总体单元数为,样本容量为,为的整数倍把总体单元排列成壹直线先计算出系统抽样间隔,(当不是的整数倍时,可令k等于最接近的整数)然后在第壹阶段1~k个单元中随机抽取壹个单元,假设为r,然后每隔k个单元抽取壹个单元,即分别为:r+k,r+2k,…….,直至抽取了n个单元抽取的样本编号为:r+(j-1)k(j=1,2,…,n)。

      12…r……kk+1k+2…k+r……2k2k+12k+2…2k+r……3k…………………k k k k+r 2k+r (n-1)k+rrk(k为抽取间隔)例如某学院有200个学生,要抽取10个学生作为样本首先计算=20,然后在1~20中随机抽取壹个数字,假设抽中排列中第3位的学生,则其它入样单元依次为23,43,63,83,103,123,143,163,183定义6.4圆形等距抽样(Lahiri)这种方法主要适用于不为整数时因为当k不为整数,取其最接近的整数时,实际样本容量可能和n相差1,而且每个单元入样的概率不等,这时用直线等距抽样可能产生偏倚例:设总体N=10,其标志值分别为,总体均值为若要求样本容量为n=3,采用直线等距抽样,验证样本均值是否为总体均值的无偏估计?解:先计算间距=10/3=3.33….,取k=3,在1~3中取壹个随机起点,然后每隔3个单元抽取1个单元可得下列的可能样本:三个可能的系统抽样样本均值分别为:,,所有=,因此样本均值不是总体均值的无偏估计在这种情况下,样本均值将不等于总体均值,因而估计不是无偏的。

      为了使得样本均值是总体均值无偏估计,将个总体单元排成首尾相接的壹个圆抽样间距k取最接近的整数,从1——中随机抽取壹个随机起点作为起始单元,然后每隔k个抽取壹个,直到抽取n个为止如果序号大于时,将其减去得到的在1——中的号码入选正是因为排列为圆形而非直线且随机起点在1~N中而非在1~[k](或[k]+1)中,导致了该抽样下的每个样本严格等概率地被抽中,因而估计是无偏的若是圆形等距抽样,则在1~10中抽取壹个随机起点,假设为7,然后每隔3个单元取壹个,它们的序号是7、10、13事实上是、、入样考虑到实际问题中,n通常比较大(大于等和50),多壹个少壹个且无关宏旨,因此能够不必考虑N/n不是整数的影响,故通常我们都假定N是n的整数倍3不等概率抽样法不等概率抽样中每个单元入样的概率不相等最简单也是最常用的是系统抽样,即入样的概率和单元规模大小成比例的系统抽样令表示所有单元规模大小总和,则(包含概率,见不放回不等概率抽样)在实际中,不等概率的实施常采用代码法如下所示:先将单元规模(不失壹般性,设其为整数)值累加,欲从总体中抽取容量为n的样本,取最接近的整数k为抽样间距,从[1,k]中随机抽取壹个整数r作为起点,则代码r,r+k,…,r+(n-1)k所对应的单元入样。

      例7.1设总体由10个行政村组成,N=10,每个行政村人数为,见表7.1利用系统抽样抽取n=3个行政村样本表7.1用系统抽样抽取行政村行政村编号人数累计人数抽中号码12345678910合计103432962468473205168146317187010353563187796110341239140715531870100*723*1346*,从1~623中抽取壹整数,例如是,则,,所对应的行政村入样,其序号分别为1、4、8这种方法,当所有单元规模时,每个单元不可能重复,是壹种不重复抽样;当时(超过抽样间隔),第i个单元为必然被抽中单元,且有可能重复抽中;当,第i个单元为必然被重复抽中实际中应尽量避免这种重复抽中现象壹种简单的方法就是把这种大规模单元作为必然调查单元,不再列入抽样总体,另壹种方法是将大规模单元划分为几个小规模单元6.1.3总体单元排序1按无关标志排序,如调查学生视力,按学号排列,显然视力和学号没有关系2按有关标志排序调查身高时,按入校体检的身高顺序排列3介于之上俩者之间6.1.4系统抽样的优缺点优点:系统抽样是实际中常用的壹种抽样方法,1其简单易行,只要确定起点和间距,便于推广2便于利用已知信息,系统抽样的误差大小和总体单元的排列顺序有关,因此当对总体的结构有壹定的认识了解,且有相关的标志能够利用时,能够运用已知的信息先对总体单元进行排列,再采用系统抽样,就能提高系统抽样的效率。

      但缺点也很明显:1方差复杂,难以估计2如果单元排列存在周期性,而抽样者缺乏对此了解,则很容易抽取出的样本代表性很差例如,要调查70路每天的客流量,采用系统抽样,每周取壹天,即每隔7天抽取壹次不管取了星期壹到星期五,仍是星期六到星期日中的哪天作为起点,样本代表性都很差6.1.5系统抽样和整群抽样和分层抽样的关系系统抽样能够见作特殊的整群抽样和分层抽样表6-1系统抽样的总体单元123…j…n行平均123rk列平均………………见下表6-1,如果将每壹行单元视为壹个群,则总体由k个群组成,每个群规模大小都为n系统抽样从,,…,中任选壹个,被选中的单元所在行的所有单元就构成系统抽样的样本显然每个群都是可能的样本因此系统抽样能够见成从k个群中随机抽取1个群的整群抽样同样将每壹列视为壹层,则总体由n个层组成,每个层大小都为k系统抽样能够见作从每个层中抽取壹个单元的分层抽样,但由于样本单元在各层位置相同,因此系统抽样不同和分层抽样表6-2系统抽样总体单元重新编号12…j…n群平均12rk层平均……………6.2等概率系统抽样估计量为讨论方便,今后总是设6.2.1符号说明第r行第j列单元指标,对照表6-2换个排序方式有总体单元数N;样本单元数n总体方差总体(群)均值,(每行均值)样本(群)均值,系统样本均值,总体层均值,,或,(每列均值)6.2.2估计量假设起始点为r,则相应的系统样本的平均值为,(6.1)(群内普查)取系统样本平均值作为总体均值的估计量,即:=(6.2)(由于群内普查)定理6.1当,有k个可能样本,因此是无偏估计。

      6.9)(方差定义)定理6.2用系统样本(群)内方差表示为系统样本(群)内方差(类似整群抽样中的定义)因为系统抽样相当于抽取壹个群的整群抽样,因此群内的单元差异大小,也即系统样本内的差异大小会直接影响系统抽样的效果,故定义了系统样本(群)内方差,它反映了所有k个可能系统样本内的方差大小因此能够想象,和整群抽样壹样,系统样本内方差愈大,抽样效率愈高注意此习惯叙述,(大写)本该表示总体,由于群内普查,这里的特殊性在于所谓的“系统样本”实际是表6-2中行表示的总体群6.10)证明:(交叉项为0)俩边同除以,根据方差定义和定义,得到#如果直接用简单随机抽样,则,作差:,于是对于固定总体,总体方差是唯壹固定的,因此系统样本内方差越大,系统抽样精度越高故为了提高系统抽样的精度,总体单元的排列应尽可能增大样本(群)内方差,使得群内基本单元样本差异比较大定理6.3系统抽样能够见作特殊整群抽样,其方差可用样本(群)内相关系数表示其中系统样本(群)内相关系数(系统样本内各单位俩俩之间的相关系数)为(类似4.9)证明:总体单元数群内单元数总体群数样本群数总体均值估计量群内相关系数系统抽样整群抽样NNMnMkN1n、、由整群抽样,(P141,4.11)。

      #由定理6.3见出,系统样本(群)内正相关性越大,即样本(群)内单元越相似,则估计量方差越大,系统抽样精度越差,这和定理6.2结论壹致定理6.4系统抽样可见成特殊的分层抽样,其方差能够用层内方差和表示定义:总体层内方差总体(层)内相关系数:同壹系统样本内对层均值离差的相关系数,系统样本内各单元俩俩之间分别和各自层的平均数相比较而计算的相关系数『对于固定的群,俩个不同单元离差乘积共有个组合,所以总体这样的离差乘积有个,因此上式分子为分母应为对个基本单元的对所在层的层均值离差平方求平均,因此能够表示为,于是』证明:由表6.2能够见出,系统抽样能够见作壹种特殊的分层抽样,共n层,每层均为k个单元(规模相等),从每层固定同壹位置各取1个单元作为样本而根据(6.9),俩边同乘以,有=+,因此公式成立#比较系统抽样方差和比例分配的分层随机抽样方差(即),作商:,因此,从前面的系统抽样排列的方阵见出,如果按有关标志排列后采用直线等距抽样,系统样本中的单位往往会同时大于所在各层的均值,或同时小于所在各层的均值,造成;因而需考虑适当的改进抽样方式,使得尽可能满足例设某个模拟总体有N=32个单元,总体单元排列显然有稳定上升趋势。

      我们要抽取壹个容量为4的等距样本将总体单元排列如下表7.4,k=8,n=4每壹列是壹个等距样本,共有8个等距样本表层ⅠⅡⅢⅣ等距样本编号层均值3.7511.521.87532.25层内方差1234567817172718182838203031120314122434514243461625367162738群均值1313.7515.2416.2515.519.2520.752214.34375能够见出,层内正相关,前四个样本对各层均值离差均小于0,后4个样本和各层均值离差均大于0,所以(同壹层内俩不同单元离差乘积,累积),因此系统抽样精度要低于分层抽样有:=2.516例利用上例,将第二层和第四层观察值调换,见表表层ⅠⅡⅢⅣ等距样本编号层均值3.7511.521.87532.25层内方差123456781161738116183631420343122034411。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.