好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

抽样调查的基本概念与理论依据(共58页).ppt

56页
  • 卖家[上传人]:1537****568
  • 文档编号:232167211
  • 上传时间:2021-12-30
  • 文档格式:PPT
  • 文档大小:310KB
  • / 56 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第六章 抽样调查1抽样调查的意义2抽样调查的基本概念和理论依据3抽样平均误差4抽样推断5必要抽样单位数的确定1、抽样调查的意义一、抽样调查的概念、特点(一)、概念: 抽样调查是按照随机原则从全部研究对象中抽取一部分单位进行观察,并依据所获得的数据对全部研究对象的数量特征做出具有一定可靠性的估计判断,从而达到对全部研究对象的认识的一种统计方法二)、抽样调查的基本特点:根据部分实际资料对全部总体的数量特征做出估计按随机的原则从全部总体中抽取样本单位抽样推断的抽样误差可以事先计算并且加以控制二、抽样调查的作用:对某些不可能进行全面调查而又要了解其全面情况的社会经济现象,必须应用抽样调查对某些社会经济现象虽然可以进行全面调查,但抽样调查可以节约时间、费用,提高调查的时效性抽样调查和全面调查同时进行,可以发挥相互补充和检查质量的作用抽样调查可以用于工业生产过程的质量控制利用抽样调查原理,还可以对某种总体的假设进行检验,来判断这种假设的真伪,以决定行动的取舍2、抽样调查的基本概念及理论依据一、总体与样本(一)、总体与总体指标总体:是根据研究目的确定的所要研究的同类事物的全体总体单位数称为总体容量,一般用N 表示。

      总体指标:用来反映总体数量特征的指标二)、样本与样本指标样本:从总体中抽取的部分总体单位所构成的整体样本所包含的总体单位个数称为样本容量,一般用n表示在实际工作中,人们通常把n30的样本称为大样本,而把 n 30的样本称为小样本样本指标:是根据样本资料计算的、用于估计和推断相应总体指标的综合指标二、概率抽样与非概率抽样 概率抽样:也叫随机抽样,是指按照随机原则抽取样本概率抽样最基本的组织方式有:简单随机抽样、分层抽样、等距抽样和整群抽样 非概率抽样:也叫非随机抽样,是指从研究目的出发,根据调查者的经验或判断,从总体中有意识地抽取若干单位构成样本重点调查、典型调查、配额调查等属于非随机抽样但由于非随机抽样的效果取决于调查者的经验、主观判断和专业知识,故难免掺杂调查者的主观偏见,出现因人而异的结果,且容易产生倾向性误差;此外,非随机抽样不能计算和控制其抽样误差,无法说明调查结果的可靠程度随机原则:就是排除主观意愿的干扰,使总体的每个单位都有一定的概率被抽选为样本单位,每个总体单位能否选入样本是随机的三、抽样框:是包括全部抽样单位的名单框架编制抽样框是实施抽样的基础抽样框的好坏通常会直接影响到抽样的随机性和调查的效果。

      抽样框的主要形式有三种:1、名单抽样框:即列出全部总体单位的名录一览表,如职工名单、企业名单等2、区域抽样框:即按地理位置将总体范围划分为若干小区域,以小区域为抽样单位3、时间表抽样框:即将总体全部单位按时间顺序排列,把总体的时间过程分为若干个小的时间单位,以此时间单位为抽样单位四、抽样误差: 误 差登记性误差代表性误差系统性误差随机性误差登记性误差是指在调查和汇总过程中由于观察、测量、登记、计算等方法的差错或被调查者提供虚假资料而造成的误差任何一种统计调查都可能产生登记性误差代表性误差是指用样本指标推断总体指标时,由于样本结构与总体结构不一致、样本不能完全代表总体而产生的误差系统性误差是指由于非随机因素引起的样本代表性不足而产生的误差,表现为样本估计量的值系统偏低或偏高随机性误差又称偶然性误差,是指遵循随机原则抽样,由于随机因素(偶然性因素)引起的误差抽样估计中的所谓抽样误差,就是指的这种随机误差五、抽样方法和样本可能数目 样本的可能数目既和样本的容量有关,也和抽样的方法有关 根据取样方式的不同,抽样方法有重复抽样和不重复抽样两种1、重复抽样:是指从总体的N个单位中抽取一个容量为n的样本,每次抽出一个单位后,再将其放回总体中参加下一次抽取,这样连续抽n次即得到一个样本。

      2、不重复抽样:是指抽中单位不再放回总体中,下一个样本单位只能从余下的总体单位中抽取重复抽样与不重复抽样的区别:重复抽样:同一总体单位有可能被重复抽中;每个总体单位在每次抽样中被抽中的概率都是相同的抽样误差较大不重复抽样:同一总体单位不可能被重复抽中;由于每次抽取是在不同数目的总体单位中进行,每个总体单位在各次抽样中被抽中的概率不相等抽样误差较小根据对样本的要求不同,抽样方法又有考虑顺序抽样和不考虑顺序抽样两种:1、考虑顺序的抽样:即从总体N 中抽取n个单位构成样本,不但要考虑样本各单位的不同性质,而且还考虑不同性质各单位的中选顺序相同构成成分的单位,由于顺序不同,也作为不同样本2、不考虑顺序的抽样:即从总体N个单位抽取n个单位构成样本只考虑样本各单位的组成成分如何,而不考虑单位的抽样顺序如果样本的成分相同,不论顺序有多大不同,都作为一种样本以上抽样方法的两种分类还存在交叉情况,即有:考虑顺序的不重复抽样数目考虑顺序的重复抽样数目不考虑顺序的不重复抽样数目不考虑顺序的重复抽样数目例如:从4个(N)职工中抽取其中的2个(n)进行调查考虑顺序的重复抽样数目不考虑顺序的不重复抽样数目A=40、B=50、C=70、D=80 考虑顺序的重复组合:AA BA CA DAAB BB CB DBAC BC CC DCAD BD CD DD 不考虑顺序的不重复抽样数目AB BC CDAC BDAD六、抽样调查的理论基础大数法则:关于大量的随机现象具有稳定性质的法则。

      中心极限定理:如果总体变量存在有限的平均数和方差,那么不论这个总体变量的分布如何,随着抽样单位数n的增加,抽样平均数的分布便趋近于正态分布一)、大数法则的意义可以归纳为: 现象的某种总体规律只有当具有这些现象足够多数的单位汇总综合在一起的时候,才能显示出来因此只有从大量现象的总体中,才能研究这些现象的规律性 现象的总体性规律,通常是以平均数的形式表现出来 所研究的现象总体包含的单位愈多,平均数也就越能够正确地反映出这些现象的规律性 各单位的共同倾向(这些表现为主要的、基本的因素)决定着平均数的水平;而单位对平均数的离差(这些表现为次要的、偶然的因素)则由于足够多数单位的汇总综合的结果,而相互抵消,趋于消失联系到抽样推断来看,大数法则证明: 如果随机变量总体存在着有限的平均数和方差,则对于充分大的抽样单位数n,可以几乎趋近于1的概率,来期望抽样平均数与总体平均数的绝对离差为任意小,即对于任意的正数有: 随着抽样单位数n的增加,抽样平均数x有接近总体平均数X的趋势二)、大数法则未解决的问题:抽样平均数与总体平均数的离差究竟有多大?离差不超过一定范围的概率究竟有多少?这个离差的分布怎样? 要解决这些问题,就要依靠中心极限定理。

      在现实生活中,一个随机变量服从于正态分布未必很多,但多个随机变量和的分布趋近于正态分布则普遍存在的 抽样平均数也是一种随机变量和的分布,因此在抽样单位数 n充分大的条件下,抽样平均数也趋近于正态分布,这为抽样误差的概率估计提供了一个极为有效而且方便的条件3 抽样平均误差一、抽样实际误差:二、抽样平均误差:是抽样平均数(或抽样成数)的标准差它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度三、抽样估计的一般原理(一)、抽样估计的特点: 抽样估计是在逻辑上运用归纳推理而不是运用演绎推理 抽样估计是在方法上运用不确定的概率估计法而不是确定的数学分析法 抽样估计的估计结论存在着一定的抽样误差二)、抽样估计的优良标准无偏性:用抽样指标估计总体指标要求抽样指标的平均数等于被估计的总体指标一致性:随着样本的单位数n的无限增大,抽样指标和未知的总体指标之间的绝对离差为任意小的可能性也趋于必然性有效性:用抽样指标估计总体要求作为优良估计量的方差应该比其它估计量的方差小 举例说明抽样平均误差的意义:设有4个工人,各人的工资水平分别是40、50、70、80元,现采用重复抽样方法随机从中抽取2人。

      序号样本变量(x)样本平均数平均数离差离差平方1(A、A)40、4040-204002 (A、B)40、5045-152253 (A、C)40、7055-5254 (A、D)40、8060005 (B、A)50、4045-152256 (B、B)50、5050-101007 (B、C)50、7060008 (B、D)50、80655259 (C、A)70、4055-52510 (C、B)70、50600011 (C、C)70、70701010012 (C、D)70、80751522513 (D、A)80、40600014 (D、B)80、506552515 (D、C)80、70751522516 (D、D)80、808020400合计9602000 举例说明抽样平均误差的意义:设有4个工人,各人的工资水平分别是40、50、70、80元,现采用不重复抽样方法随机从中抽取2人序号样本变量(x)样本平均数平均数离差离差平方1(A、B)40、5045-152252 (A、C)40、7055-5253 (A、D)40、8060004 (B、A)50、4045-152255 (B、C)50、7060006 (B、D)50、80655257 (C、A)70、4055-5258(C、B)70、5060009 (C、D)70、80751522510 (D、A)80、40600011 (D、B)80、506552512 (D、C)80、707515225合计7201000四、抽样平均误差的计算公式:变量总体属性总体当N 很大时,重复抽样与不重复抽样的差别不大!五、影响抽样误差大小的因素是:总体被研究标志的变异程度。

      在其他条件不变的情况下,总体标志的变异程度愈小,则抽样误差也愈小;总体标志的变异程度愈大,则抽样误差也愈大抽样单位数的多少 在其他条件不变的情况下,抽样单位数愈多,抽样误差愈小;抽样单位数愈少,抽样误差愈大抽样的方法 在其他条件不变的情况下,重复抽样的抽样误差大于不重复抽样抽样的组织形式 抽样误差的大小与样本单位数的平方根成反比:如果抽样误差要减少二分之一,则样本单位数必须增大到4倍例:某电子元件厂生产A型号的电子管,现从10000件产品中,抽取100件进行检验,结果是60件合格计算合格品率的抽样平均误差六、抽样极限误差:是抽样指标和总体指标之间抽样误差的可能范围例1、要估计一批优良水稻品种种子的平均千粒重,现在随机从该批种子抽取1市斤,计数12500粒,折合平均每千粒重x=40克,如果确定极限误差范围为8克,这就要求该批种子的平均千粒重落在408克,即在32克到48克之间例2、要估计某农作物幼苗的成活率,从播种这一品种的秧苗地中随机抽取秧苗1000株,其中死苗80株,则秧苗成活率p=1(801000)=92%如果确定极限误差范围为5%,这就要求该农作物成活率p落在92%5%,即在87%至97%之间。

      基于理论上的要求,抽样极限误差通常需要以抽样平均误差为标准单位来衡量,把极限误差除以抽样平均误差,得出相对数 t,表示极限误差范围为抽样平均误差的若干倍 t 称为概率度这一变换称为概率的标准化过程例1、已知种子平均每千粒重量的抽样平均误差为4克,那么就以概率度 t =84=2来表示误差的可能范围即以 来规定误差范围的大小这时就要求该批种子的平均千粒重落在 克之间例2、已知幼苗成活率的抽样平均误差为3%,那么就以概率度t =5%3%=1.67来表示误差的可能范围,即以 来规定误差范围的大小,这时就要求该农作物的成活率p落在 之间 抽样极限误差的估计总是要和一定的概率保证程度联系在一起的因为既然抽样误差是一个随机变量,就不要期望抽样平均数(成数)落在一定区间是一个必然事件,而只是给予一定的概率保证而已 所以在进行抽样估计时,不但要考虑抽样误差的可能范围有多大,而且还必须考虑落在这一范围的概率有多大 前者是估计的准确度问题,后者是估计的可靠性问题,两者密不可分常用的t 值及所对应概率的关系:概率度( t )概率F(t)1。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.