好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

修改统计学课件第八章抽样调查.ppt

78页
  • 卖家[上传人]:E****
  • 文档编号:90657614
  • 上传时间:2019-06-14
  • 文档格式:PPT
  • 文档大小:1.82MB
  • / 78 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第八章 抽样调查,本 章 重 点,1、抽样平均误差的计算,3、简单随机抽样下总体平均数和总体成数的区间估计,2、影响抽样平均误差的因素,4、必要抽样单位数的确定,一、抽样调查的概念和特点,1、概念:,抽样调查是按随机原则从全部研究对象中抽取部分单位进行观察,并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断只抽取部分单位进行调查§1 抽样调查的一般问题,2、特点,(1) 抽样调查建立在随机取样的基础上2)它是由部分推断整体的一种认识方法3)抽样调查的误差可以事先计算并加以控制3、抽样调查的适用范围,抽样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点1.实际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;,2.虽可进行全面调查观察,但比较困难或并不必要;,3.对普查或全面调查统计资料的质量进行检查和修正;,4.抽样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;,5.利用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍一般适用于以下范围:,三、有关抽样的基本概念,(一)总体和样本,总体:,也称全及总体。

      指所要认识的研究对 象全体总体单位总数用“N”表示样本:,也称抽样总体,是抽出的单位组成的整体样本单位总数用“n”表示二、抽样推断的内容,,参数估计,假设检验,(二)参数和统计量,1、针对总体计算的指标叫总体参数,也叫全及指标2、针对样本计算的指标为统计量,也叫估计量,也叫抽样指标参数的值是定值,常用的参数有:总体平均数、总体成数P、总体标准差σ,其值随样本的不同而不同,是个随机变量抽样估计就是通过统计量的值去估计参数的值常用的统计量有:样本平均数、样本成数p、样本标准差S,若总体单位的某种标志只有两种表现(称为是非标志),总体成数是指具有某种特征和属性的单位在全部总体单位中所占比重,记为p以 代表N个总体单位中具有某种特征的单位数, 代表N 个总体单位中不具有某种特征的单位数,N=N1+N0有,从总体中随机抽出容量为 的样本,具有某种特征的单位数为 ,则样本的成数为 例如,某工厂生产某种电子元件,某批产品共10000件,其中不合格品100件,则不合格品所占的成数 若从中按随机的原则抽100件,其中有3件不合格品,则样本的成数为 NEXT,,,未分组数据:,分组数据:,未分组数据:,分组数据:,总体方差公式,总体标准差公式,,,,,,,,推断统计:利用样本统计量对总体某些性质或数量特征进行推断。

      随机原则,总体,样本,总体参数,统计量,,,,,推断估计,参数估计,,,,,检验,,,假设检验,,,抽样分布,(三)样本容量和样本个数,1、样本容量:,一个样本包含的单位数用 “n”表示一般要求 n ≥30,2、样本个数:,从一个全及总体中可能抽取的样本数目四)重复抽样和不重复抽样,1、重复抽样:也叫放回抽样2、不重复抽样:也叫无放回抽样一个单位可能中选多次,每次抽单位,概率固定,都为1/N一个单位最多中选一次,每次抽单位,概率不同,逐渐增加,(五) 、概率抽样与非概率抽样,1、概率抽样:也叫随机抽样,是指按照随机原则抽取样本概率抽样最基本的组织方式有:简单随机抽样、分层抽样、等距抽样和整群抽样 2、非概率抽样:也叫非随机抽样,是指从研究目的出发,根据调查者的经验或判断,从总体中有意识地抽取若干单位构成样本重点调查、典型调查、配额调查等属于非随机抽样六)、抽样框 1、抽样框是包括全部抽样单位的名单框架编制抽样框是实施抽样的基础抽样框的好坏通常会直接影响到抽样调查的随机性和调查的效果2、抽样框主要有三种形式: ⑴ 名单抽样框,即列出全部总体单位的名录一览表,如职工名单、企业名单等⑵ 区域抽样框,即按地理位置将总体范围划分为若干小区域,以小区域为抽样单位。

      如对某市居民住房情况进行调查,将全市居民户划分为若干街道或片区3、一个理想的抽样框应该与目标总体一致,即应包括全部总体单位,既不重复,也不遗漏(穷尽与互斥)若有遗漏,易造成系统性误差在实践中,要取得与目标总体完全一致的抽样框往往很困难,甚至不可能,常常只能采用与目标总体近似的抽样框⑶ 时间表抽样框,即将总体全部单位按时间顺序排列,把总体的时间过程分为若干个小的时间单位,以此时间单位为抽样单位如对流水线上24小时内生产的产品进行质量抽查时,以5分钟为一个抽样单位,可将全部产品分为288个抽样单位并按时间顺序排列七)、抽样误差 统计调查的误差,是指调查所得结果与总体真实值之间的差异在抽样调查中,误差的来源有登记性误差和代表性误差两大类1)登记性误差,指在调查和汇总过程中由于测量、登记、计算等方面的差错或被调查者提供虚假资料而造成的误差它在任何调查中均存在而且调查范围越大,调查单位越多,产生登记性误差的可能性也越大2)代表性误差,指样本推断总体时,由于样本结构与总体结构不一致而产生的误差又分系统误差与随机误差两种② 随机误差也叫偶然误差它是由偶然性因素引起的代表性误差它不可避免,但可计算与控制。

      抽样估计中的抽样误差,就是指这种随机误差在计算抽样误差时,常常假设不存在登记性误差和系统误差,①系统误差是非随机因素引起的误差,它系统性偏高或偏低,也称偏差§2 抽样平均误差,一、抽样误差的概念,1、抽样误差是指由于抽样的随机性而产生的 那一部分代表性误差(随机性误差),不包括 登记性误差,也不包括可能发生的偏差 主要有两种:实际抽样误差,抽样平均误差1)实际抽样误差:指某一样本指标与总体参数之间的离差,例8-2-1: 从1、2、3中抽2个(重复),参数取总体平均数 (等于2),则实际抽样误差如下:,,(2) 抽样平均误差:指样本指标的标准差抽样实际误差是无法知道的,而抽样平均误差可以计算在讨论抽样误差时,通常指抽样平均误差,要计算抽样平均误差,得从抽样分布谈起,二、抽样分布及抽样平均误差的计算,抽样分布是指样本指标的概率分布,由样本指标的可能取值与之相应的频数或频率组成对于抽样分布,可计算其均值和方差等来反映该分布的中心和离散趋势一)抽样分布的集中趋势与离中趋势的测定,A、样本平均数的抽样分布的集中趋势与离中趋势的测定,1、把所有可能样本的平均数及其相应的频数或频率排列起来,就是样本平均数的抽样分布。

      通常计算这一分布的均值和标准差,分别反映样本平均数分布的集中趋势与离中趋势2、例8-2-2: 从4、6、8三个数中按重复抽样抽2个,调查其平均数,形成的抽样分布如下:,平均数:,计算该分布的平均数和标准差,得,标准差:,而总体平均数和标准差分别为:,所以,可得以下两点结论:(重复),①样本平均数的平均数等于总体平均数②抽样平均数的标准差仅为总体标准差的,3、 样本平均数的标准差即是平均数的抽样平均误差,,,,,,,在实际中,不可能一一列举所有可能的样本,从而不能按上述方法计算可利用上述第②个结论计算,即:,重复抽样时:,不重复抽样时:,不知道总体方差时如何计算,有若干个方差可选择时,选方差最大者 (注意:对成数而言什么是方差最大?),用同类现象(当前或过去、总体或样本)的方差代替计算,用过去(总体或样本)的方差代替计算,用样本方差代替计算( ),,4、例8-2-3: 用简单重复抽样的方法,从660个工厂中抽取33个工厂调查月产值情况,得资料如下,试求月产值的抽样平均误差解,= 10.76,(万元),B、样本成数的抽样分布的集中趋势与离中趋势的测定,1、把所有可能样本的成数及其相应的频数或频率排列起来,就是样本成数的抽样分布。

      通常计算这一分布的均值和标准差,分别反映样本成数分布的集中趋势与离中趋势2、例8-2-4:从张(男)、王(男)、田(女)三个人中按重复抽样抽2个,调查其男性比重,形成的抽样分布如下,平均数:,计算该分布的平均数和标准差,得,标准差:,而总体成数和标准差分别为:,所以,可得以下两点结论:(重复),①样本成数的平均数等于总体成数②抽样成数的标准差仅为总体成数标准差的,3、 样本成数的标准差即是成数的抽样平均误差,在实际中,不可能一一列举所有可能的样本,从而不能按上述方法计算可利用上述第②个结论计算,即:,,,,,,,,重复抽样时:,不重复抽样时:,当总体成数未知时,可用4种方法取得:,样本资料、历史资料、小规模调查资料、估计资料,4、例6-2-5:一批8瓦的日光灯管80000只,从中抽取400只检验,发现有12只不合格,试求合格率的抽样平均误差解: 样本合格率,重复抽样时:,不重复抽样时:,= 0.853%,= 0.85%,当总体单位数相对于样本单位很大时(即抽样比例n/N很小)时,修正系数接近于1,重复抽样与不重复抽样的抽样误差相差很小因此,从无限总体中抽样时,无论采用重复还是不重复抽样方法,都可用重复抽样的抽样平均误差公式来度量抽样误差;对于有限总体,实际中当抽样比例很小时(一般认为小于5%),不重复抽样的抽样误差也常常采用重复抽样的公式来计算。

      二)影响抽样平均误差的因素,1、总体方差或标准差总体各单位在被研究变量上的差异程度差异越大,误差越大2、 样本容量n的大小抽取的单位数越多,误差越小3、抽样方法重复抽样的误差大于不重复抽样的误差当一个总体给定后,总体各单位在被研究变量上的差异程度也随之确定所以在选定抽样方式和方法后,要缩小抽样平均误差,必须保证足够多的样本容量n,4、抽样组织的方式,2、抽样平均数极限误差:,抽样成数极限误差:,§3 总体指标的推断,一、抽样极限误差,1、样本指标与总体指标之差的绝对值的最大值为抽样极限误差,3、一般通过抽样平均误差计算抽样极限误差,t叫概率度, 一个概率度对应一个概率保证程度F(t),可通过查正态分布表得到对应的t与F(t),常用的t 值及所对应概率的关系:,,4、例8-3-1:设成人身高的达标值为165厘米从一批成年人中随机抽7人,得身高分别为155、160、165、170、175、180、185(厘米)要求:⑴以95.45%的概率保证度求平均身高的极限误差; ⑵以99.73%的概率保证度求身高达标率的极限误差解:⑴,= 170,F(t)= 95.45%,,则t= 2,所以,,(厘米),(厘米),厘米,,⑵,= 17.07%,所以,,F(t)= 99.73%,,则t= 3,,,二、总体指标的推断方法,1、点估计,从总体中抽取一个样本,根据该样本的观察值对总体的未知参数作出一个数值点的估计。

      点估计没有给出估计值与未知总体参数的误差范围,也不能指出估计的把握程度 点估计的方法常用的有矩估计法、最大似然法等,,,优良估计量的评价准则 对于同一总体参数,用不同的估计方法可以得到不同的估计值,哪一个估计量最优?客观上提出一个对估计量进行评价的问题 常用的评价标准:具有“无偏性”、“有效性”、“一致性”的估计量是最优估计量无偏性:抽样分布的均值等于总体均值,有效性:如果与其他任何无偏估计量相比,样本均值更接近总体均值,我们就称样本均值是个更有效的估计量一致性:随着样本容量的增加,样本均值与总体均值之间的差异缩小,三、区间估计,区间估计就是根据样本指标和抽样极限误差以一定把握程度推断总体指标的区间范围在一定概率保证程度下:,≤,≤,≤,≤,2、区间估计的三要素为:,估计值,抽样误差范围,概率保证程度,,,应用区间估计时要注意: (1)所求出的区间只是一个可能范围,而不是一个完全肯定的范围 (2)所估计的区间大小(估计的精确度)是与概率保证程度紧密联系的抽样估计时,我们总是希望估计的误差尽可能小(即估计精度尽可能高)并且估计的。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.