电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

贾俊平版统计学第四版第二章数据的搜集

73页
  • 卖家[上传人]:n****
  • 文档编号:88911430
  • 上传时间:2019-05-13
  • 文档格式:PPT
  • 文档大小:533.50KB
  • / 73 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、第 2 章 数据的搜集,第 2 章 数据的搜集,2.1 数据的来源 2.2 调查数据 2.3 实验数据 2.4 数据的误差,学习目标,数据的来源 搜集数据的调查方法 问卷设计 搜集数据的实验方法 数据的误差 数据的质量要求,2.1 数据的来源,2.1.1 数据的间接来源 2.1.2 数据的直接来源,系统外部的数据,1、统计部门和政府部门公布的有关资料,如各类统计年鉴 2、各类经济信息中心、信息咨询机构、专业调查机构等提供的数据 3、各类专业期刊、报纸、书籍所提供的资料 4、各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料 5、从互联网或图书馆查阅到的相关资料,系统内部的数据,1、业务资料,如与业务经营活动有关的各种单据,记录 2、经营活动过程中的各种统计报表 3、各种财务,会计核算和分析资料等,二手数据的特点,1、搜集容易,采集成本低 2、作用广泛 分析所要研究的问题 提供研究问题的背景 帮助研究者更好地定义问题 检验和回答某些疑问和假设 寻找研究问题的思路和途径 搜集二手资料在研究中应优先考虑,二手数据的评估,数据是谁搜集的? 可信度评估 为什么目的而搜集的?

      2、 数据是怎样搜集的? 什么时候搜集的?,数据的直接来源 (原始数据),1、调查数据 通过调查方法获得的数据 通常是对社会现象而言 通常取自有限总体 2、实验数据 通过实验方法得到的数据 通常是对自然现象而言 也被广泛运用到社会科学中 如心理学、教育学、社会学、经济学、管理学等,2.2 调查数据,2.2.1 概率抽样与非概率抽样 2.2.2 搜集数据的基本方法,概率抽样 (probability sampling),也称随机抽样 特点 按一定的概率以随机原则抽取样本 抽取样本时使每个单位都有一定的机会被抽中 每个单位被抽中的概率是已知的,或是可以计算出来的 当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率,经常采用的方法(满足公平性)? 1、抽签法(抓阄法) 先将总体中的所有个体(共N个)编号(号码可以从1到N),并把号码写在形状、大小相同的号签上( 号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1 个号签,连续抽取n次,就得到一个容量为n的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。,简单随

      3、机抽样经常采用方法,抽签法的步骤,1、把总体中的N个个体编号; 2、把号码写在号签上,将号签放在一个容器中搅拌均匀; 3、每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。 例子:选修课抽签、福利彩票等。 特点:抽签法简便易行,当总体的个体数不多时,适宜采用这种方法。,为了了解高一(1)班50名同学的视力情况,从中抽取10名同学进行检查。,(2)如何抽取呢?,请问:,实 例 一,(1)此例中总体、个体、样本、样本容量分别是什么?,开始,抽签法,50名同学从1到50编号,制作1到50个号签,将50个号签搅拌均匀,随机从中抽出10个签,对号码一致的学生检查,结束,抽签法的一般步骤:,(1)将总体中的N个个体编号;,(2)将这N个号码写在形状、大小相 同的号签上;,(3)将号签放在同一箱中,并搅拌均匀;,(4)从箱中每次抽出1个号签,连续抽出n次;,(5)将总体中与抽到的号签编号一致的K个个体取出。,(总体个数N,样本容量n),抽签法的一般步骤:,(1)将总体中的N个个体编号;,(2)将这N个号码写在形状、大小相 同的号签上;,(3)将号签放在同一箱中,并搅拌均匀;,(4)从箱中

      4、每次抽出1个号签,连续抽出n次;,(5)将总体中与抽到的号签编号一致的k个个体取出。,(总体个数N,样本容量n),开始,编号,制签,搅匀,抽签,取出个体,结束,2、直接抽选法,直接抽选法,即从总体中直接随机抽选样本。如从货架商品中随机抽取若干商品进行检验;从农贸市场摊位中随意选择若干摊位进行调查或访问等。,3、随机数表法,随机数表是由0、1、29这10个数字组成的数表,并且表中的每一位置出现各个数字的可能性相同。有scilab命令生成随机数表。 (1)随机数表是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的。 (2)用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码。 (3)用随机数表抽取样本,可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的。 (4)由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的。,举例说明如何用随机数表来抽取样本,为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,在利用随机数表抽取这个样本时,可以按下面的步骤进行: 第一步,先将40件

      5、产品编号,可以编为00,01,02,38,39。 第二步,在附录1随机数表中任选一个数作为开始,例如从第8行第5列的数59开始,为便于说明,我们将附录1中的第6行至第10行摘录如下。,16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28,第三步,从选定的数59开始向右读下去,得到一个两位数字号码59,由

      6、于5939,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34。至此,10个样本号码已经取满,于是,所要抽取的样本号码是 16 19 10 12 07 39 38 33 21 34,注 将总体中的N个个体编号时可以从0开始,例如N100时编号可以是00,01,02, 99,这样总体中的所有个体均可用两位数字号码表示,便于运用随机数表。 当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。 在上面每两位、每两位地读数过程中,得到一串两位数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。由于随机数表中每个位置上出现哪一个数字是等概率的,每次读到哪一个两位数字号码,即从总体中抽到哪一个个体的号码也是等概率的。因而利用随机数表抽取样本保证了各个个体被抽取的概率相等。,简单随机抽样应用,简单随机抽样(Simple random sampling)是其它抽样方法的基础,因为它在理论

      7、上最容易处理,而且当总体单位数N不太大时,实施起来并不困难。但在实际中,若N相当大时,简单随机抽样就不是很容易办到的。首先它要求有一个包含全部N个单位的抽样框;其次用这种抽样得到的样本单位较为分散,调查不容易实施。因此,在实际中直接采用简单随机抽样的并不多。,分层抽样 (stratified sampling),将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本 优点 保证样本的结构与总体的结构比较相近,从而提高估计的精度 组织实施调查方便 既可以对总体参数进行估计,也可以对各层的目标量进行估计,分层随机抽样案例,某地区有三种地形:平原、丘陵和山区,粮食产量统计中需要采用抽样调查的方式进行。由于三种地形地貌的粮食单产差异较大,因此若采用简单随机抽样,可能使调查结果与实际情况相差甚远。比如抽中的多是平原地区,有可能调查数值远远高于实际产量;而抽中的多是山区,有可能调查数值远远低于实际产量。为消除上述可能的偏差,先将该地区分为平原、丘陵、山区三组,然后在每个组内按简单随机抽样的方法抽取调查地块,构成样本。,整群抽样 (cluster sampling),将总

      8、体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查 特点 抽样时只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用,方便调查的实施 缺点是估计的精度较差,在了解某地区职工的家庭生活状况时,按居民委员会分群,一个居民委员会为一群,对抽中的居民委员会所辖每户职工家庭一一进行调查。,整群抽样案例,系统抽样 (systematic sampling),将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位 先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位 优点:操作简便,可提高估计的精度 缺点:对估计量方差的估计比较困难,系统抽样案例,某小区居住着4000户居民,为调查居民食盐摄入量,需抽取40户居民进行调查,平均每100户抽取1户。为此,调查机构到当地派出所,根据户籍资料将居民户从14000编号号码,先在1100号中随机抽取1个号码,再将这个号码加上100的整数倍,共40户构成样本。比如在第一组中抽取了5号,于是5、105、205、380

      9、5、3905共40户被抽取出来作为样本。,多阶段抽样 (multi-stage sampling),先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查 二阶抽样中群是初级抽样单位,第二阶段抽取的是最终抽样单位。将该方法推广,使抽样的阶段数增多,就称为多阶段抽样 具有整群抽样的优点,保证样本相对集中,节约调查费用 需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开 在大规模的抽样调查中,是经常被采用的方法,多阶段抽样案例,1、调查某市城镇居民生活水平状况 第一阶段抽样抽出小的地理小区,第二阶段再从被抽中的小区内抽选住所,然后进行调查。 2、对我国的农产量进行抽样调查 抽样方法是:先由省抽县,由抽中的县内再抽乡、村,由抽中的乡、村抽地块,最后才由抽中的地块再抽样本单位。,3、在全国范围内抽样调查各家庭消费洗涤剂类产品的情况。这种全国性的抽样,我们可以从31个省级群体抽取部分一段群体,从部分省级群(一段群体)中分别抽取部分区、县级群体作为二段群体;从抽中的区、县级群体(二段群体)中抽取部分乡镇或街区作为三段群体;从三段群体中抽取部分村庄或居委会作为四段群体;最后从四段群体中抽取要求的家庭户组成最后的样本。这就是一种从大群中抽小群的典型的多阶段整群抽样。,多阶段抽样案例,非概率抽样 (non-probability sampling),相对于概率抽样而言 抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查 有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式,方便抽样,调查过程中由调查员依据方便的原则,自行确定入抽样本的单位 调查员在街头、公园、商店等公共场所进行拦截调查 厂家在出售产品柜台前对路过顾客进行的调查 优点:容易实施,调查的成本低 缺点:样本单位的确定带有随意性,样本无法代表有明确定义的总体,调查结果不宜推断总体,方便抽样,这种方法有时可以与探索性设计结合,用于探索性或实验性调研,这样可以以最低费用迅速地获取所需的近似估计值。另一方面,方便抽样在调研的预检测阶段也有应用价值。在预检阶段,可以进行方便抽样,预检一下人们对问卷中问题的反应和理解程度,并发现问题,进而为改进问卷设计提

      《贾俊平版统计学第四版第二章数据的搜集》由会员n****分享,可在线阅读,更多相关《贾俊平版统计学第四版第二章数据的搜集》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结 2022年家长会心得体会集合15篇
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.