好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

数据搜集与整理下.ppt

23页
  • 卖家[上传人]:工****
  • 文档编号:605355042
  • 上传时间:2025-05-20
  • 文档格式:PPT
  • 文档大小:228.50KB
  • / 23 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,,第二章 数据搜集与整理(下),统计搜集到的大量资料是分散的,不系统,,的,只能说明各个单位的特征和属性,必须,,按照科学的原则加以,整理,,使之,条理化和系,,统化,,成为便于储存和传递的、反映总体特,,征的数据统计数据的整理,,统计数据的展示,排序,统计分组,频数分布编制,统计表,统计图,,(一) 统计数据的整理,,,排序,就是把定量数据按从大到小或从小到大的顺序排列,,,把定性数据按习惯的文字顺序排列,便于我们研究其,,条理统计分组,对于定性数据就是依据属性的不同将数据划分成若干组,对于定量数据就是依据属性数值的不同将数据划分成若干组☆组内同质性,组间差异性,,频数分布表的编制,,,,,,,,,,,,,,,,,,,,,,,频率f/∑f,频数f,分组,x,,编制频数分布表的步骤,编制频数分布表的步骤,确定组数,编制表格,计算频数,确定组距,,频数分布表的编制,,(实例),【例1】,某生产车间,50,名工人日加工零件数如下(单位:个)试采用单变量值对数据进行分组,117 122 124 129 139 107 117 130 122 125,,108 131 125 117 122 133 126 122 118 108,,110 118 123 126 133 134 127 123 118 112,,112 134 127 123 119 113 120 123 127 135,,137 114 120 128 124 115 139 128 124 121,,,分组方法,分组方法,等距分组,异距分组,单变量值分组,组距分组,,单变量值分组,,(要点),将一个变量值作为一组,,适合于离散变量,,适合于变量值较少的情况,,,单变量值分组表,(实例),表2,-4 某车间50名工人日加工零件数分组表,,,,,,零件数,,(个),频数,,(人),零件数,,(个),频数,,(人),零件数,,(个),频数,,(人),107,,108,,110,,112,,113,,114,,115,,117,,118,1,,2,,1,,2,,1,,1,,1,,3,,3,119,,120,,121,,122,,123,,124,,125,,126,,127,1,,2,,1,,4,,4,,3,,2,,2,,3,128,,129,,130,,131,,133,,134,,135,,137,,139,2,,1,,1,,1,,2,,2,,1,,1,,2,,组距分组,(要点),将变量值的一个区间作为一组,,适合于连续变量,,适合于变量值较多的情况,,必须遵循“不重不漏”的原则,,可采用等距分组,也可采用不等距分组,,,~ ,,~ ,,~ ,,~ ,,~ ,,组距分组,(几个概念),下 限:,一个组的最小值,,上 限:,一个组的最大值,,组 距:,上限与下限之差,,组中值:,下限与上限之间的中点值,,下限值,+上限值,2,组中值=,,组距分组,(步骤),确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。

      在实际分组时,可以按,Sturges,,提出的经验公式来确定组数,K,,,,确定各组的组距:组距,(,Class Width),是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即,,,组距=,(,最大值,-,最小值),÷,组数,,,根据分组整理成频数分布表,,,,,等距分组表,,表2,-5 某车间50名工人日加工零件数分组表,,,按零件数分组,频数(人),频率(,%),105,~,110,,110,~,115,,115,~,120,,120,~,125,,125,~,130,,130,~,135,,135,~,140,3,,5,,8,,14,,10,,6,,4,6,,10,,16,,28,,20,,12,,8,合计,50,100,,(上下组限重叠),,等距分组表,,表2,-6 某车间50名工人日加工零件数分组表,,,按零件数分组,频数(人),频率(,%),105,~,109,,110,~,114,,115,~,119,,120,~,124,,125,~,129,,130,~,134,,135,~,139,3,,5,,8,,14,,10,,6,,4,6,,10,,16,,28,,20,,12,,8,合计,50,100,,(上下组限间断),,等距分组表,,,表2,-7 某车间50名工人日加工零件数分组表,,,按零件数分组,频数(人),频率(,%),110,以下,,110,~,114,,115,~,119,,120,~,124,,125,~,129,,130,~,134,,135,以上,3,,5,,8,,14,,10,,6,,4,6,,10,,16,,28,,20,,12,,8,合计,50,100,(使用开口组),,组距分组与不等距分组,,(在表现频数分布上的差异),等距分组,,各组频数的分布不受组距大小的影响,,可直接根据绝对频数来观察频数分布的特征和规律,,不等距分组,,各组频数的分布受组距大小不同的影响,,各组绝对频数的多少不能反映频数分布的实际状况,,需要用频数密度(频数密度=频数,/,组距)反映频数分布的实际状况,,,(二)统计数据的展示,,,当统计数据比较多时,就应该制作表格或者图形进行来展示,使数据的重要特性能从表格或者图形,中直观地,反映出来,这样可提高分析数据和解释数据的,效率,。

      统计表,是把统计数据用表格的形式展示出来类型,:,按作用分,调查表,按数据,所属的时间,分,截面数据表,,时间序列表,,汇总整理表,计算分析表,,,统计表的结构,表1,2004~2005年城镇居民家庭抽样调查资料,,,,项目,单位,2004年,2005年,一、调查户数,,二、平均每户家庭人口数,,三、平均每户就业人口数,,四、平均每人全部收入,,五、平均每人实际支出,,#消费性支出,,非消费性支出,,六、平均每人居住面积,户,,人,,人,,元,,元,,元,,元,,平方米,,37890 3.19 1.83 5188.54 4945.87 4185.64 755.94 11.90,,39080,,3.16,,1.80,,5458.34,,5322.95,,4331.61,,987.17,,12.40,资料来源:,《中国统计摘要2006》,中国统计出版社,2006,第79页注:1.本表为城市和县城的城镇居民家庭抽样调查材料2.消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗,,保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务。

      行标题,表头,列标题,数字资料,附加,,要合理安排统计表的结构,,总标题内容应满足,3,W,要求,,数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明,,表中的上下两条横线一般用粗线,其他线用细线,,通常情况下,统计表的左右两边不封口,,表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一,,对于没有数字的表格单元,一般用“,—”,表示,,必要时可在表的下方加上注释,统计表的设计,,统计图,统计图形通常可比统计表格更生动地描述数据类型,:,饼图,是以整个圆的360度代表全部数据的总和,按照各类组所占的百分比(频率),把一个“饼”切割为各个扇形适用于定性数据,2003年合肥GDP按产业分组,,条形图,中,每一分类组表示成一个条,条,,的长度代表了这个组中所含数据的频数或,,频率适用于定性数据,2003,年合肥市GDP按产业分的条形图,,直方图,与条形图相似,是在每个分组区间上绘制一个长条形而产生的图形,它可以用来描述已表示成频数或频率的数据适用于定,量,数据,对于异距数列,以组距为宽,,,以频数密度为高来,绘制,直方图折线图,可以在直方图基础上,将每个长方形的顶端中点用折线连接而成,或用组中值与频数(或频率)求坐标点连接而成,。

      根据表2-6的直方图绘制的折线图,,。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.