
统计学原理第三章统计整理.ppt
66页1第三章第三章 统计整理统计整理2主要内容主要内容第一节第一节 统计数据整理的概述统计数据整理的概述第二节第二节 统计分组统计分组第三节第三节 分配数列分配数列第四节第四节 统计表和统计图统计表和统计图3• • 一、数据审核(一、数据审核(Data AuditingData Auditing))• • 是指在进行数据整理之前对原始数据的审查是指在进行数据整理之前对原始数据的审查与核对• • 数据整理是按照数据分析的要求进行的,数数据整理是按照数据分析的要求进行的,数据分析的思路和目的决定着数据整理的分类据分析的思路和目的决定着数据整理的分类或分组基于人类认识活动的渐进性,往往或分组基于人类认识活动的渐进性,往往需要采用不同的分组方式对原始数据进行反需要采用不同的分组方式对原始数据进行反复整理,以便得出正确的认识结论复整理,以便得出正确的认识结论第一节第一节 统计数据整理的概述统计数据整理的概述4二、数据审核的内容二、数据审核的内容• • 1 1、时效性的审核、时效性的审核• • 检查是否在规定的调查时间内完成数据的搜检查是否在规定的调查时间内完成数据的搜集工作,采集的数据是否为规定调查时点上集工作,采集的数据是否为规定调查时点上或规定的调查时段内的数量特征,以保证统或规定的调查时段内的数量特征,以保证统 计数据在时间上的准确性和可比性。
计数据在时间上的准确性和可比性 • • 2 2、准确性的审核、准确性的审核• • 检查是否每一调查单位的特征都无偏差、无检查是否每一调查单位的特征都无偏差、无失真、准确无误地记录在登记资料中,抽样失真、准确无误地记录在登记资料中,抽样 调查的误差是否有效地控制在规定的范围内调查的误差是否有效地控制在规定的范围内. .§ 3 3、一致性的审核、一致性的审核 § § 检查统计数据在时间和空间上的连续性和检查统计数据在时间和空间上的连续性和可比性5• • 三、数据审核的方式三、数据审核的方式 • • 1 1、逻辑审核、逻辑审核• • 检查原始数据中各项数据是否合理的数据审检查原始数据中各项数据是否合理的数据审核方式要求检查人员具备较强的逻辑推理核方式要求检查人员具备较强的逻辑推理能力和丰富的专业知识及数据审核经验能力和丰富的专业知识及数据审核经验 • • 2 2、技术审核、技术审核• • 对调查数据原始登记表和其他原始材料进行对调查数据原始登记表和其他原始材料进行机械性核对的数据审核方式由于技术检查机械性核对的数据审核方式由于技术检查 是一种机械性的核对,一般可采用专门的计是一种机械性的核对,一般可采用专门的计 算机软件来实现。
算机软件来实现6四、数据的排序四、数据的排序• • 数据排序数据排序是指将一组数据按照大小、高低、是指将一组数据按照大小、高低、优劣等顺序进行依次排列的过程优劣等顺序进行依次排列的过程• • 数据排序为计算取值范围、最大值、最小值数据排序为计算取值范围、最大值、最小值等总体参数提供了便利,有助于人们了解数等总体参数提供了便利,有助于人们了解数据大致的分布状态数据排序也是有效地进据大致的分布状态数据排序也是有效地进行数据分类或分组的前期准备工作行数据分类或分组的前期准备工作• • 数据排序可以使用计算机软件来实现,数据排序可以使用计算机软件来实现, • • ExcelExcel就具有很强的数据排序功能就具有很强的数据排序功能7第二节第二节 统计分组统计分组• • 一、统计分组的概念一、统计分组的概念• • 统计分组就是根据统计研究的需要,将统计统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干个不同类型总体按照一定的标志区分为若干个不同类型或性质的部分的一种统计方法或性质的部分的一种统计方法• • 统计分组具有两方面含义:统计分组具有两方面含义: • • 对对总体总体而言是而言是“ “分分” ”,即将总体分为,即将总体分为性质相异性质相异的若干部分。
对的若干部分对总体单位总体单位而言则是而言则是“ “合合” ”,即,即将将性质相同性质相同的总体单位组合起来的总体单位组合起来8• • 二、统计分组的作用与原则二、统计分组的作用与原则 • • 1 1、统计分组的作用(、统计分组的作用(P40-42P40-42)) ––划分现象的类型;划分现象的类型; ––揭示现象的内部结构;揭示现象的内部结构;––分析现象之间的内在关系:分析现象之间的内在关系:• • 正依存关系:现象之间成同向变动正依存关系:现象之间成同向变动 • • 负依存关系:现象之间成反向变动负依存关系:现象之间成反向变动 • • 2 2、统计分组的原则、统计分组的原则穷尽原则穷尽原则:组数有限且不宜过多组数有限且不宜过多 互斥原则互斥原则:组间的差异、界限要分明组间的差异、界限要分明9※※三、分组标志的选择三、分组标志的选择• • (一)选择分组标志的原则(一)选择分组标志的原则 P42P42 • • 1.1.目的性原则目的性原则:根据研究问题的目的选择分:根据研究问题的目的选择分 组标志• • 2.2.本质性原则本质性原则:选择最能反映现象本质特征:选择最能反映现象本质特征 的标志分组。
的标志分组 ––例如反映家庭生活水平的因素:总收入?例如反映家庭生活水平的因素:总收入? 平均收入?平均收入? ––研究学生的学习状况:成绩?性别?年龄研究学生的学习状况:成绩?性别?年龄 ?籍贯??籍贯?3.3.具体条件原则具体条件原则:结合现象所处的具体历史:结合现象所处的具体历史 条件或经济条件选择分组标志条件或经济条件选择分组标志10(二)统计分组的种类(二)统计分组的种类• • 1.按1.按分组标志个数分组标志个数不同分为:不同分为: • • 简单分组简单分组与与复合分组复合分组 P44P44标标 志志人数(人人数(人 ))比重比重(( %%)) 按按性别性别分组分组 男性男性 女性女性 按按企业性质企业性质 分组分组国有企业国有企业 独资企业独资企业 其他企业其他企业 按按规模规模分组分组 大型企业大型企业 中型企业中型企业 小型企业小型企业简单分组11工业企业按经营组织形式和规模大小同时进行 分组按经营组织形式分组: 按规模分组:大型企业内资企业 中型企业小型企业大型企业港澳台商投资经营企业 中型企业小型企业大型企业外商投资经营企业 中型企业小型企业复合分组复合分组122 2.按.按分组标志性质分组标志性质不同可分为:不同可分为:品质标志分组品质标志分组和和数量标志分组数量标志分组标标 志志人数(人人数(人 ))比重(比重(% % )) 按按性别性别分组分组男性男性 女性女性 按按产值产值分组分组大型企业大型企业 中型企业中型企业 小型企业小型企业品质标 志分组数量标 志分组13• • 1 1))品质标志分组品质标志分组:对总体:对总体按照品质标志分组按照品质标志分组,如人口按性别分组;企业按所有制、行业,如人口按性别分组;企业按所有制、行业分组等属于简单分组;复杂分组有国家制定分组等属于简单分组;复杂分组有国家制定统一的分类目录。
统一的分类目录P44P44)) • • 2 2))数量标志分组数量标志分组:对总体:对总体按照数量标志分组按照数量标志分组,具体又分为以下两种情况:,具体又分为以下两种情况:• • ①①单项式分组单项式分组:是以一个变量值为一组的分:是以一个变量值为一组的分组方法,只适用于离散型变量的分组组方法,只适用于离散型变量的分组14• • ②②组距式分组组距式分组:是按变量变动的一定区间来:是按变量变动的一定区间来 分组的方法既适用于连续型变量,也适用分组的方法既适用于连续型变量,也适用 于离散型变量具体又分为以下两种情况:于离散型变量具体又分为以下两种情况: • • 等距分组与异距分组等距分组与异距分组:根据变量值变动的均:根据变量值变动的均 匀性来确定均匀变动的变量适合用等距分匀性来确定均匀变动的变量适合用等距分 组,否则应选择异距分组组,否则应选择异距分组 • • 说明说明:离散型变量采用单项式分组还是组距:离散型变量采用单项式分组还是组距式分组主要取决于式分组主要取决于变量值的多少变量值的多少和和变量值变变量值变 动范围的大小动范围的大小,变量值少且变动范围小的用,变量值少且变动范围小的用 单项式分组,反之用组距式分组。
单项式分组,反之用组距式分组15• • 一、分配数列的概念和种类一、分配数列的概念和种类 • • (一)分配数列的概念((一)分配数列的概念(P46P46)) • • 在数据分组的基础上,将总体的所有单位按在数据分组的基础上,将总体的所有单位按 组归类整理,并按一定的顺序排列,形成总组归类整理,并按一定的顺序排列,形成总 体中各个单位在各组间的分布就称为体中各个单位在各组间的分布就称为分配数分配数 列列((次数分布次数分布)分布在各组的总体单位数)分布在各组的总体单位数 叫叫次数次数或或频数频数,各组次数与总次数之比叫,各组次数与总次数之比叫比比 重或频率重或频率※※ 第三节第三节 分配数列分配数列16(二)(二)分配数列的种类分配数列的种类分配 数列 单项式数列组距式数列等距分组异距分组品质分配数列 (品质数列)数量分配数列 (变量数列)17中国中国20052005年人口状况品质分配数列年人口状况品质分配数列按性别分组按性别分组绝对人数(万人绝对人数(万人 ))比重(比重(%%))男男6737567375 51.551.5女女6338163381 48.548.5合合 计计130756130756100.00100.00各组名称各组名称次数或频数次数或频数比率或频率比率或频率(品质分组标志)(品质分组标志品质分组标志)18变量数列变量数列————单项式数列单项式数列 某企业工人平均日产量某企业工人平均日产量(离散变量)(离散变量)按平均日产量分按平均日产量分 组(件)组(件)( (χχ) )工工 人人 数数 绝绝 对对 数数(f)(f)比重比重(%)(f(%)(fi i/ /ΣΣf) f) 1919 2020 2121 2222 23231515 3030 4545 3535 202010.3410.34 20.6920.69 31.0431.04 24.1424.14 13.7913.79 合合 计计145145100.00100.00变量变量次数次数比率或频率比率或频率19变量数列变量数列————等距数列等距数列 某厂工人生产定额完成情况表某厂工人生产定额完成情况表(连续变量)(连续变量)工人按完成生产工人按完成生产 定额分组定额分组(%)((%)(χχ) )工工 人人 数数 绝对数绝对数(f)(f)比重比重(%)(f(%)(fi i/ /ΣΣf)f) 80-9080-90 90-10090-100 100-110100-110 110-120110-120 120-130120-1303030 4040 6060 3030 202016.716.7 22.222.2 33.333.3 16.716.7 11.111.1 合合 计计180180100.0100.0变量变量次数次数比率或频率比率或频率20二、二、单项式数列的编制单项式数列的编制• • 1 1、对变量值排序、对变量值排序• • 通常按照通常按照由小到大由小到大的顺序来排列。
的顺序来排列 例如,某生产车间例如,某生产车间2121名工人日加工零件数资料名工人日加工零件数资料如下如下::117 。






![河南新冠肺炎文件-豫建科[2020]63号+豫建科〔2019〕282号](http://img.jinchutou.com/static_www/Images/s.gif)





