
第3章数据整理与显示.ppt
82页3 - 1统计学统计学STATISTICS第 3 章 数据整理与显示3.1 数据的整理数据的整理 3.2 数据的显示数据的显示3.3 Excel的应用的应用3 - 2统计学统计学STATISTICS学习目标1.了解数据预处理的内容和目的2.掌握分类和顺序数据的整理与显示方法3.掌握数值型数据的整理与显示方法4.会用Excel制作各种统计图和统计表5.合理使用统计表3 - 3统计学统计学STATISTICS3.1 数据的整理§数据整理的步骤§数据筛选与排序§数据整理过程3 - 4统计学统计学STATISTICS数据整理的步骤§设计数据整理方案§对统计资料进行审核、筛选与排序 §分组或分类、计算和汇总 §编制统计表、绘制统计图 3 - 5统计学统计学STATISTICS数据筛选与排序3 - 6统计学统计学STATISTICS数据筛选(data filter)1.当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选2.数据筛选的内容§将某些不符合要求的数据或有明显错误的数据予以剔除§将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除3 - 7统计学统计学STATISTICS用用Excel进行数据筛选进行数据筛选 8 8名学生的考试成绩数据名学生的考试成绩数据名学生的考试成绩数据名学生的考试成绩数据 数据筛选(data filter)3 - 8统计学统计学STATISTICS步骤(自动筛选1)3 - 9统计学统计学STATISTICS步骤(自动筛选2)3 - 10统计学统计学STATISTICS步骤(自动筛选3)结果:筛选出的统计学成绩为75分的数据3 - 11统计学统计学STATISTICS步骤(自动筛选4)在前10个数据中筛选出英语成绩为前三名的3 - 12统计学统计学STATISTICS步骤(高级筛选1)筛选出4门课程成绩都大于70分的学生3 - 13统计学统计学STATISTICS步骤(高级筛选2)3 - 14统计学统计学STATISTICS步骤(高级筛选3)3 - 15统计学统计学STATISTICS数据排序 (data rank)1.按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索2.排序有助于对数据检查纠错,以及为重新归类或分组等提供依据3.在某些场合,排序本身就是分析的目的之一4.排序可借助于计算机完成3 - 16统计学统计学STATISTICS数据排序 (方法)1.分类数据的排序§字母型数据,排序有升序降序之分,但习惯上用升序§汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分2.数值型数据的排序n递增排序:设一组数据为x1,x2,…,xn,递增排序后可表示为:x(1)
.非常满意 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%) 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510 24132225270300 8.0 44.0 75.0 90.0100.0300276168 75 30100.092562510合计合计300100.0————3 - 30统计学统计学STATISTICS顺序数据的频数分布表 (例题分析)乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%) 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2199786438 7.033.026.021.312.7 21120198262300 7.0 40.0 66.0 87.3100.0300279180102 38100.0 93.0 60.0 34.0 12.7合计合计300100.0————3 - 31统计学统计学STATISTICS数据分组3 - 32统计学统计学STATISTICS数据分组的作用§区分事物的性质 例:将我国企业进行分组,就可以有效地区分它们在所有制方面的区别 §研究统计总体的类型和结构 例企业根据职工文化程度不同分组,以便根据不同文化层次分期分批培训 §反映现象之间的依存关系 可以看出流通费用率与流转额之间存在着比较密切的相关关系 3 - 33统计学统计学STATISTICS分组方法等距分组等距分组异距分组异距分组3 - 34统计学统计学STATISTICS单变量值分组(要点)1. 将一个变量值作为一组2. 适合于离散变量3. 适合于变量值较少的情况3 - 35统计学统计学STATISTICS例子3 - 36统计学统计学STATISTICS单变量值数据排序3 - 37统计学统计学STATISTICS单变量值分组频数分布表3 - 38统计学统计学STATISTICS组距分组 (要点)1.将变量值的一个区间作为一组2.适合于连续变量3.适合于变量值较多的情况4.需要遵循“不重不漏”的原则5.可采用等距分组,也可采用不等距分组 ~ ~ ~ ~ ~ 3 - 39统计学统计学STATISTICS组距分组(步骤)1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。
在实际分组时,可以按 Sturges 提出的经验公式来确定组数K2.确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距=组距=( 最大值最大值 - 最小值最小值)÷ 组数组数 3.统计出各组的频数并整理成频数分布表 3 - 40统计学统计学STATISTICS组距分组(几个概念)1. 下限下限(low limit) ::一个组的最小值2. 上限上限(upper limit) ::一个组的最大值3. 组距组距(class width) ::上限与下限之差4. 组中值组中值(class midpoint) ::下限与上限之间的中点值下限值+上限值2组中值 =3 - 41统计学统计学STATISTICS频数分布表的编制(例题分析)【 例 】 某某生生 产产 车车 间间5050名名 工工 人人日日 加加 工工 零零件件 数数 (( 单单位位::个个))试试 对对 数数 据据进行分组进行分组 3 - 42统计学统计学STATISTICS频数分布表的编制(步骤)1.确定组数:根据 Sturges 提出的经验公式得组数K为:2.确定各组的组距: 组距=组距=( 139 - 107)÷ 7≈4.6 53. 用用Excel制作频数分布表制作频数分布表 3 - 43统计学统计学STATISTICS等距分组表(上下组限重叠)3 - 44统计学统计学STATISTICS等距分组表(上下组限间断)3 - 45统计学统计学STATISTICS组距分组与不等距分组(在表现频数分布上的差异)1.等距分组n各组频数的分布不受组距大小的影响n可直接根据绝对频数来观察频数分布的特征2.不等距分组n各组频数的分布受组距大小不同的影响n各组绝对频数的多少不能反映频数分布的实际状况n需要用频数密度(频数密度=频数/组距)反映频数分布的实际状况3 - 46统计学统计学STATISTICS频数分布的类型3 - 47统计学统计学STATISTICS钟型分布(Bell-shaped distribution)§特征是“两头小、中间大”,其分布曲线宛如一口古钟§图(a)被称为正态分布图(b)和(c)被称为偏态分布,其中,图(b)为正偏态分布图(c)为负偏态分布§许多社会经济和自然现象总体的频数分布都趋向于正态分布 (a) (b) (c) 3 - 48统计学统计学STATISTICSU型分布(U-shaped distribution)§U型分布的形状跟钟型分布相反,靠近中间的变量值频数少,靠近两端的变量值频数多,形成“两头大、中间小”的U字型§例如,人口死亡率分布就是这种分布;人口总体中,幼儿和老年人死亡率高,而中青年死亡率低 3 - 49统计学统计学STATISTICSJ型分布(J-shaped distribution)§J型分布有两种类型,一种是正J型分布,即频数随着变量值的增大而增多,如图(a)所示;另一种是反J型分布,如图(b)所示。
§例如,经济学中供给曲线随着价格的提高,供给量以更快速度增加,呈现出正J型;而需求曲线则表现为随着价格的提高,需求量以较快的速度减少,呈现为反J型 (a) (b)3 - 50统计学统计学STATISTICS数据显示3 - 51统计学统计学STATISTICS统计表的结构行标题数字资料附加表头列标题12.4011.90 平方米六、平均每人居住面积987.17755.94 元 非消费性支出4331.61 4185.64 元 消费性支出**5322.954945.87 元五、平均每人实际支出5458.345188.54 元四、平均每人全部收入1.801.83 人三、平均每户就业人口数3.163.19 人二、平均每户家庭人口数39080 37890 户一、调查项目1998年1997年单位项目表表3.2.1 19973.2.1 1997--19981998年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料* * 资料来源:《中国统计摘要1999》79页,北京,中国统计出版社,1999。
本表为城市和县城的城镇居民家庭抽样调查材料消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务3 - 52统计学统计学STATISTICS1.合理安排统计表的结构2.数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明3.表中的上下两条横线一般用粗线,其他线用细线4.通常情况下,统计表的左右两边不封口5.表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一6.对于没有数字的表格单元,一般用“—”表示7.必要时可在表的下方加上注释统计表的设计3 - 53统计学统计学STATISTICS统计表的设计(比较与选用)3 - 54统计学统计学STATISTICS统计表的设计(比较与选用)3 - 55统计学统计学STATISTICS统计表的设计(比较与选用)3 - 56统计学统计学STATISTICS分类数据的图示—条形图(bar Chart)1.用宽度相同的条形的高度或长短来表示各类别数据的图形2.有单式条形图、复式条形图等形式3.主要用于反映分类数据的频数分布4.绘制时,各类别可以放在纵轴,称为条条形图形图,也可以放在横轴,称为柱形图柱形图3 - 57统计学统计学STATISTICS分类数据的图示—条形图 (例题分析)图类别数据条形图图离散型变量次数分布条形图3 - 58统计学统计学STATISTICS分组数据—直方图(histogram)1.用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面面积积来表示各组的频数分布2.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图3.直方图下的总面积等于13 - 59统计学统计学STATISTICS分组数据的图示(直方图的绘制)直方图下的面积之和等于1某生产车间某生产车间某生产车间某生产车间50505050名工人日加工零件频数分布直方图名工人日加工零件频数分布直方图名工人日加工零件频数分布直方图名工人日加工零件频数分布直方图 我我一一眼眼就就看看出出来来了了,,加加工工零零件件 在在 120120~~125125之之间间的的人人数最多数最多! !3 - 60统计学统计学STATISTICS分组数据—直方图(直方图与条形图的区别)1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据3 - 61统计学统计学STATISTICS分组数据—折线图(frequency polygon)1.折线图也称频数多边形图2.是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉3.折线图的两个终点要与横轴相交,具体的做法是n第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴n折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的3 - 62统计学统计学STATISTICS分组数据的图示(折线图的绘制)折线图与直方图下的面积相等!某生产车间某生产车间某生产车间某生产车间50505050名工人日加工零件频数分布直方图名工人日加工零件频数分布直方图名工人日加工零件频数分布直方图名工人日加工零件频数分布直方图 3 - 63统计学统计学STATISTICS分类数据的图示—饼图(pie Chart)1.也称圆形图,是用圆形及圆内扇形的面积来表示数值大小的图形2.主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用3.绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心角度,是按各部分数据百分比占3600的相应比例确定的3 - 64统计学统计学STATISTICS分类数据的图示—饼图 (例题分析)3 - 65统计学统计学STATISTICS环形图(annular chart)1.环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示2.环形图与圆形图类似,但又有区别n圆形图只能显示一个总体各部分所占的比例n环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环3.环形图可用于结构比较研究 4.环形图主要用于展示分类和顺序数据3 - 66统计学统计学STATISTICS环形图 (例题分析)8%36%31%15%7%33%26%21%13%10% 非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价3 - 67统计学统计学STATISTICS线图乙城市累积频数分布图3 - 68统计学统计学STATISTICS散点图3 - 69统计学统计学STATISTICS数据类型及图示 (小结)3 - 70统计学统计学STATISTICSExcel 应用3 - 71统计学统计学STATISTICS建立统计表§输入数据。
首先进入Excel,选定准备向其中输入数据的单元格,然后将文字、数字、时间、日期或公式输入到单元格中,然后单击编辑栏中的“√”或按Enter键、Tab键以及方向键予以确认§简单计算在整理资料时若需要计算,可先在单元格中输入公式以便进行计算公式可由数值、单元格、函数及运算符组成输入公式的标志是在选定的单元格内先输入一个“=”,然后输入公式的具体内容3 - 72统计学统计学STATISTICS绘制统计图§利用图表指南工具制作图表单击“图表指南”工具,选择“建立新图表” 在该对话框中选择所要创建的图表类型,再选择图表格式,并通过对话框提供的各个选项设定图例、图表标题、轴标题等细节最终确定后单击“完成”按钮§利用图表工具栏制图具体做法是:在“视图”菜单中选择“工具”项,从中选择“图表”,出现图表工具栏此时,先在工作表中选择区域,然后根据具体需要在图表工具栏中选择“图表类型”3 - 73统计学统计学STATISTICS数据处理§进行分类汇总和合并计算等复杂的数据处理工作§实现资料内容的增加、修改、删除与查找§对数据进行排序§可以为各类数据的一些数据项进行统计汇总,例如,求和§利用“合并计算”可以将一个或多个工作簿中若干张结构相同的表进行表间的汇总 3 - 74统计学统计学STATISTICS建立数据透视表某单位部分人事统计表3 - 75统计学统计学STATISTICS3 - 76统计学统计学STATISTICS3 - 77统计学统计学STATISTICS3 - 78统计学统计学STATISTICS画K线图(举例说明)操作步骤:1、点击图表向导图表向导,选择股价图股价图以及子股价图:成交量-成交量-开盘-盘高-盘低-收盘图开盘-盘高-盘低-收盘图,如图所示。
2、点击下一步下一步,进入图表向导步骤图表向导步骤2,输入数据区域数据区域3、点击下一步下一步,进入图表向导步骤图表向导步骤3-图表选项-图表选项点击标标题题,在图表标题图表标题栏内输入“K线图”,在数值(数值(Y)轴)轴栏内输入“成交量”,在次数值(次数值(Y)轴)轴栏内输入“股价”;点击坐标轴坐标轴,将主坐标轴主坐标轴的分类(分类(X)轴)轴选为分类;分类;点击图例击图例,去掉显示图例显示图例,点击完成完成4、修饰草图双击主数值轴,在坐标轴格式坐标轴格式对话框中,单击刻度刻度,将最大值最大值设置为 “20000000”,并把显示显示单位单位选择成“百万”,点击完成完成;双击次主数值轴,在坐标轴格式坐标轴格式对话框中,单击数字数字,将小数位数小数位数设置为 “0”,点击完成完成;双击分类轴,在坐标轴格式坐标轴格式对话框中,单击字体字体,将字号字号设置为 “8”,点击完成完成3 - 79统计学统计学STATISTICS5、添加移动平均线点击绘图区使之处于激活状态,再点击菜单栏中的图表-添图表-添加趋势线加趋势线,选择移动平均移动平均,将周期周期调至3,单击完成完成按钮;点击菜单栏中的视图-工具-绘图将绘图工具栏打开,点击上面的(文本框)在绘图区添加一个文本框,并输入“3日均线”,在点击,绘制一个箭头指向移动平均线,就得到如图3-31所示的K线图了。
3 - 80统计学统计学STATISTICSExcelExcel统计绘图的运用统计绘图的运用――洛伦茨曲线或帕洛伦茨曲线或帕累托曲线累托曲线3 - 81统计学统计学STATISTICS本章小结1.数据预处理的内容和目的2.分类和顺序数据的整理与显示方法3.数值型数据的整理与显示方法4.合理使用统计表5.用Excel作频数分布表和图形结结 束束第三章 数据整理与显示。
