
统计学上机实验例题(一).ppt
38页单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,,,*,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,,,*,《,统计学,》,上机实验(一),教材中的例题部分,第,2,章,数据的图表展示,2.1,,数据的预处理,,2.2,品质数据的整理与显示,,2.3,数值型数据的整理与显示,,2.4,合理使用图表,2.1,,数据的预处理,2.1.1,数据审核,,2.1.2,数据筛选,,2.1.3,数据排序,,2.1.4,数据透视表,8,名学生的考试成绩数据,,一、数据的筛选、排序,【,例,2.1】(,见教材,20,~,25,页,),,用,Excel,进行数据筛选与排序,二、数据透视表,【,例,2.2】(,见教材,25,~,29,页,),第,1,步:,在,Excel,工作表中建立数据清单,,第,2,步:,选中数据清单中的任意单元格,并选择,【,数据,】,菜单中的,【,数据透视表和数据透视图,】,,第,3,步:,确定数据源区域,,第,4,步:,在,【,向导,—,3,步骤之,3,】,中选择数据透视表的输出位置,然后选择,【,布局,】,,第,5,步:,在,【,向导,—,布局,】,对话框中,依次将,“,分类变量,”,拖至左边的,“,行,”,区域,上边的,“,列,”,区域,将需要汇总的,“,变量,”,拖至,“,数据区域,”,,第,6,步:,然后单击,【,确定,】,,自动返回,【,向导,—,3,步骤之,3】,对话框。
然后单击,【,完成,】,,,即可输出数据透视表,,用,Excel,创建数据透视表,2.2,品质数据的整理与展示,2.2.1,分类数据的整理与图示,,2.2.2,顺序数据的整理与图示,2010,年,,,,,,,【,例,2.3】,(,见教材,30,~,34,页),为研究不同类型的软饮料的市场销售情况,一家市场调查公司对随机抽取的一家超市进行调查下面的表,2—1,是调查员随机观察的,50,名顾客购买的饮料类型及购买者性别的记录生成频数分布表,观察饮料类型和消费者性别的分布状况,并进行描述性分析,,,,,,,,,,绿色,,健康饮品,Excel,一、分类数据整理:编制频数分布表;绘制条形图;帕累托图; 饼图2010,年,使用,Excel,数据透视表计数,,(pivot table),第,1,步:,选择,【,数据,】,菜单中的,【,数据透视表和数据透视图,】,,第,2,步:,确定数据源区域,(,在操作前将光标放在任意数据内,系统会自动选定数据源区域,),,第,3,步:,在,【,向导,—3,步骤之,3】,中选择数据透视表的输出位置,然后选择,【,布局,】,,第,4,步:,在,【,向导,—,布局,】,对话框中,依次将“饮料类型”拖 至左边的“行”,(,或列,),区域,将“顾客性别”拖至 “列”,(,或行,),区域,将“饮料类型”拖至“数据”区域。
第,5,步:,单击,【,确定,】,,自动返回,【,向导,—3,步骤之,3】,对话框单击,【,完成,】,,,Excel,2010,年,,生成频数分布表,,(,列联表,—Excel),,,不同类型饮料和顾客性别的频数分布,,绿色,,健康饮品,2010,年,,分类数据的图示,—,条形图,(,bar Chart,),2010,年,,分类数据的图示,—,复式条形图,(,bar Chart,),饮料类型和顾客性别的条形图,,2010,年,,分类数据的图示,—,帕累托图,(pareto chart),按各类别数据出现的频数多少排序后绘制的柱形图,,用于展示分类数据的分布,2010,年,,分类数据的图示,—,简单饼图,,,(,pie Chart,),,,,用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样本,(,或总体,),中各组成部分的数据占全部数据的比例用于研究结构问题,制作频数分布图表,二、顺序数据的累计频数分布图、环形图,【,例,2.4】,(,见教材,35,~,37,页),,在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查,300,户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?”,,1,.非常不满意;,2,.不满意;,3,.一般;,4,.满意;,5,.非常满意。
甲城市家庭对住房状况评价的频数分布,,,,,,,回答类别,甲城市,,,,,,,户数,,(,户,),百分比,,(%),向上累积,,向下累积,,,,,户数,,(,户,),百分比,,(%),户数,,(,户,),百分比,,(%),,非常不满意,,,不满意,,,一般,,,满意,,,非常满意,24,,108,,93,,45,,30,8,,36,,31,,15,,10,24,,132,,225,,270,,300,8.0,,44.0,,75.0,,90.0,,100.0,300,,276,,168,,75,,30,100.0,,92,,56,,25,,10,合计,300,100.0,—,—,—,—,顺序数据的频数分布表和图,乙城市家庭对住房状况评价的频数分布,,,,,,,回答类别,乙城市,,,,,,,户数,,(,户,),百分比,,(%),向上累积,,向下累积,,,,,户数,,(,户,),百分比,,(%),户数,,(,户,),百分比,,(%),,非常不满意,,,不满意,,,一般,,,满意,,,非常满意,21,,99,,78,,64,,38,7.0,,33.0,,26.0,,21.3,,12.7,21,,120,,198,,262,,300,7.0,,40.0,,66.0,,87.3,,100.0,300,,279,,180,,102,,38,100.0,,93.0,,60.0,,34.0,,12.7,合计,300,100.0,—,—,—,—,,顺序数据的图示,—,累计频数分布图,(,例题分析,),,,,,,,,,24,300,132,225,270,0,100,200,300,400,,非常,不满意,,不满意,,一般,,满意,,非常,满意,,,累,积,户,数,,(户),,(a),向上累积,,,,,,,,,,276,168,30,300,75,0,100,200,300,400,,非常,不满意,,不满意,,一般,,满意,,非常,满意,,,累,积,户,数,,(户),,(b),向下累积,,甲城市家庭对住房状况评价的累积频数分布,,环形图,(,例题分析,),,,,,,,,,,,,,8%,36%,31%,15%,7%,33%,26%,21%,13%,10%,,,,非常不满意,,,不满意,,,一般,,,满意,,,非常满意,,,,甲乙两城市家庭对住房状况的评价,,用,Excel,制作图形,2.3,数值型数据的整理与展示,2.3.1,数据分组,,2.3.2,数值型数据的图示,一、数值型数据:用数据分析中的直方图编制频数分布表;绘制直方图折线图,【,例,2.5】,(,见教材,38,~,42,页),表中是某电脑公司,2002,年前四个月各天的销售量数据,(,单位:台,),。
试对数据进行分组,,,,,,,,,,,,,,,,,,等距分组表,(,上下组限重叠,),,分组数据的图示,(,直方图的绘制,),,140,150,,210,,直方图下的面积之和等于,1,某电脑公司销售量分布的直方图,我一眼就看出来了,销售量在,170,~,180,之间的天数最多,!,,190,200,,180,,,160,170,,频,,数,,(,天,),25,20,15,10,5,30,,220,,230,,240,,,使用,Excel,函数,(,FREQUENCY,),使用统计函数,【,FREQUENCY,】,创建频数分布表和直方图的具体步骤是:,,选择与接收区域相临近的单元格区域,作为频数分布表输出的区域,,选择统计函数中的,【,FREQUENCY,】,函数,,在对话框,【,Date-array,】,后输入数据区域,在,【,Bins-array,】,后输入接收区域,,同时按下,“,Ctrl-Shift-Enter,”,组合键,即得到频数分布,,统计函数,—,FREQUENCY,用,Excel,数据分析功能,,将,120,个销售量的数据输入到,Excel,工作表中,然后按下列步骤操作,,第,1,步:,选择,【,工具,】,下拉菜单,,第,2,步:,选择,【,数据分析,】,选项,,第,3,步:,在分析工具中选择,【,直方图,】,,然后选择,【,确定,】,,第,4,步:,当对话框出现时,,在,【,输入区域,】,方框内键入,数据区域,,在,【,输出选项,】,中选择,输出区域,,选择,【,图表输出,】,,,选择,【,确定,】,,,用,Excel,制作频数分布表,二、时间序列数据,—,线图,【,例,2.7】,,(,见教材,48,~,49,页),我国,1991,~,2003,年城乡居民家庭的人均收入数据如右表。
试绘制线图,,,,¥,,$,,,1991,~,2003,年城乡居民家庭人均收入,,,年份,城镇居民,农村居民,1991,,1992,,1993,,1994,,1995,,1996,,1997,,1998,,1999,,2000,,2001,,2002,,2003,1700.6,,2026.6,,2577.4,,3496.2,,4283.0,,4838.9,,5160.3,,5425.1,,5854.0,,6280.0,,6859.0,,7702.8,,8472.2,708.6,,784.0,,921.6,,1221.0,,1577.7,,1926.1,,2091.1,,2162.0,,2210.3,,2253.4,,2366.4,,2475.6,,2622.2,,时间序列数据,—,线图,(,例题分析,),,用,Excel,制作线图,三、多变量数据:二维散点图、气泡图、雷达图,温度,/,0,C,降雨量,/mm,产量,/,(,kg/hm,2,,),6,25,2250,8,40,3450,10,58,4500,13,68,5750,14,110,5800,16,98,7500,21,120,8250,【,例,2.8】,,(,见教材,50,~,52,页),小麦的单位面积产量与降雨量和温度等有一定关系。
为了解它们之间的关系形态,收集数据如表试绘制小麦产量与降雨量的散点图,并分析它们之间的关系小麦产量与降雨量和温度的数据,,两个变量间的关系,—,二维散点图,,(2D Scatterplots),,三个变量间的关系,—,气泡图,(,bubble chart,),显示三个变量之间的关系,,图中数据点的大小依赖于第三个变量,,用,Excel,制作,二维散点图、气泡图,,,,,,,,多变量数据,—,雷达图,【,例,2.9】,(,见教材,52,~,53,页),,2003,年我国城乡居民家庭平均每人各项生活消费支出构成数据如表试绘制雷达图,今天的主食是面包,2003,年城乡居民家庭平均每人生活消费支出构成,(%),,,项 目,城镇居民,农村居民,,食品,,衣着,,家庭设备用品及服务,,医疗保健,,交通通讯,,娱乐教育文化服务,,居住,,杂项商品与服务,37.12,,9.79,,6.30,,7.31,,11.08,,14.35,,10.74,,3.30,45.59,,5.67,,4.20,,5.96,,8.36,,12.13,,15.87,,2.21,,多变量数据,—,雷达图,(,例题分析,),,用,Excel,制作,雷达图,3.4,合理使用图表,3.4.1,鉴别图形优劣的准则,,3.4.2,统计表的设计,一张好的图表应包括以下基本特征,,显示数据,,让读者把注意力集中在图表的内容上,而不是制作图表的程序上,,避免歪曲,,强调数据之间的比较,,服务于一个明确的目的,,有对图表的统计描述和文字说明,,5,种鉴别图表优劣的准则:一张好的图表应当,,精心设计、有助于洞察问题的实质,,使复杂的观点得到简明、确切、高效的阐述,,能在最短的时间内以最少的笔墨给读者提供最大量的信息,,是多维的,,表述数据的真实情况,鉴别图表优劣的准则,统计表的结构,2002,~,2003,年城镇居民家庭抽样调查资料,,,,项目,单位,2002,年,2003,年,,调查户数,,平均每户家庭人口,,平均每户就业人口,,平均每户就业面,,平均一名就业者负担人数,,平均每人全部年收入,,#可支配收入,,平均每人消费性支出,户,,人,,人,,%,,元,,元,,元,,元,45317.00,,3.04,,1.58,,51.97,,1.92,,8177.40,,7702.80,,6029.88,48028.00,,3.01,,1.58,,52.49,,1.91,,9061.22,,8472.20,,6510.94,资料来源:,《,中国统计年鉴,2004》,,中国统计出版社,,2004,,第,359,页。
注:本表为城市和县城的城镇居民家庭抽样调查资料行标题,列标题,数字资料,,,表头,附加,,合理安排统计表的结构,,总标题内容应满足,3W,,要求,,数据计量单位相同时,可放在表的右上角标明,不同时应放在每个变量后或单列出一列标明,,表中的上下两条横线一般用粗线,其他线用细线,,通常情况下,统计表的左右两边不封口,,表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一,,对于没有数字的表格单元,一般用,“,—”,表示,,必要时可在表的下方加上注释,统计表的设计,统计表的设计,(,比较与选用,),,表,A,某城市居民关注广告类型的频数分布,广告类型,人数,(,人,),频率,(%),,商品广告,112,56.0,,服务广告,51,25.5,,金融广告,9,4.5,,房地产广告,16,8.0,,招生招聘广告,10,5.0,,其他广告,2,1.0,合计,200,100.0,统计表的设计,(,比较与选用,),,表,B,某城市居民关注广告类型的频数分布,广告类型,人数,(,人,),频率,(%),,商品广告,112,56.0,,服务广告,51,25.5,,金融广告,9,4.5,,房地产广告,16,8.0,,招生招聘广告,10,5.0,,其他广告,2,1.0,合计,200,100.0,提示:,1,、完成本,《,例题部分,》,的学习后,可继续做,《,练习题,》,部分(数据见另一文件夹)。
2,、课后作业,2.1;2.4;2.6;2.12;2.13;2.14,,3,、要求,:,独立完成,,,下次课上交,.,,THANKS,。
