好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

统计学第3章数据的图表展示2汇编.doc

18页
  • 卖家[上传人]:今***
  • 文档编号:108347102
  • 上传时间:2019-10-23
  • 文档格式:DOC
  • 文档大小:440.50KB
  • / 18 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第3章 数据的图表展示主要内容分类数据频数分布表、条形图饼图顺序数据累积频数分布表、累积频数分布图数值型数据未分组茎叶图、箱线图分组直方图时间序列线图多变量散点图、气泡图、雷达图注:低层次数据的整理方式适用于高层次的数据,但反之不可!了解数据预处理的过程掌握各种类型数据相应的图标展示方法重点掌握:频数分布表、条形图、饼图 数值型数据的分组频数分布表、直方图、茎叶图、箱线图、线图要求能够手工编制条 茎叶图、箱线图3.1 数据的预处理数据的审核、筛选、排序等3.2 品质数据的整理与展示3.2.1 分类数据的整理与图示1 频数与频数分布西安交通大学管理学院学风调查自己时间频数分布表自习时间频数比例百分比%0-4140.14145-8340.35359-12350.363613以上150.1515合计981100频数:落在某个特定类别或组中的数据个数频数分布:把各个类别及落在其中的相应频数全部列出,并用表格的形式表现出来比例、百分比——反应样本(总体)的结构/构成比率:是样本或总体中各个不同类别数值之间的比值上例:(0-4)小时:(5-8)小时:(9-12)小时:(13以上)小时=14:35:36:152 分类数据的图示(1) 条形图自习时间的条形图条形图:用宽度相同的条形的高度或长度按来表示数据多少的图形可以横置——条形图或纵置——柱形图对比条形图不同品牌电脑的销售量数据电脑品牌一季度二季度联想256468宏基285397康柏247328戴尔563688(2)饼图饼图:用圆形及圆内扇形的角度表示数值大小的图形,主要用于表示一个总体/样本各组成部分的数据占全部数据的比例。

      研究结构性问题 (3) 环形图3.2.2 顺序数据的整理与图示1 累积频数和累积频率某社会收入分配状况级别占人口百分比占收入百分比120622012320174202452041向上累积级别占人口百分比占收入百分比占人口百分比累积占收入百分比累积120620622012401832017603542024805952041100100累积频数:是将各有序类别或组的频数逐级累加起来得到的频数向上累积:从变量值小的方向向变量值大的方向累加向下累积:向下累积级别占人口百分比占收入百分比占人口百分比累积占收入百分比累积1206100100220128094320176082420244065520412041累积频率或累积百分比:将各有序类别或组的频率或百分比逐级累加起来2 顺序数据的图示累积频数分布图 向上累积向下累积3.3 数值型数据的整理与展示3.3.1 数据分组例:某电脑公司某4个月每天的销售数据(单位:台),234159187155172183182177163158143198141167194225177189196203187160214168173178184209176188161152149211196234185189196206150161178168174153186190160171228162223170165179186175197208153163218180175144178191197192166196179171233179187173174210154164215233175188237194198168174226180172190172187189200211156165175210207181205195201172203165196172176182188195202213某电脑公司销售量的频数分布按销售量分组(台)频数(天)频率(%)140~15043.33150~16097.50160~1701613.33170~1802722.50180~1902016.67190~2001714.17200~210108.33210~22086.67220~23043.33230~24054.17 合计 120100数据分组:将原始数据按照某种标准划分成不同的组别。

      目的:观察数据的分布特征方式: 单变量分组:适用于离散变量且变量值较少的情况 组距分组:适用于连续变量或变量值较多的情况组距分组的方法:将全部变量值依次划分为若干个区间,并将这一区间的变量作为一组 下限:一个组的最小值 上限:一个组的最大值编制分组频数分布表的步骤:第1步:确定组数K 通常 实际:根据数据的多少、特点及分析的要求来确定第2步:确定各组的组距 组距:一个组的上限与下限的差 通常 组距=(最大值-最小值)/组数 组距一般取5或10的倍数 第一组的下限<最小值、最后一组的上限>最大值第3步:根据分组整理成频数分布表某电脑公司销售量的频数分布按销售量分组(台)频数(天)频率(%)140~15043.33150~16097.50160~1701613.33170~1802722.50180~1902016.67190~2001714.17200~210108.33210~22086.67220~23043.33230~24054.17 合计 120100说明:?150应该算在哪一组一般方法:“不重不漏”原则:“上组限不在内”“组上限不在内” 断点/小数点 按销售量分组(台)频数(天)频率(%)140~14943.33150~15997.50160~1691613.33170~1792722.50180~1892016.67190~1991714.17200~209108.33210~21986.67220~22943.33230~23954.17合计120100? 由于极大值或极小值造成的空白组情况按销售量分组(台)频数(天)110~1201120~1300130~1400140~1504150~1609160~17016170~18027180~19020190~20017200~21010210~2208220~2304230~2405240~2500250~2600260~2700270~2801合计122解决方法:开口组按销售量分组(台)频数(天)150以下5150~1609160~17016170~18027180~19020190~20017200~21010210~2208220~2304230以上6合计122@ 并非所有的分组都是等距分组,可以根据情况选择不等距分组我国5次人口普查居民年龄构成各年龄组人口 (%)195319641982199020000-14岁36.2840.6933.5927.6922.8915-64岁59.3155.7561.5066.7470.1565岁及以上4.413.564.915.576.96资料来源:中国统计年鉴2008注:组距分组掩盖了各组内数据的分布状况解决方法:用组中值作为该组数据的一个代表值暗含的假设:数据在组内称均匀分布或在组中值两侧称对称分布。

      3.3.2 数值型数据的图示1未分组数据:茎叶图和箱线图(1)茎叶图茎叶图:是反映原始数据分布的图形,由“茎”与“叶”两部分构成,每一部分均由数字组成树茎树叶数据个数14151617181920212223134902334568900112334555678880011233444555566778889990012234566777788899900124455666667788012335678900113458356833447491627201710845 某电脑公司销售数据的茎叶图是一种非常方便的手工汇总数据的方法(2)箱线图是由一组数据的最大值、最小值、中位数和两个四分位数这五个特征值绘制而成的图形简单的箱线图 四分位数与中位数将数据按大小排列成数列以后,从下向上数第25%的数据所在位置的值称为下四分位数,用表示;处于中间位置的值称为中位数,用或Me表示;从下向上数第75%的数据所在位置的值称为上四分位数,用表示求解: 第1步:要确定四分位数的位置,的位置= 的位置=的位置= 第2步,确定分位数具体的数值 如果位置是整数,四分位数就是该位置对应的值;如果是在0.5的位置上,则取该位置两侧值的平均数;如果是在0.25或0.75的位置上,则四分位数等于该位置下侧值加上按比例分摊位置两侧数值的差值。

      例:(1)数列2、4、6、8、10、12、14解: 的位置=,则的位置=,则的位置=,则(2)数列2、4、6、8、10、12、14、16解: 的位置=,则的位置=,则的位置=,则9虽然不是数列中的数据,但它恰好把数列分为两半例:请计算所示电脑销售数据的四分位差树茎树叶数据个数14151617181920212223134902334568900112334555678880011233444555。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.