好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

应用经济统计学数据整理与分析.ppt

77页
  • 卖家[上传人]:自***
  • 文档编号:26244758
  • 上传时间:2017-12-24
  • 文档格式:PPT
  • 文档大小:1.78MB
  • / 77 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 数 据 整 理 与 分 析,主要内容,数据分组数据显示数据集中趁势数据离中趋势,数据分组,1、将原始资料顺序排序2、确定组数与组距3、确定组限4、将各个数据按其数值大小归入相应的组内,,如果数据分布比较均匀、对称,即中间数值次数多,大小极端值次数少,考虑用以下公式来确定组数:组数=1+3.322 log n,组距=(观察值中的最大数值-观察值中的最小数值)/组数,数据分组例,【例1】设某企业30个非熟练工人的周工资额 (元)如下:106 99 85 121 84 94 106 110 119 101 9591 87 105 106 109 118 96 128 91 105 111111 107 103 101 107 106,数据分组例,排序: 84,85,87,91,91,94,95,96,97,99,101,101,103,103,105,105,105,106,106,106,106,107,107,109,110,111,111,118,119,121,128,分组计算,组数=1+3.322 log n =5.9(n=30) 分6组组距:每组区间的宽度 =(观察值中的最大数值- 观察值中的最小数值)/组数 =(128-84)/6=7.3,分6组,组距8,,结合实际数据,一、比较计算组距值(7.3),组距为10比较好计算且方便,二、分组的组数相应从6减少为5。

      最小值为84,下限从80开 始,,分5组,组距10,,分两组,分组太细会出现什么问题?,,数据图示,直方图:频数分配直方图、频率分配直方图次数多边形图累积次数分配图:小于上组限的累积次数分配图、大于下组限的累积次数分配图[特例] 洛伦茨曲线茎叶图,直方图,以变量值为横坐标、次数为纵坐标,以矩形高度表示各组次数(频数)分配多少如下图:,,频数直方图,直方图,频率分布直方图,次数多边形图,,次数多边形图,还可将几种不同数据绘在同一多边形图上用于比较.如图:,累计次数分配图,小于上组限的累积次数分配,累计次数分配图,以变量值为横坐标、以累积计次数为纵坐标描点连接而成的图,如下图:,累计次数分配图,大于下组限的累积次数分配,累计次数分配图,,洛伦茨曲线,以人口百分比为横坐标、以累积收入百分比为纵坐标描点连接而成的图形,如图:,基尼系数,反映一国收入的平等程度如右图 基尼系数 r=A/(A+B) r=0 绝对平等 r=1 绝对不平等 r越大越不平等,反之则越平等茎叶图,数据源: 21 ,29, 60, 1, 27, 35, 66, 23, 8, 38, 31, 45, 57, 66, 68, 62, 62, 93, 68, 19, 68, 72, 76, 91, 46, 62, 3, 10, 49, 56, 52, 95 按大小排序后如下: 1, 3, 8, 10, 19, 21, 23, 27, 29, 31, 35, 38, 45, 46, 49, 52, 56, 57, 60, 62, 62, 62, 66, 66, 68, 68, 68, 72, 76, 91, 93, 95,茎叶图,茎 叶 次 数 0 1 3 8 3 1 0 9 2 2 1 3 7 9 4 3 1 5 8 3 4 5 6 9 3 5 2 6 7 3 6 0 2 2 2 6 6 8 8 8 9 7 2 6 2 8 0 9 1 3 5 5 4,数据集中趋势,算术平均数 几何平均数 调和平均数 中位数及四分位数 众数,算术平均数 (概念要点),集中趋势的测度值之一最常用的测度值一组数据的均衡点所在易受极端值的影响,算术平均数 (计算公式),设一组数据为:简单算术平均值的计算公式为,设分组后的数据为:相应的频数为: 加权算术平均值的计算公式为,简单算术平均数 (算例),原始数据: 10 5 9 13 6 8,加权算术平均数 (算例),【例2】设某企业经理付给他的雇员的每小时工资分为三个等级:6.5元、7.5元、8.5元。

      拿这三种工资的人数分别为:14人、10人、2人 ,则该公司雇员的平均工资为:,加权算术平均数 (分组数据算例),【例3】根据表4-1中的数据,计算50 名工人日加工零件数的均值,算术平均数的数学性质,1.各变量值与均值的离差之和等于零,2. 各变量值与均值的离差平方和最小,几何平均数 (概念要点),1. 集中趋势的测度值之一2. 主要用于计算平均比率及平均发展速度3. 计算公式为简单几何平均数加权几何平均数4.数据都为正数时才可计算几何平均数,5. 可看作是均值的一种变形,几何平均数 (算例),【例4】设某建筑公司承建的四项工程的利润分别为3%、2%、4%、6%问这四项工程的平均利润率是多少?,几何平均数 (算例),【例5】一位投资者持有一种股票,1996年、1997年、1998年和1999年收益率分别为4.5%、2.0%、3.5%、5.4%计算该投资者在这四年内的平均收益率平均收益率=103.84%-1=3.84%,几何平均数 (算例),【例6】设某银行有一笔20年的长期投资,其利率是按复利计算的,有1年为2.5%,有3年为 3%,有5年为6%,有8年为9%,有2年为12%, 有1年为5%,求平均年利率。

      调和平均数 (概念要点),集中趋势的测度值之一均值的另一种表现形式易受极端值的影响计算公式为简单调和平均数加权调和平均数,,调和平均数 (说明),加权调和平均,调和平均数 (算例),【例7】某人开车,前10公里以时速50公里驾驶,后10公里以时速30公里驾驶则此人跑这20公里的平均时速为:,【例8】某种蔬菜价格:早上0.4元/斤(x1),中午0.25(x2),晚上0.20(x3),若某人早、中、晚分别购买的金额是1元(m1)、2元(m2) 、3元(m3) ,求平均价格解:平均价格=总金额/总数量,调和平均数 (算例),,【例9】某种蔬菜价格:早上0.4元/斤(x1),中午0.25(x2),晚上0.20(x3),若某人早、中、晚分别买2.5斤(f1)、8斤(f2) 、15斤(f3) ,求平均价格解:平均价格=总金额/总数量,,调和平均数与算术平均数的区别,中位数 (概念要点),1.集中趋势的测度值之一2.排序后处于中间位置上的值,3.不受极端值的影响4 .各变量值与中位数的离差绝对值之和最小,即,中位数 (位置的确定),未分组数据: 中位数位置,组距分组数据:,,,未分组数据的中位数 (计算公式),数值型未分组数据的中位数 (5个数据的算例),原始数据: 24 22 21 26 20排 序: 20 21 22 24 26位 置: 1 2 3 4 5,中位数  22,,数值型未分组数据的中位数 (6个数据的算例),原始数据: 10 5 9 12 6 8排 序: 5 6 8 9 10 12位 置: 1 2 3 4 5 6 位置=,,根据位置公式确定中位数所在的组,设落入第 组采用下列近似公式计算,数值型分组数据的中位数 (要点及计算公式),数值型分组数据的中位数 (算例),【例10】根据右表中的数据,计算50 名工人日加工零件数的中位数,众 数 (概念要点),1.集中趋势的测度值之一2.出现次数最多的变量值:一组数据分布的最高峰点 3.不受极端值的影响4.可能没有众数或有几个众数,众 数 (众数的不唯一性),无众数 原始数据: 10 5 9 12 6 8,一个众数 原始数据: 6 5 9 8 5 5,多于一个众数 原始数据: 25 28 28 36 42 42,,计算该企业该日全部工人日产量的众数。

      单值型数列的众数 (算例),【例11】已知某企业某日工人的日产量资料如下:,数值型分组数据的众数 (要点及计算公式),1. 众数的值与相邻两组频数的分布有关,4. 该公式假定众数组的频数在众数组内均匀分布,2. 相邻两组的频数相等时,众数组的组中值即为众数,3. 相邻两组的频数不相等时,众数采用下列近似公式计算,数值型分组数据的众数 (算例),【例12】某市公寓房租金的统计资料如下表,试求房租金的众数,众数、中位数和 算术平均数的关系,,,,右(正)偏分布,,,众数,,中位数,,算术平均数,,,,,,,,,注: 对称图形,重叠左右偏时,均值变化最快,中位值次之,众值不变,数据的离中趋势,极差与平均差 方差与标准差 变异系数 四分位差 异众比率,极 差 (概念要点及计算公式),一组数据的最大值与最小值之差离散程度的最简单测度值易受极端值影响未考虑数据的分布,未分组数据 R = max(Xi) - min(Xi),计算公式为,极 差 (算例),原始数据: 10 5 9 12 6 8 排 序: 5 6 8 9 10 12极 差=12-5=7原始数据: 极 差=140-105=35,平均差 (概念要点及计算公式),离散程度的测度值之一各变量值与其均值离差绝对值的平均数能全面反映一组数据的离散程度数学性质较差,实际中应用较少,计算公式为,未分组数据,组距分组数据,平均差 (计算过程及结果),【例13】根据表4-6中的数据,计算工人日加工零件数的平均差,方差和标准差 (概念要点),1. 离散程度的测度值之一2. 最常用的测度值3. 反映了数据的分布4.反映了各变量值与均值的平均差异5.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差,。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.