
统计学课件:第三章 数据分布特征的统计描述.ppt
183页1 除了统计图和统计表之外,还可以用少量的特征值(代表值)对数据分布的数量规律进行精确、简洁的描述第三章第三章 数据分布数据分布特征的统计描述特征的统计描述2 大量的数据经过整理后,已经能初步反映总体分布的特征 为了更加准确的了解数据分布的特征和规律,需要找到反映数据分布特征的代表值 三类:集中趋势、离中趋势、分布形态说明:说明:3集中趋势:即反映各数据向中心值靠拢的程度返回本节首页集中趋势集中趋势 ( (位置位置) )4离中趋势:即反映各数据远离中心值的程度离中趋势离中趋势 ( (分散程度分散程度) )两个不同的曲线表示两个不同的总体,它们的两个不同的曲线表示两个不同的总体,它们的集中趋势相同但离中趋势不同集中趋势相同但离中趋势不同因为即使现象的集中趋势相同,其离中趋势也可能不同5实际中还会遇到:集中趋势和离中趋势均相同实际中还会遇到:集中趋势和离中趋势均相同的现象,其分布的形态也可能不同的现象,其分布的形态也可能不同这表明:除了集中和离中趋势外,分布还这表明:除了集中和离中趋势外,分布还有其他方面的特征:有其他方面的特征:分布的形态分布的形态指:数据分布的对称程度和扁平(高低)程度指:数据分布的对称程度和扁平(高低)程度测度指标是偏度测度指标是偏度测度指标是峰度测度指标是峰度是相对于是相对于对称分布对称分布而言而言相对于相对于正态分布正态分布而言而言6偏度:测定分布的偏斜程度的指标偏度:测定分布的偏斜程度的指标偏斜是相对于偏斜是相对于对称分布对称分布而言而言峰度:测定分布的高低(尖峭)程度的指标峰度:测定分布的高低(尖峭)程度的指标尖峭是相对于尖峭是相对于正态分布正态分布而言而言7偏态偏态(形状)(形状)峰态峰态 ( (形状形状) )正态分布正态分布对称分布对称分布8扁平分布扁平分布尖峰分布尖峰分布峰态峰态左偏分布左偏分布右偏分布右偏分布与正态分布与正态分布比较!比较!偏态偏态与对称分与对称分布比较布比较9正态分布中有两个参数:正态分布中有两个参数:一般记为:一般记为:、2 是正态分布的参数,不确定常数。
不同的、不同的2对应不同的正态分布10标准正态分布是正态分布中的一种标准正态分布是正态分布中的一种记为:记为:11本章内容本章内容v第一节 集中趋势的测度 v第二节 离散程度的测度 v第三节 偏度与峰度 12 第一节第一节 集中趋势的测度集中趋势的测度v集中趋势是指一组数据向其中心值靠拢的倾向v测度集中趋势就是寻找一组数据的代表值或中心值,在统计中是使用平均指标来测度的13本节内容本节内容v一、平均指标含义v二、平均指标的计算 (一)算术平均数 (二)调和平均数 (三)几何平均数 (四)众数 (五)中位数v三、各种平均数之间的相互关系数值平均数值平均位置平均位置平均14一、平均指标含义一、平均指标含义1、定义:又称平均数 是将同质总体内各单位的数量差异抽象化,以反映总体的一般水平被平均的对象必须具有同质性152 2、平均指标有两大类、平均指标有两大类数值平均数值平均: :位置平均位置平均: :根据总体内全部数据计算:算根据总体内全部数据计算:算术平均、调和平均、几术平均、调和平均、几 何平均何平均根据数据在分配数列中的位置根据数据在分配数列中的位置确定:众数、中位数确定:众数、中位数。
163 3、平均指标作用、平均指标作用 a、反映总体各单位变量值分布的集中趋势 b、比较同一现象在不同空间或不同时间的发展 水平 c、分析现象间的依存关系17集中趋势集中趋势: :v总体中各单位某一标志值的具体表现是各不相v同的,但一般呈正态分布,即很小或很大的标v志值出现的次数较少,接近平均数的标志值出v现的次数较多,大多数的标志值都围绕着平均v数左右波动返回本节首页18商场按销售额分(万元) 商场数 (家) 各组商品流通 费用率( %) 50以下 50200 200400 400600 600800 8001000 1000以上 25 70 130 75 40 18 10 11.2 10.4 9.9 6.7 5.9 5.5 5.0 注:流通费用率 = 费用额 / 销售额现象间的依存关系:19二、平均指标计算二、平均指标计算(一)算术平均数(一)算术平均数又称均值根据掌握的资料不同又称均值根据掌握的资料不同: : 简单法和加权法简单法和加权法201、简单法:适用于没有分组的原始数据均值,即算术平均数均值,即算术平均数x x 标志值或变量值标志值或变量值见见4949页例题页例题212、加权法:分组且各组标志值出现的次数 (权数 f )不相等时,公式:返回本节首页x x 为标志值,又称变量值;为标志值,又称变量值;f f 为各组标志值出现的次数为各组标志值出现的次数22计算平均日产量计算平均日产量23产量(件) x 人数 f xf192121232325252727292931202224262830146812102088144208336300合计-41109624用统计功能的计算器计算:2ndF,ON,201M+ 224M+ 246M+268M+ 2812M+ 3010M+, xM结果为26.7325例例1 1:用计算器对下列数据求平均:用计算器对下列数据求平均 x f 25 25 35 35 45 45 55 55 合计合计 10 10 70 70 90 90 30 30 200 20026vmode2vShift scl =v 25 Shift;10 DT 35 Shift;70 DT 45 Shift;90DT 55 Shift;30 DTvShift 注意:注意:DTDT是储存功能的加号是储存功能的加号27 注意:当各组权数均相等时,加权算术平均数等于简单算术平均数:返回本节首页28产量( x )人数( f )1213141510101010合计40可用简单式计算均值可用简单式计算均值各组权数都相等的数列各组权数都相等的数列29对称数列:对称数列:产量( x )人数( f )121314151531030103合计56可用简单式计算均值可用简单式计算均值303 3、权数、权数 加权均值的大小受两个因素的影响: 各组变量值(x) 各组次数,即权数(f)31(1 1)权数的定义)权数的定义权数:即次数,分布在各组间的总体单位数, 因为它对均值的大小起权衡轻重的作 用,故又称权数。
出现次数多的标志值对平均数的影响大32(2 2)权数的表现及应用)权数的表现及应用 绝对数权数 f 相对数权数 第一、权数表现:有两种形式:33绝对权数:绝对权数:相对权数:相对权数:计算公式:计算公式:例题见教科书例题见教科书5151页表页表333334第二、权数的实质第二、权数的实质 是相对数权数 即权数对均值的影响作用,取决于相对权数而非绝对权数举例:35计算平均奖金额等级奖金额(X)人数(F1)人数(F2)一等120812二等1004263三等903045合计80120虽然各组绝对人数变化了,但各组人数的比重未变比重%1037.552.5100364 4、平均数应用举例:、平均数应用举例: 统计中有三大综合指标: 总量指标、相对指标和平均指标反映现象总规模、总水平,用绝对数表示如:2010年中国GDP 39.8万亿元人民币相对指标是两个有联系的指标值对比的比率,如:三次产业比重、企业劳动生产率、产出的计划完成百分数、经济发展速度和增长速度37例1、10个企业资金利润率资料: 资金利润率 企业数n 企业资金(万元)f 0-1010-2020-30532100500800合计101400求:10个企业的平均利润率资金利润率 企业数n 企业资金(万元)fx xf利润额 0-1010-2020-3053210050080051525575200合计101400-280“企业的平均利润率” 等同于 “企业的总利润率” 企业的总利润率 = 利润总额 / 资金总额39利润总额利润总额资金总额资金总额40计划完成百分数 企业数 n 计划产值fx xf实际值105110110120120130307050570020500225001.0751.151.256127.52357528125合计15048700 -57827.5 计算150个企业的平均计划完成百分数例2、150个企业的资料:计划完成百分数 企业数 n 计划产值fx xf实际值105110110120120130307050570020500225001.0751.151.256127.52357528125合计15048700 -57827.5 “150个企业的平均计划完成百分数” 就是“150个企业总的计划完成百分数”。
企业总计划完成百分数 = 总实际数 / 总计划数42实际产值实际产值计划产值计划产值435 5、算术平均数的数学性质、算术平均数的数学性质v见52页44(二)调和平均数(二)调和平均数 1、含义:总体内各个变量值倒数的算术平均 数的倒数,又称倒数平均数如有三个变量值: 8、10、12,求调和平均数步骤如下:45、即为调和平均数公式:46(1)简单式:(2)加权式:各变量值出现次数相等各变量值出现次数不等 设设 mm为次数为次数2 2、 调和平均数的计算调和平均数的计算47举例举例: : 某蔬菜单价早中晚分别为0.5、0.4、 0.25(元/斤) (1)早中晚各买1元,求平均价格 (2)早中晚各买1斤,求平均价格 (3)早中晚各买2元、3元、4元,求平均价格 (4)早中晚各买2斤、3斤、4斤,求平均价格48(1)问:用调和平均先求早、中、晚购买的斤数早 1/0.5=2(斤) 、中 1/0.4=2.5(斤)、晚 1/0.25=4(斤) (2)问:用算术平均49(3)问:用加权调和平均(4)问:用加权算术平均503、调和平均数和算术平均数间的关系调和平均数是一种特殊的均值(1)两者存在着变形关系:51(2)当掌握的资料无法直接计算算术平均数时,可用调和法计算。
这时两者计算结果相同,只是根据已知条件不同,需选择不同的公式52 已知对比分母,将分母定为f,求分子xf,然后用加权算术公式,即: 已知对比分子,将分子定为m,求分母mx用加权调和公式,即 :53某公司下属三个部门销售利润资料部门销售利润率()x利润额(万元)m销售额mxA121201000B102002000C71051500合计-4254500求三个部门的平均利润率54思考:如果已知销售利润率和销售额资料,该如何计算?55部门销售利润率()x销售额(万元)利润额A121000B102000C71500合计-450056计算:计算:2020个商店平均销售计划完成程度及个商店平均销售计划完成程度及总的流通费用率总的流通费用率57计划完成百分数%计划百分数的组中值%(x1)实际销售额 (万元) (M或f )计划销售额(M/x)流通费用率%(x2)流通费用额(万元)(xf)809090100100110110120859510511545.968.434.494.354.072.032.882.014.813.212.011.06.799.034.1310.37合计-243.024.08-30.3258(1)20个商店的平均销售计划完成程度(2)20个商店总的流通费用率59(三)几何平均数(三)几何平均数1.定义: n 个变量值乘积的 n 次方根603 3、计算方法、计算方法简单法:简单法:加权法:加权法:61 例1:2004-2008年我国某工业品产量环比发展速度分别为107.6%、102.5%、100.6%、102.7%、102.2%。
计算平均每年的发展速度62按计算器:按计算器:1.076,1.076, ,1.025, ,1.025, ,1.006, ,1.006, ,1.027, ,1.027, ,1.022,=,2ndF,1.022,=,2ndF, 5,=, 5,=出现结果:出现结果:1.03091.0309即即103.1%103.1%63 例2:某厂有四个。
