
第四章-数据特征测度4-变异指标.ppt
34页4.4 标志变异指标标志变异指标-离散程离散程度的测度度的测度(Dispession) 一一.分类数据:异众比率分类数据:异众比率二二.顺序数据:四分位差顺序数据:四分位差三三.数值型数据:方差及标准差数值型数据:方差及标准差四四.相对位置的测量:标准分数相对位置的测量:标准分数五五.相对离散程度:离散系数相对离散程度:离散系数数据的特征和测度数据的特征和测度(本节位置本节位置)数据的特征和测度数据的特征和测度分布的形状分布的形状离散程度离散程度集中趋势集中趋势众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数均均均均均均 值值值值值值离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰峰峰 度度度度度度四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率偏偏偏偏偏偏 态态态态态态离中趋势离中趋势(离散趋势离散趋势)1.数据分布的另一个重要特征数据分布的另一个重要特征2.反映各变量值远离其中心值的程度(离散程度)反映各变量值远离其中心值的程度(离散程度)3.从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度4.不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值一、标志变异指标的概念和作用一、标志变异指标的概念和作用1概念概念 标志变异指标是反映变量分布离散趋势、与平均指标相匹配的指标。
2作用作用 (1)反映变量分布的离散趋势; (2)是对平均数的代表性程度的量度; (3)是对事物发展均衡性的量度二、标志变异指标的计算二、标志变异指标的计算(一)极差(全距)(二)平均差(三)标准差和方差(四)离散系数(五)离中趋势的其他测度量 异众比率 四分位差数值性数据分类数据顺序数据标准分数 相对位置的测量(一)极差(一)极差(range)1.一组数据的最大值与最小值之差一组数据的最大值与最小值之差2.离散程度的最简单测度值离散程度的最简单测度值3.易受极端值影响易受极端值影响4.未考虑数据的分布未考虑数据的分布7 7 8 8 9 910107 7 8 8 9 9 1010 R R = max(= max(x xi i) - min() - min(x xi i) )5.计算公式为计算公式为(二)平均差(二)平均差(mean deviation)1.各变量值与其均值离差绝对值的平均数各变量值与其均值离差绝对值的平均数2.能全面反映一组数据的离散程度能全面反映一组数据的离散程度3.数学性质较差,实际中应用较少数学性质较差,实际中应用较少4.计算公式为计算公式为未分组数据未分组数据未分组数据未分组数据组距分组数据组距分组数据组距分组数据组距分组数据平均差平均差 (例题分析例题分析)某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表 按销售量分组按销售量分组按销售量分组按销售量分组组中值组中值组中值组中值( (MMi i) )频数频数频数频数( (f fi i) )1401501401501501601501601601701601701701801701801801901801901902001902002002102002102102202102202202302202302302402302401451451551551651651751751851851951952052052152152252252352354 49 9161627272020171710108 84 45 540403030202010100 0101020203030404050501601602702703203202702700 0170170200200240240160160250250合计合计合计合计12012020402040平均差平均差 (例题分析例题分析) 含义:含义:每一天的销售量平均数相比, 平均相差17台(三)标准差和方差(三)标准差和方差(standard deviation and variance)1.标准差是各变量值与其均值离差平方的算术平均数的平方根。
标准差的平方为方差2.数据离散程度的最常用测度值3.反映了各变量值与均值的平均差异4.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4 6 8 10 124 6 8 10 12 x x = = 8.38.3总体方差和标准差总体方差和标准差 (population (population variancevariance and and standard deviationstandard deviation) )方差的计算公式方差的计算公式方差的计算公式方差的计算公式未分组数据:未分组数据:组距分组数据:组距分组数据:组距分组数据:组距分组数据:未分组数据:未分组数据:标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式样本方差和标准差样本方差和标准差 (simple (simple variancevariance and and standard deviationstandard deviation) )未分组数据:未分组数据:组距分组数据:组距分组数据:未分组数据:未分组数据:组距分组数据:组距分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式注意:注意:注意:样本方差用自样本方差用自样本方差用自由度由度由度n-1n-1n-1去除去除去除! !样本方差样本方差自由度自由度(degree of freedom)1.1.一组数据中可以自由取值的数据的个数一组数据中可以自由取值的数据的个数2.2.当当样样本本数数据据的的个个数数为为 n n 时时,若若样样本本均均值值 x x 确确定定后后,只只有有n n-1-1个个数数据据可可以以自自由由取取值值,其其中中必必有有一一个个数数据据则则不能自由取值不能自由取值3.3.例例如如,样样本本有有3 3个个数数值值,即即x x1 1=2=2,x x2 2=4=4,x x3 3=9=9,则则 x x = = 5 5。
当当 x x = = 5 5 确确定定后后,x x1 1,x x2 2和和x x3 3有有两两个个数数据据可可以以自自由由取取值值,另另一一个个则则不不能能自自由由取取值值,比比如如x x1 1=6=6,x x2 2=7=7,那么,那么x x3 3则必然取则必然取2 2,而不能取其他值,而不能取其他值4.4.样样本本方方差差用用自自由由度度去去除除,其其原原因因可可从从多多方方面面来来解解释释,从从实实际际应应用用角角度度看看,在在抽抽样样估估计计中中,当当用用样样本本方方差差s s2 2去估计总体方差去估计总体方差 2 2时,时, s s2 2是是 2 2的无偏估计量的无偏估计量样本标准差样本标准差 (例题分析例题分析)某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表 按销售量分组按销售量分组按销售量分组按销售量分组组中值组中值组中值组中值( (MMi i) )频数频数频数频数( (f fi i) )1401501401501501601501601601701601701701801701801801901801901902001902002002102002102102202102202202302202302302402302401451451551551651651751751851851951952052052152152252252352354 49 9161627272020171710108 84 45 540403030202010100 0101020203030404050501601602702703203202702700 0170170200200240240160160250250合计合计合计合计1201205540055400样本标准差样本标准差 (例题分析例题分析) 含义:含义:每一天的销售量与平均数相比, 平均相差21.58台 方差或标准差是根据全部数据计算的,它反映了每个数据与其均值相比平均相差的数值,因此能准确地反映出数据的离散程度。
此外方差具有许多优良的数学性质四)离散系数(四)离散系数(coefficient of variation)1. 标准差与其相应的均值之比2.对数据相对离散程度的测度3.消除了数据水平高低和计量单位的影响4. 用于对不同组别数据离散程度的比较5. 计算公式为离散系数离散系数 (例题分析例题分析)某管理局所属某管理局所属某管理局所属某管理局所属8 8家企业的产品销售数据家企业的产品销售数据家企业的产品销售数据家企业的产品销售数据企业编号企业编号企业编号企业编号产品销售额(万元)产品销售额(万元)产品销售额(万元)产品销售额(万元)x x1 1销售利润(万元)销售利润(万元)销售利润(万元)销售利润(万元)x x2 21 12 23 34 45 56 67 78 8170170220220390390430430480480650650950950100010008.18.112.512.518.018.022.022.026.526.540.040.064.064.069.069.0【 例例例例 】某某管管理理局局抽抽查查了了所所属属的的8 8家家企企业业,其其产产品品销销售售数数据如表。
试比较产品销售额与销售利润的离散程度据如表试比较产品销售额与销售利润的离散程度离散系数离散系数 (例题分析例题分析)结结论论: 计算结果表明,v1v2,说明产品销售额的离散程度小于销售利润的离散程度 v v1 1= =536.25536.25309.19309.19= =0.5770.577v v2 2= =32.521532.521523.0923.09= =0.7100.710概概 念念 计计 算算 特特 点点 1 1. .极差极差 (R R) 数列中最大值与最小数列中最大值与最小值之差值之差 R=R=最最 大大 值值 - -最小值最小值优点:容易理解,计算方便优点:容易理解,计算方便缺缺点点:不不能能反反映映全全部部数数据据分分布状况布状况 2 2. .平均差平均差 (MMd d) 各变量值与均值离差各变量值与均值离差绝对值的算术平均绝对值的算术平均 优优点点:反反映映全全部部数数据据分分布布状状况况缺缺点点:取取绝绝对对值值,数数字字上上不不尽合理尽合理 3 3. .方差(方差(2 2) 和标准差和标准差( () ) 各各变变量量值值与与均均值值离离差差平方的平均平方的平均方差的平方根(取正方差的平方根(取正根)根) 优优点点:反反映映全全部部数数据据分分布布状状况,数字上合理。
况,数字上合理缺缺点点:受受计计量量单单位位和和平平均均水水平影响,不便于比较平影响,不便于比较 4 4标准差标准差 系系 数数 (V V) 标准差与均值之商,标准差与均值之商,是无量纲的系数是无量纲的系数 优优点点:适适宜宜不不同同数数据据集集的的比比较较缺缺点点:对对数数据据结结构构变变化化反反应应不灵敏不灵敏 方差(方差(2 2)和)和标准差(标准差()是应)是应用最广的用最广的标志变异指标标志变异指标顺序数据:四分位差顺序数据:四分位差(五)离中趋势的其他测度量(五)离中趋势的其他测度量定类数据:异众比率定类数据:异众比率相对位置的测量:标准分数相对位置的测量:标准分数1. 异众比率异众比率(variation ratio)1. 对分类数据离散程度的测度2. 非众数组的频数占总频数的比率3. 计算公式为 4. 用于衡量众数的代表性异众比率异众比率 (例题分析例题分析)解:解:解:解: 在在所。












