统计第五章变异指标课件.ppt
55页第五章第五章 离中趋势测量法离中趋势测量法 主要内容主要内容:(:(1)变异指标;)变异指标;(2)全距;)全距;(3)平均差、标准差和标准分;)平均差、标准差和标准分;(4)绝对离势)绝对离势和相对离势;(和相对离势;(5)偏度离中趋势v所谓离中趋势离中趋势,是指数列中各变量值之间的差距和离散程度v例如有例如有A、B、C、D四组学生各四组学生各5人的成绩如人的成绩如下:下:A组:组:60,60,60,60,60 B组:组:58,59,60,61,62 C组:组:40,50,60,70,80 D组:组:80,80,80,80,80 数据显示,平均数相同,离势可能不同;数据显示,平均数相同,离势可能不同;平均数不同,离势可能相同平均数不同,离势可能相同变异指标v离中趋势用变异度指标来衡量.v变异度指标又称标志变动度指标,是综合反映总体各单位标志值及其分布的差异程度的指标v变异指标变异指标与平均指标相对应,从另一个侧面反映了与平均指标相对应,从另一个侧面反映了总体的特征总体的特征变异指标的作用v其主要作用是:v(1)说明平均数的代表性在相同平均数的情况下离势小,平均数的代表性高;离势大,平均数代表性低。
v(2)反映经济活动过程的均衡性、节奏性或稳定性变异指标如按数量关系来分有以下两类;v凡用绝对数来表达的变异指标,统称绝对离势凡用绝对数来表达的变异指标,统称绝对离势;v凡用相对数来表达的变异指标,统称相对离势凡用相对数来表达的变异指标,统称相对离势;主要有极差、平均差、四分位差、标准差等主要有异众比率、标准差系数、平均差系数和一些常用的偏态系数第一节第一节 全距全距1.全距全距(Range)对于未分组资料或者单项式分组资料对于未分组资料或者单项式分组资料 R=Xmax Xmin 例求74,84,69,91,87,74,69这些数字的全距解把数字按顺序重新排列:69,69,74,74,84,87,91,显然有 R=Xmax Xmin 916922全距(全距(全距(全距(R R):最大值和最小值之差也叫):最大值和最小值之差也叫):最大值和最小值之差也叫):最大值和最小值之差也叫极差极差极差极差全距越大,表示变动越大全距越大,表示变动越大全距越大,表示变动越大全距越大,表示变动越大运用上述方法计算左边数列的全距对分组资料,不能确知最大值和最小值,求全距:对分组资料,不能确知最大值和最小值,求全距:对分组资料,不能确知最大值和最小值,求全距:对分组资料,不能确知最大值和最小值,求全距:(1 1)用组值最大组的组中值减去最小组的组中值)用组值最大组的组中值减去最小组的组中值 (2 2)用组值最大组的上限减去最小组的下限)用组值最大组的上限减去最小组的下限 (3 3)用组值最大组的组中值减去最小组的下限;)用组值最大组的组中值减去最小组的下限;或最大组的上限减去最小组的组中值或最大组的上限减去最小组的组中值(常用的办法)优点:优点:缺点:缺点:计算简单、计算简单、计算简单、计算简单、直观。
直观1 1)受极端值影响大;)受极端值影响大;)受极端值影响大;)受极端值影响大;(2 2)没有量度中间各个单位间没有量度中间各个单位间没有量度中间各个单位间没有量度中间各个单位间的差异性,数据利用率低,信息丧的差异性,数据利用率低,信息丧的差异性,数据利用率低,信息丧的差异性,数据利用率低,信息丧失严重;失严重;失严重;失严重;(3 3)受抽样变动影响大,大样)受抽样变动影响大,大样)受抽样变动影响大,大样)受抽样变动影响大,大样本全距比小样本全距大因为大样本全距比小样本全距大因为大样本全距比小样本全距大因为大样本全距比小样本全距大因为大样本更可能包含最极端的值本更可能包含最极端的值本更可能包含最极端的值本更可能包含最极端的值.第二节第二节 平均差平均差(Mean absolute deviation)v要测定变量值的离中趋势,尤其是要测定各变量值相对于平均数的差异情况,一个很自然的想法就是计算各变量值与算术平均数的离差v平均差是平均差是各变量值与算术平均数(中位数)的离差绝对值的算术平均数.v由于各变量值与其算术平均数离差的代数和的值为0,所以采取算绝对值的办法;v能够全面反应一组数据的离散程度;能够全面反应一组数据的离散程度;v数学性质较差,实际运用的比较少;数学性质较差,实际运用的比较少;计算方法1.对于未分组资料对于未分组资料 A D=2.对于分组资料对于分组资料 A D=例1v1、试分别以算术平均数为基准,试分别以算术平均数为基准,v求求85,69,69,74,87,91,74这些数字这些数字的平均差。
的平均差例2:根据下表求平均差某车间某车间50名工人日加工零件标准差计算表名工人日加工零件标准差计算表按零件数分组按零件数分组组中值组中值(Xi)频数频数(f)|Xi-X|Xi-X|f105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.535814106415.710.75.70.74.39.314.347.153.545.69.843.055.857.2合计合计50312 练习:练习:试以算术平均数为基准,求下表所示数据的平均差试以算术平均数为基准,求下表所示数据的平均差计算左边数列的平均差平均差的性质平均差的性质v(1)虽然是变异指标,但是从算法上仍属于算术平均数;v(2)受抽样变动影响小、受极端值影响大、对于不确定组距要经过特殊处理;v(3)平均差不能用于其它的代数运算,理论意义不能给予很好的说明,标准差、方差的应用更好;v(4)使用的范围比较小;第三节第三节 标准差(标准差(standard deviation)各变量值对其算术平均数的离各变量值对其算术平均数的离各变量值对其算术平均数的离各变量值对其算术平均数的离差平方的算术平均数的平方根,又差平方的算术平均数的平方根,又差平方的算术平均数的平方根,又差平方的算术平均数的平方根,又称称称称均方差均方差,用用用用S S表示。
表示即克服平均差带有绝对值的缺即克服平均差带有绝对值的缺即克服平均差带有绝对值的缺即克服平均差带有绝对值的缺点,又保留其综合平均的优点点,又保留其综合平均的优点点,又保留其综合平均的优点点,又保留其综合平均的优点最常用的测度值,反应了各变量值最常用的测度值,反应了各变量值最常用的测度值,反应了各变量值最常用的测度值,反应了各变量值和均值的平均差异和均值的平均差异和均值的平均差异和均值的平均差异计算方法v对于未分组资料 求72、81、86、69、57这些数字的标准差2.对于分组资料对于分组资料 计算左边数列的标准差 例例 调查大一男生调查大一男生60人的身高情况如下表所示,求人的身高情况如下表所示,求他们身高的标准差他们身高的标准差解解 因为是分组资料,计算标准差运用加权式,并因为是分组资料,计算标准差运用加权式,并参见下表参见下表练习v假设一个班的成绩分布如下,求标准差分数分数人数人数60分以下260-70570-801080-902090-1003v标准差是反映总体各单位标志值的离散状况和差异程度的最佳测度v(1)以算术平均数为基准计算的标准差比以其他任何数值为基准计算的标准差要小为什么?)v“最小二乘方最小二乘方”性质性质各变量值对算术平均数的离差的平方和,必定小于他们对任何其他数偏差的平方和。
v(2)它将总体中各单位标志值的差异全包括在内,受抽样变动影响小但在受极端值影响以及处理不确定组距方面,缺点同算术平均数v(3)标准差同平均差一样,虽然都是变异指标,但是就其计算的数学方法来看,仍然是属于算术平均数;v(4)受抽样变动的影响小,受极端值影响,处理开放组距时要经过特殊处理3.3.标准差的性质标准差的性质标准差的性质标准差的性质方差方差v值得注意的是,在推论统计中我们将发现,方差是比标准差更有理论价值的概念v所谓方差方差,即标准差的平方,它直接写成 v 也常被称为变异数标准分(standardscore)以离差和标准差的比值来测定变量以离差和标准差的比值来测定变量 与与 的的相对位置使原来不能直接比较的离差标准化,可相对位置使原来不能直接比较的离差标准化,可以相互比较,加、减、平均以相互比较,加、减、平均1 1)Z Z是和是和是和是和X X一一对应的变量值;一一对应的变量值;一一对应的变量值;一一对应的变量值;(2 2)Z Z分数没有单位,是一个不受原资料单位影响分数没有单位,是一个不受原资料单位影响分数没有单位,是一个不受原资料单位影响分数没有单位,是一个不受原资料单位影响的相对数,所以可以用于不同单位资料的比较;的相对数,所以可以用于不同单位资料的比较;的相对数,所以可以用于不同单位资料的比较;的相对数,所以可以用于不同单位资料的比较;(3 3)Z Z分数实际表达了变量值距总体均值有几个标分数实际表达了变量值距总体均值有几个标分数实际表达了变量值距总体均值有几个标分数实际表达了变量值距总体均值有几个标准差。
准差Z分数也有标准正态变量之称按分数也有标准正态变量之称按Z值大小编制值大小编制出的正态分布表,其用途十分广泛出的正态分布表,其用途十分广泛Z分数的性质:分数的性质:Z Z Z Z分数之和等于分数之和等于分数之和等于分数之和等于0 0 0 0Z Z分数的算术平均数等于分数的算术平均数等于分数的算术平均数等于分数的算术平均数等于0 0Z Z分数的标准差等于分数的标准差等于分数的标准差等于分数的标准差等于1 1,方差也等于,方差也等于,方差也等于,方差也等于1 1三定则及其应用v社会经济统计是研究大量社会经济现象数量方面的在大量观察下,许多现象总体内的次数分布呈正态分布,即以平均数为中心,中间大,两头小的分布状态数理统计证明,在正态分布情况下:v可包括总体单位数的68.27%v可包括总体单位数的95.45%v可包括总体单位数的99.73%v这就是“三定则”当计算出平均数和标准差之后,便可利用三定则来推断次数分配的状况例子:v某车间100个工人日产量资料,已经计算出平均日产量=42.5件,标准差=8.87件,试推断日产量分布情况.v有68.27%工人日产量在33.63到51.37之间;有95.45%工人的日产量在24.76到60.24之间;有99.73%工人的日产量在15.89到69.11之间。
第四节第四节 相对离势相对离势上述各种反映离中趋势的变异指标,都具有和原资料相同的计算单位,称绝对离势但欲比较具有不同单位的资料的参差程度,或比较单位虽相同而均值不相同的资料的参差程度,离势的绝对指标则很可能导致某些错误结论所以,我们还得了解和学习相对离势相对离势相对离势v凡是用相对数来表达的变异指标,统称为相对离势,主要有异众比率、标准差系数、平均差系数等;比较具有不同单位的资料的参差程度;比较单位虽然相同而均值不相同的资料的参差程度;要想实现计量单位不同或者平均水平不一计量单位不同或者平均水平不一的对象之间的直接比较:绝对离势/平均指标相对离势;1.变异系数变异系数v绝对离势统计量与其算术平均数的比率,用绝对离势统计量与其算术平均数的比率,用V表示变异系数是最具有代表性的相对离势变异系数是最具有代表性的相对离势v全距系数v平均差系数v标准差系数v全距系数全距系数是众数据的全距与其算术平均数之比,其计算公式是v平均差系数平均差系数是众数据的平均差与其算术平均数之比,其计算公式是v标准差系数标准差系数是众数据的标准差与其算术平均数之比,其计算公式是2、异众比率(概念要点)v1.离散程度的测度值之一离散程度的测度值之一v2.非众数组的频数占总频数的比率非众数组的频数占总频数的比率v3.计算公式为计算公式为4.4.用于衡量众数的代表性用于衡量众数的代表性5.5.不仅用于定距变量不。





