
统计学15943.doc
11页第一章 一、统计数据的直接来源 1、普查(1)概念 为了某一特定目的而专门组织的一次性全面调查 2)特点 ①具有一次性和周期性一次性”是指调查现象在某一时点上的数据 ②规定统一的标准时点③仅用于反映国情国力的重大问题的调查第四节 统计数据的整理一、数据分组与统计汇总 一)概念 统计分组:按照某一个标志将统计总体划分为若干个性质不同的组成部分就叫统计分组 见第21-23页的表2.4、2.6、2.8统计汇总:在统计分组的基础上,将统计资料归并到各组中去,并计算出各组和总体的合计数的工作过程二)分布数列1、概念:统计分组和统计汇总后所形成的总体单位数在各组分布情况的数列 各组单位数叫频数或次数,各组次数在总次数所占的比重叫频率见第21-23页的表2.4、2、分布数列的分类(1)品质数列:按品质标志分组后所形成的分布数列2)变量数列:按数量标志分组后所形成的分布数列又分为: ①单项式变量数列:用一个数值代表一个组形成的数列 ②组距式变量数列:用变量值变动的一定范围来代表一个组 所形成的数列。
3、组距式变量数列中的几个基本概念(1)组限:表示各组界限的变量值大的叫上限,小的叫下限2)组距:各组上下限之间的距离 组距=上限-下限(3)等距数列:各组组距均相等的数列 异距数列:各组组距不完全相等的数列4)组中值:上下限之间中点的值 组中值=(上限+下限)/2=上限-组距/2 =下限+组距/2 “以上”、“以下”这样的组叫开口组一般假定开口组的组距与其相邻组的组距相等其组中值计算如下: 缺下限最小组的组中值=上限-相邻组组距/2 缺上限最大组的组中值=下限+相邻组组距/2见第43页的表2.15、第33页的表2.12注意:在组距式变量数列中,由于不知道各组中具体有哪些变量值,所以通常用各组的组中值来代表该组中的各个变量值5)全距:全体数据中最大标志值与最小标志值之差6)累计次数: 向上累计:从表的下方向表的上方依次对各组次数累计相加 向下累计:从表的上方向表的下方依次对各组次数累计相加见第24页的表2.10二、组距式变量数列的编制(以等距数列为例)步骤:(以第22页的【例2.1】为例) 1、排序 2、确定组距 (1)组距最好是5、10的倍数。
(2)组距要不断地试,直到表现出次数分布特征为止3、确定组限 注意:(1)组限最好是5、10的倍数; (2)最小组的下限应比最小的变量值略小;最大组 的上限应比最大的变量值略大3)相邻组的组限应重合4、统计汇总 注意:应坚持“上限不在组内”的原则四、次数分布曲线图的绘制(一)直方图(等距数列) 步骤:第一、在横轴上描出各组组限;在纵轴上描出各组频数(或频率); 第二,以各组组距为宽度,以各组频数(或频率)为高度绘出一组矩形三)次数分布的类型1、钟形分布越靠近变量值中点的变量值,其次数越多 (1)对称分布:以变量值的中点为对称轴的对称分布 (2)偏态分布 ①左偏分布;②右偏分布2、U形分布(又称生命曲线或浴盆曲线) 越靠近变量值中点的变量值,其次数越少3、J形分布 ①正J形分布:随着变量值的增加,次数不断地增加 ②反J形分布:随着变量值的增加,次数不断地 减少第1、20世纪初美国经济学家、统计学家洛伦茨(M.E. Lorentz)根据意大利经济学家巴雷特(V. Pareto)提出的收入分配公式绘制而成。
2、描述收入和财富分配性质 的曲线分析该国家或地区 分配的平均程度 五节 洛伦次曲线与基尼系数基尼系数 1、20世纪初意大利经济学家基尼(G. Gini)根据洛伦茨曲线给出了衡量收入分配平均程度的指标 2、A表示实际收入曲线与绝对平均线之间的面积 3、B表示实际收入曲线与绝对不平均线之间的面积 4、如果A=0,则基尼系数=0,表示收入绝对平均 5、如果B=0,则基尼系数=1,表示收入绝对不平均 6、基尼系数在0 和1之间取值 7、一般认为,基尼系数若小于0.2,表明分配平均;基尼系数在0.2至0.4之间是比较适当的,即一个社会既有效率又没有造成极大的分配不公;基尼系数在0.4被认为是收入分配不公平的警戒线,超过了0.4应该采取措施缩小这一差距 第2章 数据分布特征的描述(2) 二、中位数(Me)(一)概念 中位数是一组数据排序后,处于中间位置上的变量值 如一组数:x1、x2、x3、…、xn (二)中位数的确定 (1)对于未分组数据 步骤: 第一,对数据排序 第二,找出中位数所在的位置,该位置上的变量值就是中位数。
当n为奇数时,中位数就是第(n+1)/2位置上的变量值;当n为偶数时,中位数就是 中间位置上两个变量值相加除以2见第30页的例题(2)对于单项式变量数列 标志值 x 次数 f 向下累计次数Z x1 x2 x3 x4 . . . . xn f1 f2 f3 f4 . . . . fn Z1 Z2 Z3:中位数所在组 Z4 . . . . Zn 合 计 ∑f —步骤:第一,计算出向下累计次数第二,在累计次数中找出 所在的组,该组即为 中位数所在的组累计次数表示一个范围)第三,与该组相对应的变量值即为中位数。
3)对于组距式变量数列 分 组 次数 f 向下累计 向上累计 x1—x2 x2—x3 x3—x4 x4—x5 . . . . xn-1—xn f1 f2 f3 (fm) f4 . . . . fn Z1 Z2 (Sm-1) Z3 Z4 . . . . Zn Tn Tn-1 Tn-2 Tn-3 . . . T1 合 计 ∑f — —步骤:第一,计算出向下累计次数第二,在累计次数中找出 所在的组,该组即为中 位数所在的组 (累计次数表示一个范围)第三,采用公式进行计算见第31页的例题注意:众数和中位数是根据变量值在一组数中的位置来确定的,故称它们为位置平均数,它们不受极端值的影响。
四、均值(算术平均数, ) (一)简单算术平均数 当掌握的资料是未分组资料时,就计算简单算术平均数如一组数:x1、x2、x3、…、xn 则其算术平均数为;二)加权算术平均数当掌握的资料是分组资料时,就计算加权算术平均数1、 单项式变量数列分析:①f与 之间的关系f越大, 越靠近该组的变量值,f越小, 越远离该组的变量值, 说明f对 起一个权衡轻重的作用,故f叫权数因为 ,所以就权数的实质而言,f是通过其相对数形式 来起作用的,所以, 叫权重系数标志值 x 次数 f 标志总量 xf 比重 f/ ∑f x1 x2 x3 . . . . xn f1 f2 f3 . . . . fn x1f1 x2f2 x3f3 . . . . xn fn f1/ ∑f f2/ ∑f f3/ ∑f . . . . fn/ ∑f 合 计 ∑f ∑xf 1五 几何平均数(G1、概念 n个变量值 (一般是比率值) 连乘积的n次方根。
几何平均数的适用条件:当各变量值的总量等于各变量的乘积,而不相加时,对这些变量值求平均数,就应采用几何平均法,如求平均发展速度、平均合格率等2、几何平均数的计算(1)简单几何平均数(未分组的资料) 如一组数:x1、x2、x3、…、xn 见第35页的例题(2)加权几何平均数(分组资料) 标志值 x 次数 f x1 x2 x3 . . . . xn f1 f2 f3 . . . . fn 合 计 ∑f 七、几种平均数的关系对称分布: 左偏分布: 右偏分布:总结: 。
