
分配数列-统计表-统计图.ppt
86页单击此处编辑母版标题样式,,几,,*,,,《,统计学,》,,,第,2,章 统计整理,,,,菏泽学院经济系,第,5,节 分配数列,2024/10/8,课程回顾,一、统计分组的概念,,二、统计分组的目的,,三、统计分组的作用,,四、统计分组标志选择的原则,,五、统计分组的分类,2024/10/8,一、分配数列的概念和种类,(一)分配数列的概念,,是在分组的基础上,把总体的所有单位按组归类整理,并按一定的顺序排列,形成总体中各个单位在各组间的分布,又称次数分配次数:分布在各组的个体单位数,又称为频数;,,总次数:全部总体单位数;,,比率:各组次数与总次数之比,又称为频率2024/10/8,分组标志的具体表现,,各组的次数或频率,,构成要素,(二),分配数列构成要素,2024/10/8,,例,月工资分组,(,元,),工人数,(,人,),占总数比重,(%),2000,以下,210,39.6,2000-2500,187,35.3,2500,以上,133,25.1,合 计,530,100.0,,组别,(,变量,),频数,(,次数,),频率,(,比率,),2024/10/8,思考: 分配数列与分组的区别?,,,分配数列是在分组的基础上加上次数(频数)的分布。
2024/10/8,(三)分配数列的分类,1.,品质分配数列,,指按品质标志对总体分组形成的数列,简称为品质数列2.,变量分配数列,,指按数量标志对总体分组形成的数列,简称为变量数列按照标志的性质不同,2024/10/8,(三)分配数列的分类,异距数列,等距数列,,变量数列,,离散型变量数列,连续型变量数列,变量数列,,单项数列,组距数列,2024/10/8,(一) 品质数列,二、分配数列的编制,,编制品质数列,只要根据统计研究目的,正确选择分组标志,确定分组标准,则事物性质的差异可以明确地表现出采,也就容易划分总体中各组的性质界限因此,在通常情况下,品质数列能够较准确地反映总体各单位的分布状态和特征,2024/10/8,,某班学生的性别构成情况,,,例,按性别分组,绝对数人数,比重,(%),男,30,75,女,10,25,合计,40,100,,组别 次数 频率,2024/10/8,(二)变量数列,,,按数量标志分组,就是将变量值即数量标志值划分为不同的区段,通过各组的数量差别和变化来区分现象的不同性质,反映总体各单位在各组间的分布状态和特征2024/10/8,1.,单项数列,指每个组值只用一个具体的变量值表现的数列,同时,,具备,变量是离散变量,,变量的不同取值个数较少,,(2),编制条件,:,(1),概念,(3),编制步骤,a.,将原始资料按照变量值大小顺序排列。
b.,按变量值分为若干组c.,设计综合表(整理表),整理出变量值出现的次数,2024/10/8,,己知某车间有,24,名工人,他们的日产量(件)分别是:,20,,,23,,,20,,,24,,,23,,,21,,,22,,,25,,,26,,,20,,,21,,,21,,,22,,,22,,,23,,,22,,,22,,,24,,,25,,,21,,,22,,,21,,,24,,,23.,要求根据以上资料编制变量数列例】,20,20,20, 21,21,21,21,21, 22,22,22,22,22,22,,,23,23,23,23, 24,24,24, 25,25, 26,,,排序后,2024/10/8,日产量(件),X,工人数(人,),f,20,,21,,22,,23,,24,,25,,26,,,,,,合计,,编制结果如下:,3,5,6,4,3,2,1,24,2024/10/8,2.,组距数列,指每个组的变量值用一个区间来表现的变量数列,变量是连续变量,;,,或:,总体单位数较多变量不同取值个数也较多的离散变量,2),编制条件,:,(1),概念,2024/10/8,2.,组距数列,(3),组距数列编制的步骤,:,a.,排序,计算全距。
b.,确定组数、组距c.,确定组限及其表示法d.,计算频数、频率e.,制作组距数列统计表2024/10/8,组距式分布数列的有关概念,指每组两端表示各组界限的变量值,各组的最小值为,下限,,最大值为,上限组限,每组变量值变动区间的长度,为上下限之差,组距,每组变量取值范围的中点数值,,组中值,2024/10/8,开口式组距数列组中值的计算:,,首组假定下限=首组上限-相邻组组距,,末组假定上限=末组下限+相邻组组距,先计算开口组的假定上、下限:,,因此有:,,,首组,,组中值,,,末组,,组中值,2024/10/8,某地区,100,个百货商店,,月销售额与流通费用情况,销售额(万元),商店数(个),每百元商品销售额中支付的流通费(元),50,以下,,50,~,100,,100,~,200,,200,~,300,,300,以上,10,,20,,30,,25,,15,14.2,,11.4,,10.1,,9.2,,8.5,组中值,=,U-d/2,,=50-25=25,组中值,=L+d/2,,=300+100/2,,=350,2024/10/8,组距数列的几个具体步骤解释,a.,求全距,b.,确定组距及组数,确定组距的原则:,要能区分各组的性质差异,,要能反映总体资料的分布特征,,为方便计算,尽可能为,5,,,10,,,50,,,100,,,500,的整数倍,R≤,组距,(d) ×,组数(,k),2024/10/8,等距数列与异距数列,等距数列,,各组组距均相等,一般适用于变量值比较均匀的情况。
异距数列,,各组组距不全相等,不常用2024/10/8,异距数列适用于,1.,标志值分布很不均匀的场合,在分布比较密集的区间内使用较短的组距,在分布比较稀少的部分使用较长的组距2.,等量的标志值具有不同意义的场合,例:进行人口疾病研究的年龄分组,应采用异距分组,即:,1,岁以下按月分组,,1-10,岁按照年龄分组,,11-20,按照,5,年分组,,21,岁以上按照,10,年分组等2024/10/8,异距数列适用于,3.,标志值按一定比例发展变化的场合,例: 大城市百货商店营业额差别很大的,比如营业额从,5,万到,5,千万元,可采取公比为,10,的不等距分组,即:,5-50,万元,,50-500,万元,,500-5000,万元,如果采用等距分组,即便组距为,100,万元,也得分,50,组,显然是不合适的2024/10/8,计算组数(,组数不宜过多,也不宜太少),(当 的结果为整数时),(当 的结果为小数时),2024/10/8,组数的经验公式,,如果现象近似于正态分布,则可参考美国统计学家 斯特杰斯提出的分组数的经验公式:,组数(,K,),=1+3.322lgN,其中,,N,为总体单位数。
2024/10/8,c.,确定组限及其的表示方法,对于离散变量,相邻组组限可以,间断,,也可,重叠,;,,对于连续变量,相邻组组限,必须重叠,;,,符合“,上组限不计入,”原则;,,首末两组可使用“,××,以下,”及“,××,以上,”的开口组组限的表示方法,2024/10/8,例,,工业企业按照职工人数分组可以表示为:,,499,人以下,,500-999,人,,1000-1999,人,,2000,人以上等工业企业按照职工人数分组可以表示为:,,500,人以下,,500-1000,人,,1000-2000,人,,2000,人以上等,.,2024/10/8,实例,2024/10/8,己知某地区某年,50,个商店商品销售额的资料如下(单位:百万元):,,,7.4,12.6,29.0,,2.0,12.4,7.0,14.8,17.5,,15.0,,18.2,,18.7,,15.5,12.8,26.0,,17.3,,8.3,14.7 12.0,3.5,,6.8,,25.0,,19.3,,6.4,,4.0,11.9,8.5,13.2 14.5,17.1,,15.6,13.4,4.5,,9.5,,20.0,,15.7,,6.0,11.4,23.0,14.2,16.7,,21.0,,16.0,13.6,10.0,13.9,5.0,,5.8,10.5,16.3,,22.0,,要求编制组距数列。
2024/10/8,编制步骤:,⒈,求变异全距,⒉,确定组距及组数,R≤,组距,(d) ×,组数(,k),上例中,取,d=5,,则有,⒊,确定组限,2024/10/8,编制等距数列,适用于总体单位的标志值变动比较均匀的情况,实例,己知某地区某年,50,个商店商品销售额的资料如下(单位:百万元):,,,7.4,12.6,29.0,,2.0,12.4,7.0,14.8,17.5,,15.0,,18.2,,18.7,,15.5,12.8,26.0,,17.3,,8.3,14.7 12.0,3.5,,6.8,,25.0,,19.3,,6.4,,4.0,11.9,8.5,13.2 14.5,17.1,,15.6,13.4,4.5,,9.5,,20.0,,15.7,,6.0,11.4,23.0,14.2,16.7,,21.0,,16.0,13.6,10.0,13.9,5.0,,5.8,10.5,16.3,,22.0,,要求编制组距数列2024/10/8,⒋,计算次数,编制结果:,,销售额(百万元),商店数,5,以下,,5,~,10,,10,~,15,,15,~,20,,20,~,25,,25,以上,,,,,,合计,50,4,10,16,13,4,3,,2024/10/8,,销售额(百万元),商店数,频率(﹪),5,以下,,5,~,10,,10,~,15,,15,~,20,,20,~,25,,25,以上,4,,10,,16,,13,,4,,3,8,,20,,32,,26,,8,,6,合计,50,100,频率,各组单位数占总体单位总数的比重,,2024/10/8,2024/10/8,,,休息是为了走更长的路,,,累了,,,迷茫时,,,就坐下来,,,静静地,,,想想未来路的方向,…,2024/10/8,,从变量值低的组开始,将各组次数和比率逐次向变量值高的组累计。
组距数列中的向上累计,表明各组上限以下总共所包含的总体次数和比率有多少三、累计次数分布,(一)向上累计(以下累计、或较小制累计),2024/10/8,,从变量值高的组开始,将各组次数和比率逐次向变量值低的组累计组距数列中的向下累计,表明各组下限以上总共所包含的总体次数和比率由多少二)向下累计,2024/10/8,,销售额(百万元),商店数,频率(﹪),累计次数,,累计频率(﹪),,,,,,,,,5,以下,,5,~,10,,10,~,15,,15,~,20,,20,~,25,,25,以上,4,,10,,16,,13,,4,,3,8,,20,,32,,26,,8,,6,,,,,合计,50,100,,,,,2024/10/8,,销售额(百万元),商店数,频率(﹪),累计次数,,累计频率(﹪),,,,,向下累计,,向下累计,,5,以下,,5,~,10,,10,~,15,,15,~,20,,20,~,25,,25,以上,4,,10,,16,,13,,4,,3,8,,20,,32,,26,,8,,6,4,,14,,30,,43,,47,,50,,8,,28,,60,,86,,94,,100,,合计,50,100,—,,—,,,,2024/10/8,,销售额(百万元),商店数,频率(﹪),累计次数,,累计频率(﹪),,,,,向下累计,向上累计,向下累计,向上累计,5,以下,,5,~,10,,10,~,15,,15,~,20,,20,~,25,,25,以上,4,,10,,16,,13,,4,,3,8,,20,,32,,26,,8,,6,4,,14,,30,,43,,47,,50,50,,46,,36,,20,,7,,3,8,,28,,60,,86,,94,,100,100,,92,,72,,40,,14,,6,合计,50,100,—,—,—,—,,,2024/10/8,按完成定额分组,,工人人数,,频率(﹪),累计次数,,累计频率(﹪),,,,,,,,,100,以下,,100,~,110,,110,~,120,,120,~,130,,130,~,140,,140,~,150,,150,~,160,5,,10,,11,,8,,3,,2,,1,12.5,,25,,27.5,,20,,7.5,,5,,2.5,,,,,合计,40,100,—,—,—,—,2024/10/8,按完成定额分组,,工人人数,,频率(﹪),累计次数,,累计频率(﹪),,,,,向下累计,向上累计,向下累计,向上,,累计,100,以下,,100,~,110,,110,~,120,,120,~,130,,130,~,140,,140,~,150,,150,~,160,5,,10,,11,,8,,3,,2,,1,12.5,,25,,27.5,,20,,7.5,,5,,2.5,5,,15,,26,,34,,37,,39,,40,40,,35,,25,,14,,6,,3,,1,12.5,,37.5,,65,,85,,92.5,,97.5,,100,100,,87.5,,62.5,,35,,15,,7.5,,2.5,合计,40,100,—,—,—,—,2024/10/8,,当我们所关心的是标志值较小的现象的次数分布情况时,通常用向上累计;,,,当我们所关心的是标志值较大的现象的次数分布情况时,通常用向下累计;,,2024/10/8,四、图示法,,即用统计图来表示次数分配,,直方图,,多边形图,2024/10/8,(一),直方图,,用,矩形的宽度和高度,来表示次数分配的图形。
它是最常用的次数分配的图示法绘制直方图时,横轴表示各组组限,纵轴表示频数(一般标在图的左方)和频率(一般标在图的右方),如没有频率则只保留左侧频数按分布在各组的频数及频率确定各组在纵轴上的坐标,并依据各组组距的宽度与频数的高度绘成矩形2024/10/8,,,,,VAR00001,174.0,170.0,166.0,162.0,158.0,154.0,40,30,20,10,0,Std. Dev = 4.86,Mean = 163.3,N = 83.00,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,用矩形的宽度和高度来表示频数分布的图形,,,2024/10/8,(一),直方图,仍以某班应用统计学考试成绩数据,画成如下直方图:,,40,50,60,70,80,90,100,110,2024/10/8,若,组距不等的话,用标准组距人数,然后据此画直方图:,按工人年龄分组,,(岁),组距,人数,,(人),标准组距人数,,(,人,),频数密度,,=,频数,/,组距,15-20,5,17,17,3.4,20-25,5,28,28,5.6,25-30,5,40,40,8.0,30-35,5,70,70,14.0,35-45,10,65,32.5,6.5,45-50,5,10,10,2.0,合 计,-,230,-,-,2024/10/8,直方图,,例,10,15,20,25,30,35,40,45,50,55,,2024/10/8,(二)次数多边形,图,在直方图的基础上连接各条形顶边的中点成折线图。
如下图红笔围成的,即为次数分配,多边形,图,,(次数折线图):,,40,50,60,70,80,90,100,110,2024/10/8,条形图,(,Bar,),用于显示离散型变量的次数分布,2024/10/8,条形图,(,Bar,),用于显示离散型变量的次数分布,2024/10/8,条形图,(,Bar,),用于显示离散型变量的次数分布,2024/10/8,圆形图,(,饼图,,Pie,,),主要用于显示定类变量的次数分布,2024/10/8,2024/10/8,2024/10/8,线图,(,Line,),主要用于显示连续型变量的次数分布和现象的动态变化,2024/10/8,散点图(,Scatter,),主要用来观察变量间的相关关系,也可显示数量随时间的变化情况,2024/10/8,,各种不同性质的社会经济现象都有着特殊的次数分布概括起来,主要有下列四种类型:,,钟形分布,,水平分布,,U,形分布,,J,形分布,,五、次数分布的主要类型,2024/10/8,,钟形分布的符征是“两头小、中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少绘成曲线图,宛如一口古钟一) 钟形分布,2024/10/8,,钟形分布具体可分为对称分布和非对称分布。
对称分布的特征是中间变量值分布的次数最多,两侧变量值分布的次数则随着与中间变量值距离的增大而渐次减少,并且围绕中心变量值两侧呈对称分布2024/10/8,,对称分布中的正态分布最为重要,许多社会经济现象统计总体的分布都趋近于正态分布例如,农业平均亩产量的分布、零件公差的分布、商品市场价格的分布等正态分布在社会经济统计学中具有重要意义2024/10/8,,,在非对称的分布中,有不同方向的偏态,,,如图,:,2024/10/8,,,水平分布的特征是总体内各个变量值分布的次数大体相等,绘成图形,表现为一条平行于横铀的水平线,如图,:,,(二),水平分布,2024/10/8,,例如,某些必需而用途又比较狭窄的商品,(,如丧葬用品,),的价格,需求弹性小,不论价格如何变化,而需求量变动不大需求量按价格水平分组便呈现水平分布现实生活中严格的水平分布是比较少见的,但对这种分布的研究,在统计理论上有着特殊的意义2024/10/8,U,形分布的待征与钟形分布恰恰相反,靠近两端的变量值分布的次数多,靠近中间的变量值分布的次数少,形成“两头高、中间低”的分布持征绘成曲线图,象英文字母“,U”,字图形如,:,。
三),U,形分布,2024/10/8,,有些社会经济现象的分布表现为,U,形分布,例如人口死亡率分布由于人口总体中幼儿死亡人数和老年死亡人数均较高,而中年死亡人数最低,因而按年龄分组的人口死亡率便表现为,U,形分布2024/10/8,J,形分布有两种类型正,J,形分布是次数随着变量值的增大而增多,绘成曲线图,,,犹如英文字母“,J,”,字反,J,形分布是次数随着变量值的增大而减少,绘成曲线图,犹如反写的英文字母“,J”,字,图形如下:,(四),J,形分布,,2024/10/8,,在社会经济现象中,有一些统计总体呈,J,形分布例如,资本主义社会中,投资额按利润率大小分布,一般均呈正,J,形分布;而人口总体按年龄大小分布,则一般均呈反,J,分布2024/10/8,第五节 统计表,一、统计表的概念与作用,,二、统计表的结构,,三、统计表的分类,,四、宾词指标的设计,,五、编制统计表应注意的问题,2024/10/8,,一、统计表的概念与作用,(一)统计表的概念,,,把统计调查得来的数字资料,经过汇总整理后,得出一些系统化的统计资料,将其按一定顺序填列在一定的表格内,这个表格就是统计表以纵横交叉的线条所形成的表格来表现统计资料的形式。
2024/10/8,(二)统计表的作用,,1.,代替冗长的文字叙述,简明、有条理地罗列数据与统计量,方便阅读、比较与计算;,,,,2.,展示数据的结构、分布和主要特征,便于在进一步分析中选择与计算统计量2024/10/8,二、统计表的结构,(一)从内容上,统计表由主词和宾词两部分组成,1.,主词: 统计表所要说明的总体及其分组2.,宾词: 统计表所要说明的总体的统计指标2024/10/8,(二)从构成要素上,统计表包括三部分,1.,总标题,2.,分标题(标目),,横行标题,纵栏标题,3.,纵、横栏组成的本身及表中的数字,必要的附注和注明资料的来源,2024/10/8,某地区,100,个百货商店,,月销售额与流通费用情况,,按销售额分组(万元),商店数(个),每百元商品销售额中支付的流通费(元),50,以下,,50,~,100,,100,~,200,,200,~,300,,300,以上,10,,20,,30,,25,,15,14.2,,11.4,,10.1,,9.2,,8.5,宾词,主词,纵行标题,横行标题,指标数值,总标题,2024/10/8,三、统计表的种类,(一)简单表,,(二)分组表,,(三)复合表,2024/10/8,(一)简单表,,表的主词未经任何分组的统计表。
表的主词一般按时间顺序或按总体各单位名称排列2024/10/8,(二)分组表,表的主词按照某一标志进行分组的统计表,2024/10/8,(三)复合表,表的主词按照两个或两个以上标志进行复合分组的统计表2024/10/8,四、宾词指标的设计,(,一,),简单设计,,,(二)复合设计,2024/10/8,将宾词指标做平行配置,一一排列,(,一,),简单设计,2024/10/8,把各个指标结合起来,做层叠配置,分层排列二)复合设计,2024/10/8,五、编制统计表应注意的问题,(一)统计表的标题应简明确切,总标题要能概括表的基本内容,并表明资料所属的地区和时间二)表中主词各行和宾词各栏的次序排列应当合理有序三)表中必须,注明,数字资料的,计量单位,(四)表中数字上下位置要,对齐,2024/10/8,五、编制统计表应注意的问题,(五),统计表的表式,一般是,开口式,,即表的左右两端不画纵线,表的上下通常用粗线封口如果统计表栏数较多,为了更清晰地表明各栏之间的计算关系和便于进行文字说明,可在主词栏用甲、乙、丙、丁等文字标明,在宾词指标各栏用数字编号六)必要时,统计表应加以,注解,,连同数字的资料来源等一般都写在表的下端。
2024/10/8,谢谢大家!,2024/10/8,。
