SAS软件与统计应用教程 教学课件 ppt 作者 汪远征 徐雅静 ch2
80页1、第二章 SAS的描述统计功能,2.1 描述性统计的基本概念 2.2 在SAS中计算统计量 2.3 统计图形,2.1 描述性统计的基本概念 2.1.1 统计学的基本概念 2.1.2 表示数据位置的统计量 2.1.3 表示数据分散程度的统计量 2.1.4 表示数据分布形状的统计量 2.1.5 其它统计量,2.1.1 统计学的基本概念 1. 总体与样本 总体(population):总体是指所研究对象的全体组成的集合。 样本(sample):样本是指从总体中抽取的部分对象(个体)组成的集合。样本中包含个体的个数称为样本容量。容量为n的样本常用n个随机变量X1,X2,Xn表示,其观测值(样本数据)则表示为x1,.,xn,为简单起见,有时不加区别。,2. 参数与统计量 参数(parameter):参数是用来描述总体特征的概括性值。如总体平均值()、总体方差(2)、总体比例()等。 统计量(statistics):统计量是用来描述样本特征的概括性值。如样本均值( )、样本方差(s2)、样本比例(P)等。,2.1.2 表示数据位置的统计量 如果要用简单的数字来概括一组观测数据x1,.,xn,可以使用
2、“位置统计量”来作为数据的总体代表,常见的位置统计量有:均值、中位数、分位数、众数等。 1. 均值(Mean) 均值是所有观测值的平均值,是描述数据取值中心位置的一个度量:,2. 中位数(Median或Med) 中位数是描述观测值数据中心位置的统计量,大体上比中位数大(小)的数据为观测值的一半。中位数的一个优点是它不受个别极端数据的影响,具有稳健性。中位数的计算方法是:首先将数据从小到大排序为:x(1),.,x(n),然后计算,3. 众数(Mode) 观测值中出现最多的数称为众数。众数用得不如均值和中位数普遍。在属性变量分析中,常需考虑频数,因此众数用得多些。 4. 百分位数(Percentile) 分位数也是描述数据分布和位置的统计量。0.5分位数就是中位数,0.75分位数和0.25分位数又分别称为上、下四分位数,并分别记为Q3和Q1。,2.1.3 表示数据分散程度的统计量 1. 极差(Range)与半极差(Interquartile range) 极差就是数据中的最大值和最小值之间的差: 极差 = maxxi minxi 上、下四分位数之差Q3 Q1称为四分位极差或半极差,它描述了
3、中间半数观测值的散布情况。 2. 方差(Variance或Var) 方差是由各观测值到均值距离的平方和除以观测量减1:,3. 标准差(Standard deviation或Std Dev) 方差的开方称为标准差: 标准差的量纲与原变量一致。 4. 变异系数(Coefficient of Variation或CV) 变异系数是将标准差表示为均值的百分数,是观测数据分散性的一个度量,它在比较用不同单位测量的数据的分散性时是有用的:,2.1.4 表示数据分布形状的统计量 偏度和峰度是描述数据分布形状的指标。 1. 偏度(skewness) 偏度是刻画数据对称性的指标。偏度的计算公式为: 在SAS中: 关于均值对称的数据其偏度为0; 左侧更为分散的数据,其偏度为负,称为左偏; 右侧更为分散的数据,其偏度为正,称为右偏。,2. 峰度(kurtosis) 峰度描述数据向分布尾端散布的趋势。峰度的计算公式为: 利用峰度研究数据分布的形状是以正态分布为标准(假定正态分布的方差与所研究分布的方差相等)比较两端极端数据的分布情况,若 近似于标准正态分布,则峰度接近于零; 尾部较正态分布更分散,则峰度为正,
4、称为轻尾; 尾部较正态分布更集中,则峰度为负,称为厚尾。,2.1.5 其它统计量 1. 均值的标准误(Std Error Mean或Std Mean或Std error) 2. 校正平方和(Corrected sum of squares),3. 未校正平方和(Uncorrected sum of squares) 4. k阶原点矩 其中A1即为均值 。 5. k阶中心矩,2.2 在SAS中计算统计量 2.2.1 用INSIGHT计算统计量 2.2.2 用“分析家”计算统计量 2.2.3 编程实现描述性统计,2.2.1 用INSIGHT计算统计量 INSIGHT可以非常方便地计算各种统计量。 1. 实例数据 【例2-1】表2-1为两个不同地区居民家庭收入和支出情况的抽样调查(单位:元),试分别统计收入和支出情况。 将表2-1中数据通过Excel导入到SAS数据集Mylib.sryzc中,4个变量名分别为:ID、R_ID、Income和Outgo,相应的标签名为家庭编号、地区编号、家庭总收入和家庭总支出。,2. 在INSIGHT中打开数据集 在菜单中选择“Solution(解决方案)”“
《SAS软件与统计应用教程 教学课件 ppt 作者 汪远征 徐雅静 ch2》由会员E****分享,可在线阅读,更多相关《SAS软件与统计应用教程 教学课件 ppt 作者 汪远征 徐雅静 ch2》请在金锄头文库上搜索。
逍遥游复习 知识点整理
近现代法德关系史 高三展示课3稿
当代大学生人生信仰及追求的调查研究
长相思 纳兰性德-ppt课件
课件:危机意识 一
英语ppt演讲关于阿甘正传
发达国家基础教育改革的动向与趋势 修改版
中国民间美术 课件.ppt
生物质发电技术与系统 课程ppt 第1章 生物质发电技术现状及发展趋势 2学时 -----2016
现代信号处理思考题 含答案
执业药师继续教育 抑郁症的药物治疗 100分
小学生的成长档案模板不用修改 万能型
增订六版 现代汉语 上册 第二章文字 思考与练习答案
国家财政ppt课件
加拿大英语介绍
六年级统计图的选择课件
中学生成长档案ppt
中国现代文学史期末复习整理
lohi和hihilo训练对女子赛艇运动员运动能力影响的比较研究
风雨贾平凹阅读答案
2024-04-11 25页
2024-04-11 37页
2024-04-11 28页
2024-04-11 31页
2024-04-11 36页
2024-04-11 29页
2024-04-11 22页
2024-04-11 27页
2024-04-11 34页
2024-04-11 32页