好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

统计数据代表值计算.doc

24页
  • 卖家[上传人]:mg****85
  • 文档编号:34442498
  • 上传时间:2018-02-24
  • 文档格式:DOC
  • 文档大小:165KB
  • / 24 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 71第 5 章 统计数据的标志值计算及其描述5.3 探索性统计分析前面介绍的统计资料描述方法通常是先将统计资料分组处理,然后把分组资料画成各种图分析其分布规律但这种传统的统计资料处理方法有一定的局限性,容易失去原始资料的真实性为了克服这一弊端,70 年代开始国外已经出现了新的探索性资料分析方法探索性资料分析特征操作简便,能够准确地描述统计变量分布情况在这里只介绍最常用的茎叶图和箱线图5.3.1 箱线图(Boxplot)箱线图是把第一四分位数,第二四分位数(中位数),第三四分位数,四分位数范围,最大值及最小值画成一个箱子和一条线将箱子两侧超过四分位数差 1.5 倍范围内的值用点线(--)连接起来,超出四分位数差 1.5 倍至 3 倍范围的值为零,超过 3 倍的特别大或特别小的异常值用*表示如果我们所研究的统计资料的分布是对称的,那么 Q2垂直线将落在箱子的正中央如果 Q2垂直线落在靠近 Q3的位置,那么分布的长尾拖向左边;相反 Q2垂直线落在靠近 Q1的位置,那么分布的长尾拖向右边因此不同的箱线形状就反映出不同的分布特征(见图 5-6) Q1 Q2 Q3L0H0平均数╋Q1 Q2 Q3(B) 右偏分布Q1 Q2 Q3(A) 正态分布Q1 Q2 Q3(C) 左偏分布图 5-6 箱线图与分布形状725.3.2 茎叶图(Stem-and-leaf Display)茎叶图将提供统计资料的分布形态、范围、集中程度等情报。

      利用茎叶图主要有两个优点,首先它既能保留原始资料的真实情报,又能为准确计算平均数等代表值提供方便特别是对 100 个以下观测值的频数分布分析非常有用其次 SAS for Windows 在统计量的分组中,茎叶图可将统计分组和画直方图一次完成,不会出现重复分组的可能茎叶图将树茎置于垂直线的左侧,树叶在垂直线的右侧按顺序排列绘制茎叶图,关键是要设计好树茎,这好比和资料分组时,先确定分组数和每组的组限一样重要茎叶图是以观测值的间隔为纵坐标(茎),观测值的末尾数字为横坐标(叶),叶的右边数字为相应区间内观测值的个数观测值的间隔为系统自动给出,当观测值的个数小于 30 时,数据间隔为 10,当大于 30 时,间隔为 5Stem Leaf # 9 1 1 8 4 1 7 125 3 6 135689 6 5 2558 4 4 567 3 3 5 1 732 2 1 ----+----+----+----+Multiply Stem.Leaf by 10**+15.4 利用 SAS 程序计算描述性统计量5.4.1 PROC UNIVARIATE 前面我们叙述了平均数、中位数、众数、偏度系数、方差、标准差等代表分布集中趋势和离散趋势的标志值和箱线图及茎叶图等探索性资料分析。

      下面将介绍利用 SAS for Windows,计算和分析描述性统计量 1)的基本方法(SAS 程序),SAS for Windows 统计分析的基本形式如下:① PROC UNIVARIATE OPTION1;② VAR 变量名 1 变量名 2 … 变量名 n;③ BY 变量名 1 变量名 2 … 变量名 n;④ FREQ 变量名;⑤ WEIGHT 变量名;⑥ OUTPUT OUT=dsn option2;□PROGRAM 解释①PROC UNIVARIATE;SAS for Windows 统计分析 PROC UNIVARIATE 命令是最常用的命令,也是最重要的命令之一,用来分析各种各样的描述性统计量PROC UNIVARIATE 命令不仅具有统计量分析功能,还具有打印功能等option1- DATA=dsn:指定分析资料名 dsn12) 把描述性统计量也称作基础统计量.74- PLOT:探索性分析,作茎叶图和箱线图在 SAS for Windows,根据观测值个数的多少,茎叶图和箱线图的形状有所不同下面的图(a)是观测值个数 n=30 的情况,图(b)是观测值个数 n=32 的情况。

      由此可知,当观测值的个数 n 30 时,茎叶图的同一个级别的树茎不分杈,当 n>30 时,茎叶图的同一个水准的树茎分杈,比如 70 级别的树茎,分成 70~74 和 75~79 级别的两个树茎,这等于把原来的茎叶图和箱线图拉长了一倍图(a) 观测值 n≤30 图(b) 观测值n>30 Stem Leaf # Boxplot Stem Leaf # Boxplot9 5 1 | 9 567 3 | (右)8 0233456 7 +-----+ 9 |7 12234556788 11 *-----* 8 56 2 |6 35 2 | + | 8 22334 5 +-----+5 1369 4 +-----+ 7 556788 6 | |4 046 3 | 7 12234 5 *--+--*3 9 1 | 6 5 1 | |2 2 1 | 6 3 1 | |----+----+----+----+ 5 69 2 +-----+Multiply Stem.Leaf by 10**+1 5 13 2 |4 6 1 |4 04 2 |3 9 1 |3 |2 |752 2 1 | (左)----+----+----+----+Multiply Stem.Leaf by 10**+1(图 5-7) 茎叶图和箱线图与观测值- FREQ:作频数分析表(频数也称作次数)。

      NORMAL:正态分布分析计算有关检验正态分布的统计量 p-值 NOPRINT:不打印分析结果以上的 Option,可以在一个 PROC UNIVARIATE 命令中重复使用比如,… … … … ;PROC UNIVARIATE DATA=one PLOT FREQ;RUN;② VAR 变量名 1 变量名 2……;指定描述性统计分析的变量SAS 程序中只有一个变量时不需要指定 VAR 变量但在 SAS 程序中有两个以上变量时,需要指定 VAR 变量如果不指定,则对所有的变量都作统计分析比如,INPUT x y z; ←SAS 程序中有 3 个变量… … … … ;PROC UNIVARIATE PLOT; ←作描述性统计分析VAR x y; ←只作 x y 变量的探索性统计分析③ BY 变量 1 变量 2…;以 BY 指定的变量为基准,对 VAR 变量进行统计分析④ F REQ 变 量 名 :该 语 句 指 定 一 个 数 值 型 的 变 量 , 它 的 值 表 示 输 入 数据 集 中 相 应 的 观 测 出 现 的 频 数 。

      ⑤W EIGHT 变 量 名 : 该 语 句 规 定 一 个 变 量 , 它 的 值 表 示 相 应 观 测 的 权数 ⑥OUTPUT OUT= dsn option2;76OUTPUT 语句要求把计算的描述性统计量输出到新的 SAS 数据集中新数据集名字的定义用 OUT=DSN 来命名,OPTION2 是对输出的描述性统计量进行选择和规定统计量在输出列表中的变量名一般格式为: OUTPUT OUT= 新 dsn 统计量代号=新变量名 1 新变量名 2…;例如,OUTPUT OUT=EXAMPLE MEAN=MEANX MEANY STD=STDX STDY;option2 - N:资料个数 - MEDIAN:中位数- VAR:样本方差 - SUM:观测值的总和( )ix- Q1:第一四分位数(上位四分位数)(25%) - Q3:第三四分位数(75%)- P1:第一百分位数(1%) - P10:第十百分位数(10%)- P90:第九十百分位数(90%) - P95:第九十五百分位数(95%)- P99:第九十九百分位数(99%) - USS:观测值的平方之和( )ix2- STDERR:平均数的标准误差( ) - KURTOSIS:峰度nSTD(系数)- PRT: T-统计量的 p-值 - NMISS:缺省值的个数- MODE:众数 - MIN:最小值- RANGE:范围(MAX-MIN) - QRANGE:四分位数范围- CSS:离差的平方之和 - T:T-统计量ix2- MEAN:平均数 - MAX:最大值77- CV:离散系数(变动系数) - SKEWNESS:偏度系数例 5-11: 在 A,B 两个会社的男女营业员中各抽出 4 名,对他们的去年和今年的营业(销售)额进行了调查。

      去年和今年的营业额分别用slast 和 snow 表示利用此调查资料作 PROC UNIVARIATE 统计分析把资料直接编入 SAS 程序)SAS PROGRAM:OPTION PS=60 NODATE; DATA example;INPUT company $ gender $ slast snew @@;CARDS;A M 70 72 A M 65 67 A F 57 54 A F 60 63 A M 64 65。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.