好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

SAS统计应用基础(第三讲)共4讲.ppt

18页
  • 卖家[上传人]:平***
  • 文档编号:24935487
  • 上传时间:2017-12-09
  • 文档格式:PPT
  • 文档大小:997.31KB
  • / 18 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第三章 数据管理入门,3.1 SAS数据集的基本格式,3.1.1 数据集的基本结构,一个SAS数据集就是一个数据文件,用来存放相应的变量设置和具体变量值,是一个标准的关系型数据库中的二维表格①表格中的每一行就是一条记录,也称为观测 (observation)②表格中每一列代表一个变量(variable)注意:在SAS中观测数和变量数没有限制描述部分(descriptor portion):存放变量的定义包括数据集的名 称、建立数据集的日期和时间、变 量和观测的个数、各变量的具体属 性及其他信息,如密码等,数据部分(data portion):存放具体数值按照描述部分对变量 的定义,依次将数据排列为相应的格式。

      数据集,3.1.2 数据集的描述部分,1.数据集名称,在遵循相应操作系统的文件名规则的前提下,有如下规定:,①必须由英文字母或下划线开始,②名称中可包含数字、字母和下划线,③长度可以是1-32个字符,,对各类不同对象的命名均适用如:逻辑库名、数据集名、数组名、宏名等,,SAS 7.0版以后,长度可以是1-8个字符,SAS 6.12版以前,,2.变量名与变量标签,变量名不能使用中文,如果需要使用中文对变量加以进一步说明,则可以使用变量标签(label)每个变量可以有一个标签,用于对变量的具体含义作进一步的说明,长度限制在256个字符内3.变量的类型与长度,,字符型:其值可取任意字符数值型:其值只能取数值时间型,日期型,,实际上按照数值型变量的格式存储,变量,例如,日期型数值存储的都是从1960年1月1日到该日期的天数变量长度,数值型变量:SAS默认长度8位8位的浮点存储方式对 大多数应用已经足够字符型变量:SAS默认长度8位不够用,可以对量 的设定加以更改,最大长度可达32K3.1.3 数据集的数据部分,没有太多特殊的地方。

      需要强调的是对缺失值的处理,,对于数值型变量,缺失值用小数点表示对于字符型变量,缺失值用空字符表示分为直接输入方式和外部文件读入方式,3.2 数据集的建立,3.2.1直接输入方式建立数据集,Data case 2_2;Input x y@@;Cards;34 56 78 90 35 67 89 10 23 65 77 45;,Data case 2_2;Input x y;Cards;34 56 78 90 35 67 89 10 23 65 77 45;,,比较这两段程序,理解@@的含义,对于字符型变量,只需要在变量名后加上“$”表明其为字符型即可,如下面的数据步:,Data case2_3;Input x y $ @@;Cards;1 ‘234’ 5 678 9 abc 10 “def”;,注意:对于字符型变量,在数据块中不需要加入单或双引号,否则会被当作字符串的一部分读入对于超过默认8位长度的字符,如果对相应变量不加长度定义,则系统会在读入时只读入前8位,而将后面的字符截掉因此,可以用length语句定义变量的长度Length语句一般应出现在变量定义之前,其格式为:,Length 变量名 $ 长度,Data case2_3;Length y $ 20;Input x y $ @@;Cards;1 ‘234’ 5 678 9 abc 10 “def12334556678”;,注:去掉length语句后看运行结果。

      3.2.2 外部文件读入方式建立数据集,事先建立纯文本文件case2_2.txt,内容为:34 56 78 90 35 67 89 10 23 65 77 45程序如下:Data case2_2;Infile ‘c:\case2_2.txt’;Input x y @@;Run;,当数据量较大时,采用外部文件读入方式可以避免在程序中输入非常大的数据块,更有利于程序的阅读1、数据的格式化读入,3.2.3 更灵活地建立数据集,FORMAT variables ;Variables 为希望指定输出格式的变量名称,随后的format用于指定具体的输出格式最后面的default选项则用于指定为给定格式的变量的默认输出格式Data temp;Format x 6.3 y 5.1;Input x y;Cards;11 22.22;Proc print;Run;,2、使用output语句,在默认情况下,数据步将所读入的数据存放在缓存中,在依次执行完全部语句后才将相应信息写成一条新的纪录,如果希望在一个执行周期中生成多条数据记录,则需要使用output语句强制输出一条新记录Data temp;Input x y;Z=x; output;Z=y; output;Cards;11 22.22;Proc print;Run;,3.3 数据的导入和导出,SAS为用户提供了完整的数据导入和导出功能,可以实现SAS数据集与Access、Excel、 dbf等常见数据格式的无缝转换。

      3.3.1使用向导实现数据的导入和导出,注意:数据导入和导出向导的界面几乎没有区别3.3.1使用向导实现数据的导入和导出,使用程序方式可以实现高效与自动化的需求在程序方式中,数据的导入与导出分别用import 与export过程来实现PROC EXPORTDATA= 数据集名OUTFILE=“filename” |TABLE=“tablename” ;RUN;,1、“DATA=”等号后为要导出的SAS数据集名称;2、“filename”为导出的数据集存为文件时的完整路径与文件名;3、“tablename”为导出的数据集存为表时的完整路径与表名;4、“identifier”为要导出的数据集存放的类型,当导入的是数据库中的一个表时,必须指定“DBMS=”这一选项,当导入的是单个文件时,可以指定也可以不指定 “DBMS=”这一选项,但必须指定“filename”中的文件扩展名;5、如果指定了REPLACE选项,PROC EXPORT过程就会替换原来已经存在的文件,否则不替换6、“data-source-statements”语句是对导出的数据格式作具体的要求相对应的import过程的语法格式为:PROC IMPORTDATAFILE=“filename” |TABLE=“tablename” OUT= 数据集名 ;RUN;,。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.