您所在位置：网站首页 > 高等教育 > 大学课件 > 第三章spss数据文件的基本加工和处理讲义

第三章spss数据文件的基本加工和处理讲义.ppt

37页

卖家[上传人]：今***

文档编号：108164428

上传时间：2019-10-22

文档格式：PPT

文档大小：585KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

30金贝

下载

/ 37 举报版权申诉马上下载

文本预览

下载提示

常见问题

第三章 SPSS数据文件的基本加工和处理,SPSS数据文件的基本加工和处理,数据文件的整理个案排序、个案选取、文件合并、文件转置数据加工变量转换、产生计数变量数据分组自动分组、手工分组数据文件的其他处理功能指定加权变量、SPSS变量集的定义和使用,目的：将所有个案按照用户指定的某一个或多个变量的变量值的升序或降序重新排列菜单选项: data - sort cases 注意: (1)Ascending:升序、Descending:降序 (2)多重排序,选择变量名的次序很关键(前面的变量优先排序)个案排序,个案选取,(一)个案选取的方式 (1)选择符合一定条件的个案(If condition is satisfied) (2)随机选取个案(Random sample of cases) 近似选取、精确选取 (3)选取某一区域内的个案(Based on time or case range) (4)使用过滤变量(use filter variable) 过滤变量非0且非缺失的个案被选中,个案选取,(二)个案选取的步骤 (1)菜单选项: data - select cases (2)对未选中个案的处理方式: filtered: 左侧标记/ delete: 删除 (3)根据不同方式选取个案注意:以后的操作和分析都在该个案选取的基础上进行.,数据文件的合并,目的: 将两个SPSS数据文件合并到一个数据文件中。

文件合并的方式: 纵向合并横向合并数据文件的合并,(一)纵向数据合并 (1)含义: 将磁盘上的或打开的一个SPSS数据文件追加到当前data editor窗口中的数据文件中 (2)前提: 两个SPSS数据文件应有可以合并的内容，且最好有相同的变量名和变量类型 (3)菜单选项: data - merge file - add cases,数据文件的合并,(二)横向数据合并 (1)含义: 将磁盘上的或打开的一个SPSS数据文件中的若干个变量增加到当前data editor窗口的数据文件中 (2)前提 a.两个数据文件如不指定关键字段，则按顺序合并； b. 两个数据文件如按关键字段合并应事先升序排序数据文件的合并,(二)横向数据合并 (3)菜单选项: data - merge file - add variable (4)选项说明: math cases on key variables in sorted files:以关键字作为合并标志 Both files provide cases:合并后的文件的数据由两个文件共同提供 Non-active dataset is keyed table:以data editor的数据为基础。

个案数不同时,丢失Non-active文件的个案) Active dataset file is keyed table:以磁盘文件的数据为基础个案数不同时,丢失Active文件的个案),当两个文件中个案数不同时,数据文件的转置,目的: 将数据文件行列互换,即:将个案转为变量,变量转为个案.,转置前,转置后,数据文件的转置,菜单选项: data-transpose 说明: 系统自动产生一新变量case_lbl,存放原文件的变量名可以指定变量名变量, 该变量的变量值为新文件的变量名如有变量未被选中,转置时则被自动丢弃(有提示),数据文件格式的转换,分析要求改变数据的排列格式:,菜单选项: data-Restructure 选项:将宽型数据重排为长型格式将长型数据重排为宽型格式数据转置,等同于Transpose,ID变量:被重复观测个体的标示变量 Index变量:用于区分观测次数的变量系统自动判断同一ID变量取值相同的携带变量,转换取值不同的变量,,,,,长型格式,宽型格式,ID变量,Index变量,携带变量,数据加工——变量转换,例: 话费=移动话费+长途话费客户价值目的：产生新变量或对原变量进行必要的转换。

(1)含义: 根据用户给出的SPSS算术表达式，对所有或部分样本数据进行加工 (2)SPSS算术表达式(Numeric Expression) 由算术运算符(+ 、-、 *、 /、 **)、SPSS函数以及SPSS变量名组成的式子变量转换,算术函数统计函数分布函数逻辑函数字符串函数日期时间函数缺失值函数其他函数,Abs() sqrt() exp() lg10() rnd() trunc() mod() mean() sd() sum() cfvar() max() min() normal() uniform() rv.() cdf.() idf.() range() any() index() length() lower() lpad() ltrim() substr() date.dmy(31,12,1999) time.days(1.5) missing() sysmis() lag(),(3) SPSS函数,变量转换,(4)SPSS条件表达式: 简单条件表达式:由SPSS关系运算符、SPSS函数以及SPSS变量名组成的式子关系运算符: (大于)、 =(大于等于)、 32、sr=700,变量转换,（4）SPSS条件表达式复合条件表达式:由SPSS逻辑运算符、简单条件表达式组成的式子。

逻辑运算符: &(AND):并且 |(OR):或者 ~(NOT):非如：(nl32) and (sr700) not xb=1,变量转换,(5)菜单选项： transform-compute variable if 按钮举例计算女生的数学成绩(数学类课程的平均成绩),产生计数变量,(1)含义: 对所有或部分个案，标示(用1) 变量中有哪些个案的值落在指定的区域内，并将结果存入新变量中 (2)菜单选项: transform - count Values within Cases - define value,产生计数变量,(3)指定区域的定义 Value:指定一个值 system-missing:系统缺失值 system-or user missing:系统或用户缺失值 range through:指定一个闭区域，给出最大和最小值 range: lowest through n:个案最小值到某个给定值 range: n through highest:某个给定值到个案最大值,数据文件的分类汇总,例：分别计算不同品牌客户的价值 (1)含义：按指定的分类变量的变量值对个案分组；计算每组个案的汇总变量的基本统计量；将计算结果生成到一新文件中，即：在新文件中对应分类变量的每一个分类值产生一个个案。

原始数据,按性别变量汇总数据,数据文件的分类汇总,(2)菜单选项: data - Aggregate Break Variable(s) 分类变量 Aggregate Variable(s) 汇总变量 (3)说明: 多重分组时，变量名的选择顺序生成的新文件名默认为:aggr.sav 生成的新变量名默认为原变量名后加_1 可以在新文件中存贮分组个案数.,举例,统计男生和女生的各科平均成绩统计分别性别、文化程度的平均年龄对于通话详单，统计每个客户通话总时长和总话费,数据分组,目的:了解数据的总体分布状况思路：指定按哪个变量分组，即：指定分组变量定义分组变量的分组区间（不重、不漏）指定一个存放分组结果的标志变量分组方法：自动分组手工分组,数据分组 (标示个案所属组别,但无频数),(一)自动分组单变量分组 (1)含义: 分组变量值相同的个案分在同一组，同组中的标志变量相同标志变量依照分组变量值的大小次序给定单变量分组，通常只适合于离散变量且变量值较少的情况） (2)菜单选项: transform - Automatic Recode…,数据分组,(二)手工分组（组距分组） (1)含义：人工定义分组区域，对所有个案或符合一定条件的个案进行等距或非等距分组。

(2)方法：分组结果存入原变量分组结果存入新变量,数据分组,(3)分组结果存入原变量: 定义分组区域: 定义某一区间的原变量值分组后所对应的新值(往往为组别)是什么.未定义的原变量值为缺失值菜单选项: transform - Recode into same variables… 说明：可以指定对符合一定条件的个案进行分组单值区间可以实现数据转换（问卷分析中的反向题重新计分）,问卷分析中的反向题重新计分举例,性格打分（内向、一般、外向） 1、与生人交往会“自来熟” （1）从不（2）偶尔（3）有时（4）经常 2、与不熟悉的异性交往，会脸红（1）从不（2）偶尔（3）有时（4）经常 3、在公众场合下你会大声发表自己的意见（1）从不（2）偶尔（3）有时（4）经常极为内向：3分较为内向：6分较为外向:9分极为外向：12分,数据分组,(4)分组结果存入新变量: 定义分组区域:定义某一区间的原变量值分组后所对应的新值是什么.未定义的原变量值在新变量中为系统缺失值菜单选项: transform - Recode into Different Variables… 定义原变量分组后产生的相应新变量(CHANGE钮) 可以指定对符合一定条件的个案进行分组。

举例,将大客户按月收入高低分为不同等级的客户将两个班级的学生按高等数学成绩高低分级,SPSS变量集的定义和使用,(1)什么是SPSS变量集将多个变量定义为一个集合，形成一个SPSS变量集 (2)SPSS变量集的种类系统变量集：SPSS变量管理的依据 allvariabls: 包括data editor中的所有变量 Newvariales:尚未存盘的新定义的所有变量用户变量集：简化变量选择的操作过程,SPSS变量集的定义和使用,(3)思路先将若干个变量定义为一个变量集合指定使用此变量集 (4)定义变量集菜单: utilities-define Variable sets 选择进入变量集中的变量名输入自定义的变量集名称,SPSS变量集的定义和使用,(5)使用变量集菜单: utilities - use Variable sets 将要使用的变量集选入set in use框中说明：在set in use中应至少有一个变量集系统默认使用的是系统变量集,SPSS输出窗口管理,SPSS输出窗口的组成,,索引区（目录区）,,详细内容区,红色箭头一一对应,一般操作结果文件的打开和保存窗口元素的移动和删除标准的拖放式操作在大纲视图中操作最方便如何在WORD、PDF等中引用分析结果,SPSS输出窗口的管理,表格的编辑表格、单元格状态的确定选中状态、编辑状态表格内容的编辑(双击可修改单元格、选表行列等、生成图等) 表格样式的设置（字符格式、边框样式、行列高宽、行列标题纵向显示等）,SPSS输出窗口的管理,。

点击阅读更多内容