好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

第三章spss数据文件的基本加工和处理讲义.ppt

37页
  • 卖家[上传人]:今***
  • 文档编号:108164428
  • 上传时间:2019-10-22
  • 文档格式:PPT
  • 文档大小:585KB
  • / 37 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第三章 SPSS数据文件 的基本加工和处理,SPSS数据文件 的基本加工和处理,数据文件的整理 个案排序、个案选取、文件合并、文件转置 数据加工 变量转换、产生计数变量 数据分组 自动分组、手工分组 数据文件的其他处理功能 指定加权变量、SPSS变量集的定义和使用,目的: 将所有个案按照用户指定的某一个或多个变量的变量值的升序或降序重新排列 菜单选项: data - sort cases 注意: (1)Ascending:升序、Descending:降序 (2)多重排序,选择变量名的次序很关键(前面的变量优先排序)个案排序,个案选取,(一)个案选取的方式 (1)选择符合一定条件的个案(If condition is satisfied) (2)随机选取个案(Random sample of cases) 近似选取、精确选取 (3)选取某一区域内的个案(Based on time or case range) (4)使用过滤变量(use filter variable) 过滤变量非0且非缺失的个案被选中,个案选取,(二)个案选取的步骤 (1)菜单选项: data - select cases (2)对未选中个案的处理方式: filtered: 左侧标记/ delete: 删除 (3)根据不同方式选取个案 注意:以后的操作和分析都在该个案选取的基础上进行.,数据文件的合并,目的: 将两个SPSS数据文件合并到一个数据文件中。

      文件合并的方式: 纵向合并 横向合并数据文件的合并,(一)纵向数据合并 (1)含义: 将磁盘上的或打开的一个SPSS数据文件追加到当前data editor窗口中的数据文件中 (2)前提: 两个SPSS数据文件应有可以合并的内容,且最好有相同的变量名和变量类型 (3)菜单选项: data - merge file - add cases,数据文件的合并,(二)横向数据合并 (1)含义: 将磁盘上的或打开的一个SPSS数据文件中的若干个变量增加到当前data editor窗口的数据文件中 (2)前提 a.两个数据文件如不指定关键字段,则按顺序合并; b. 两个数据文件如按关键字段合并应事先升序排序数据文件的合并,(二)横向数据合并 (3)菜单选项: data - merge file - add variable (4)选项说明: math cases on key variables in sorted files:以关键字作为合并标志 Both files provide cases:合并后的文件的数据由两个文件共同提供 Non-active dataset is keyed table:以data editor的数据为基础。

      个案数不同时,丢失Non-active文件的个案) Active dataset file is keyed table:以磁盘文件的数据为基础个案数不同时,丢失Active文件的个案),当两个文件中个案数不同时,数据文件的转置,目的: 将数据文件行列互换,即:将个案转为变量,变量转为个案.,转置前,转置后,数据文件的转置,菜单选项: data-transpose 说明: 系统自动产生一新变量case_lbl,存放原文件的变量名 可以指定变量名变量, 该变量的变量值为新文件的变量名 如有变量未被选中,转置时则被自动丢弃(有提示),数据文件格式的转换,分析要求改变数据的排列格式:,菜单选项: data-Restructure 选项:将宽型数据重排为长型格式 将长型数据重排为宽型格式 数据转置,等同于Transpose,ID变量:被重复观测个体的标示变量 Index变量:用于区分观测次数的变量 系统自动判断同一ID变量取值相同的携带变量,转换取值不同的变量,,,,,长型格式,宽型格式,ID变量,Index变量,携带变量,数据加工——变量转换,例: 话费=移动话费+长途话费 客户价值 目的:产生新变量或对原变量进行必要的转换。

      (1)含义: 根据用户给出的SPSS算术表达式,对所有或部分样本数据进行加工 (2)SPSS算术表达式(Numeric Expression) 由算术运算符(+ 、-、 *、 /、 **)、SPSS函数以及SPSS变量名组成的式子变量转换,算术函数 统计函数 分布函数 逻辑函数 字符串函数 日期时间函数 缺失值函数 其他函数,Abs() sqrt() exp() lg10() rnd() trunc() mod() mean() sd() sum() cfvar() max() min() normal() uniform() rv.() cdf.() idf.() range() any() index() length() lower() lpad() ltrim() substr() date.dmy(31,12,1999) time.days(1.5) missing() sysmis() lag(),(3) SPSS函数,变量转换,(4)SPSS条件表达式: 简单条件表达式:由SPSS关系运算符、SPSS函数以及SPSS变量名组成的式子 关系运算符: (大于)、 =(大于等于)、 32、sr=700,变量转换,(4)SPSS条件表达式 复合条件表达式:由SPSS逻辑运算符、简单条件表达式组成的式子。

      逻辑运算符: &(AND):并且 |(OR):或者 ~(NOT):非 如:(nl32) and (sr700) not xb=1,变量转换,(5)菜单选项: transform-compute variable if 按钮 举例 计算女生的数学成绩(数学类课程的平均成绩),产生计数变量,(1)含义: 对所有或部分个案,标示(用1) 变量中有哪些个案的值落在指定的区域内,并将结果存入新变量中 (2)菜单选项: transform - count Values within Cases - define value,产生计数变量,(3)指定区域的定义 Value:指定一个值 system-missing:系统缺失值 system-or user missing:系统或用户缺失值 range through:指定一个闭区域,给出最大和最小值 range: lowest through n:个案最小值到某个给定值 range: n through highest:某个给定值到个案最大值,数据文件的分类汇总,例:分别计算不同品牌客户的价值 (1)含义: 按指定的分类变量的变量值对个案分组; 计算每组个案的汇总变量的基本统计量; 将计算结果生成到一新文件中,即:在新文件中对应分类变量的每一个分类值产生一个个案。

      原始数据,按性别变量汇总数据,数据文件的分类汇总,(2)菜单选项: data - Aggregate Break Variable(s) 分类变量 Aggregate Variable(s) 汇总变量 (3)说明: 多重分组时,变量名的选择顺序 生成的新文件名默认为:aggr.sav 生成的新变量名默认为原变量名后加_1 可以在新文件中存贮分组个案数.,举例,统计男生和女生的各科平均成绩 统计分别性别、文化程度的平均年龄 对于通话详单,统计每个客户通话总时长和总话费,数据分组,目的:了解数据的总体分布状况 思路: 指定按哪个变量分组,即:指定分组变量 定义分组变量的分组区间(不重、不漏) 指定一个存放分组结果的标志变量 分组方法: 自动分组 手工分组,数据分组 (标示个案所属组别,但无频数),(一)自动分组 单变量分组 (1)含义: 分组变量值相同的个案分在同一组,同组中的标志变量相同标志变量依照分组变量值的大小次序给定单变量分组,通常只适合于离散变量且变量值较少的情况) (2)菜单选项: transform - Automatic Recode…,数据分组,(二)手工分组(组距分组) (1)含义: 人工定义分组区域,对所有个案或符合一定条件的个案进行等距或非等距分组。

      (2)方法: 分组结果存入原变量 分组结果存入新变量,数据分组,(3)分组结果存入原变量: 定义分组区域: 定义某一区间的原变量值分组后所对应的新值(往往为组别)是什么.未定义的原变量值为缺失值 菜单选项: transform - Recode into same variables… 说明: 可以指定对符合一定条件的个案进行分组 单值区间可以实现数据转换(问卷分析中的反向题重新计分),问卷分析中的反向题重新计分举例,性格打分(内向、一般、外向) 1、与生人交往会“自来熟” (1)从不 (2)偶尔 (3)有时 (4)经常 2、与不熟悉的异性交往,会脸红 (1)从不 (2)偶尔 (3)有时 (4)经常 3、 在公众场合下你会大声发表自己的意见 (1)从不 (2)偶尔 (3)有时 (4)经常 极为内向:3分 较为内向:6分 较为外向:9分 极为外向:12分,数据分组,(4)分组结果存入新变量: 定义分组区域:定义某一区间的原变量值分组后所对应的新值是什么.未定义的原变量值在新变量中为系统缺失值 菜单选项: transform - Recode into Different Variables… 定义原变量分组后产生的相应新变量(CHANGE钮) 可以指定对符合一定条件的个案进行分组。

      举例,将大客户按月收入高低分为不同等级的客户 将两个班级的学生按高等数学成绩高低分级,SPSS变量集的定义和使用,(1)什么是SPSS变量集 将多个变量定义为一个集合,形成一个SPSS变量集 (2)SPSS变量集的种类 系统变量集:SPSS变量管理的依据 allvariabls: 包括data editor中的所有变量 Newvariales:尚未存盘的新定义的所有变量 用户变量集:简化变量选择的操作过程,SPSS变量集的定义和使用,(3)思路 先将若干个变量定义为一个变量集合 指定使用此变量集 (4)定义变量集 菜单: utilities-define Variable sets 选择进入变量集中的变量名 输入自定义的变量集名称,SPSS变量集的定义和使用,(5)使用变量集 菜单: utilities - use Variable sets 将要使用的变量集选入set in use框中 说明: 在set in use中应至少有一个变量集 系统默认使用的是系统变量集,SPSS输出窗口管理,SPSS输出窗口的组成,,索引区(目录区),,详细内容区,红色箭头一一对应,一般操作 结果文件的打开和保存 窗口元素的移动和删除 标准的拖放式操作 在大纲视图中操作最方便 如何在WORD、PDF等中引用分析结果,SPSS输出窗口的管理,表格的编辑 表格、单元格状态的确定 选中状态、编辑状态 表格内容的编辑(双击可修改单元格、选表行列等、生成图等) 表格样式的设置(字符格式、边框样式、行列高宽、行列标题纵向显示等),SPSS输出窗口的管理,。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.