好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

spss统计分析数据转换与整理.ppt

266页
  • 卖家[上传人]:aa****6
  • 文档编号:48667637
  • 上传时间:2018-07-19
  • 文档格式:PPT
  • 文档大小:2.72MB
  • / 266 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第三章 数据变换与整理*1本章主要内容Ø第一节 数据的排序Ø第二节 变量计算Ø第三节 数据选取Ø第四节 计数Ø第五节 分类汇总Ø第六节 数据分组Ø第七节 数据处理的其他功能Ø第八节 统计图Date2第一节 数据的排序nSPSS的数据排序是将数据编辑窗口中的 数据按照某个或多个指定变量的变量值 升序或降序重新排列这里的变量也称 为排序变量排序变量只有一个时,排 序称为单值排序排序变量有多个时, 排序称为多重排序多重排序中,第一 个指定的排序变量称为主排序变量,其 他依次指定的变量分别称为第二排序变 量、第三排序变量等Date3•(1)数据排序便于数据的浏览,有助于了 解数据的取值状况、缺失值数量的多少等 ;•(2)通过数据排序能够快捷的找到数据的 最大值和最小值,进而可以计算出数据的 全距,初步把握和比较数据的离散程度;•(3)通过数据排序能够快捷地发现数据的 异常值,为进一步明确它们是否会对分析 产生重要影响提供帮助1.数据排序的作用Date4SPSS数据排序的基本操作步骤(1)选择菜单Data-Sort Cases(2)将主排序变量从左边的列表中选到 Sort by框中,并在Sort Order框中选 择按该变量的升序还是降序排序。

      3)如果是多重排序,还要一次指定第 二、第三排序变量及相应的排序规则2.数据排序的基本操作Date5在左边的源变量框中 选择排序变量进入Sort by框如果选择2个以 上的变量,观测量的 排序结果与排序变量 在Sort by框中的顺序 有关列于首位的为 第一排序变量在Sort Order 栏内选择排序 方式——升序 与降序Date61、数据排序是整行数据排序,而不是只对某 列变量排序;2、多重排序中指定排序变量的次序很关键 先指定的变量优先于后指定的变量多重排 序可以在按某个变量值升序(或降序)排序 的同时再按其他变量值降序(或升序)排序 ;3、数据排序后,原有数据的排序次序必然被 打乱说明Date703-1 数据排序应用举例n利用居民存款调查数据,通过数据排序 功能分别找到城镇户口和农村户口储户 一次存款金额的最大值和最小值Date8第二节 变量计算n数据的转换处理是在原有数据的基础上,计 算产生一些含有更丰富信息的新数据例如 根据职工的基本工资、失业保险、奖金等数 据,计算实际月收入,这些新变量具有更直 观更有效的特点Date91. 变量计算的目的nSPSS变量计算是在原有数据的基础上,根据用 户给出的SPSS算术表达式以及函数,对所有个 案或满足条件的部分个案,计算产生一系列新 变量。

      1)变量计算是针对所有个案或指定的部分 个案的,每个个案都有自己的计算结果2)变量计算的结果应保存到一个指定变量 中,该变量的数据类型应与计算结果的数据类 型相一致在变量计算过程中涉及到几个概念:SPSS 算术表达式、SPSS条件表达式和SPSS函数Date10n指出按照什么方法计算变量;nSPSS算术表达式(Numeric Expression) 是由常量、变量、算术运算符、圆括号、函 数等组成的式子•字符型常量应当用引号括起来•变量是指那些已存在于数据编辑窗口中的原有变 量•算术运算符主要包括+、-、*、/、**(乘方)•在同一算术表达式中的常量及变量,数据类型应 该一致,否则无法计算 2.SPSS算术表达式Date11n在变量计算中通常要求对不同的个案分 别按照不同的方法进行计算,于是就需 要通过一定的方式来指定个案;nSPSS条件表达式是一个对条件进行判 断的式子其结果有两种取值:如果判 断条件成立,则结果为真;如果判断条 件不成立,则结果为假条件表达式包 括简单条件表达式和复合条件表达式3.SPSS条件表达式Date12(1)简单条件表达式由关系运算符、常量、变量以及算术表达 式等组成的式子。

      其中关系运算符包括>、=、<= nl<35) (2)复合条件表达式又称逻辑表达式,是由逻辑运算符号、圆 括号和简单条件表达式等组成的式子其中 ,逻辑运算符号包括&或AND(并且)、|或 OR(或者)、~或NOT(非)NOT的运算 优先级最高,其次是AND,最低是OR可以 通过圆括号改变运算的优先级nl<=35) and not (zc<3)Date13nSPSS函数是事先编好并存储在SPSS软件 中,能够实现某些特定计算任务的一段计 算机程序这些程序都有各自的名字称为 函数名执行这些程序段得到的计算结果 称为函数值函数书写的具体形式为:函数名(参数 )4.SPSS函数Date14其中,函数名是SPSS已经规定好的,参数 可以是常量(字符型常量应用引号括起来) ,也可以是变量或算术表达式参数可能是 一个,也可能是多个,各参数之间用逗号分 隔SPSS函数大致可以分成八大类:算术函数 、统计函数、分布函数、逻辑函数、字符串 函数、缺失值函数、日期函数和其他函数Date15n(1)选择菜单Transform-Compute,弹 出Compute Variable对话框如下:5.变量计算的基本操作Date16(2)在Target框中输入存放计算结果的变量 名。

      该变量可以是一个新变量,也可以是已 经存在的变量如果指定存放计算结果的变 量为新变量,SPSS会自动创建它;如果指定 产生的变量已经存在,SPSS会提问是否以计 算结果覆盖原有值新的变量默认为数值型 ,用户可以根据需要单击Type&Label按钮 修改,还可以对新变量加变量名标签 (3)在Numeric Expression框给出SPSS算术 表达式可以手工输入,也可以按窗口的按 钮以及函数下拉菜单输入Date17(4)如果希望对符合一定条件的个案进行变量计算, 则单击If按钮,出现下面的窗口,选择Include if case satisfies condition选项,然后输入条件表达 式对不满足条件的个案,将不进行变量值计算,对 新变量取值为系统缺失值Date18利用职工基本情况数据,依据职称级别 计算实发工资,再按职称1至4将实发工 资分别上调50%,30%,20%,10% 03-2 变量计算的应用举例Date19第三节 数据选取n数据选取就是根据分析的需要,从已收 集到的大批量数据(总体)中按照一定 的规则抽取部分数据(样本)参与分析 的过程,通常也称为抽样SPSS可根据指定的抽样方法从数据编辑 窗口中选出部分样本以实现数据选取, 这样后面的分析操作就只针对选出的数 据,直到用户取消这种选取为止。

      Date20(1)选取全部数据(All cases) (2)按指定条件选取( If condition is satisfied )SPSS要求用户以条件表达式给出数据选 取的条件,SPSS将自动对数据编辑窗口中的 所有个案进行条件判断那些满足条件的个 案,即条件判断为真的个案将被自动选取出 来,而那些条件判断为假的个案则不被选中 1. 数据选取的基本方式Date21(3)随机抽样( Random sample of cases ), 即对数据编辑窗口中的所有个案进行随机筛选, 包括如下两种方式:第一,近似抽样(Approximately)近似抽样要求用户给出一个百分比数值, SPSS将按照这个比例自动从数据编辑窗口中随机 抽取相应百分比数目的个案注:由于SPSS在样本抽样方面的技术特点,抽取出的 个案总数不一定恰好精确地等于用户指定的百分比数目, 会有小的偏差,因而称为近似抽样Date22第二,精确抽样(Exactly)精确抽样要求用户给出两个参数第 一个参数是希望选取的个案数,第二个 参数是指定在前几个个案中选取SPSS 自动在数据编辑窗口的前若干个个案中 随机精确地抽出相应个数的个案来。

      Date23(4)选取某一区域内的样本( Based on time or case range ),即选取数据编辑 窗口中样本号在指定范围内的所有个案,要 求给出这个范围的上、下界个案号码这种 抽样方法适用于时间序列数据 (5)通过过滤变量选取样本( Use filter variable ),即依据过滤变量的取值进行样 本选取要求指定一个变量作为过滤变量, 变量值为非0或非系统缺失值的个案将被选中 这种方法通常用于排除包含系统缺失值的 个案Date24说明:(1)完成数据选取后, SPSS以后的分析操 作仅针对那些被选中的个案,直到用户再次 改变数据的选取为止2)采用指定条件选取和随机抽样方法进行 数据选取后,SPSS将在数据编辑窗口中自动 生成一个名为filter_$的新变量,取值为1或0 1表示本个案被选中,0表示未被选中该 变量是SPSS产生的中间变量,如果删除它则 自动取消样本抽样Date25(1)选择菜单Data—Select cases (2)根据分析需要选择数据选取方法 (3)Unselected cases are指定对未选中 个案的处理方式•Filtered表示在未被选中的个案号码上打 一个“/”标记;•Deleted表示将未被选中的个案从数据编 辑窗口中删除。

      2. 数据选取的基本操作Date26Select Cases对话框Date27利用[02-1]居民储蓄调查数据,根据不 同的分析要求采用不同的数据选取方法抽样 : (1)如果只希望分析城镇储户的情况,可以通 过数据选择功能采用指定条件的抽样方法进 行抽样; (2)如果只希望对其中的70%的数据进行分析 ,可通过数据选择功能采用随机抽样中的近 似抽样方法进行抽样数据选取的应用举例Date28第四节 计数n1. 计数目的SPSS实现的计数是对所有个案或满足某 条件的部分个案,计算若干变量中有几个变 量的值落在指定的区间内,并将计数结果存 入一个新变量中的过程例如对大学毕业班 学生的成绩进行综合测评时,可以依次计算 每个学生的若干门课程中有几门课程得了优 ,有几门课程得了良,有几门课程不及格SPSS实现计数的关键步骤是:•指定哪些变量参与计数,计数的结果存入哪个新 变量中•指定计数区间(尤为关键) Date29SPSS中的计数区间可以有以下几种描述形式 :v单个变量值(Value)v系统缺失值(System-missing)v系统缺失值或用户缺失值( System or user- missing)v给定最大值和最小值的区间(n through m)v小于等于某指定值的区间(Lowest through n)v大于等于某指定值的区间(n through highest )2. 计数区间Date30上述后三个计数区间很容易理解。

      例如 评价学生成绩,成绩为优的计数区间可以指 定为90 through highest,成绩为良的计数区 间指定为80 through 89,不及格的计数区间 指定为Lowest through 59前三个计数区间实际上是一些离散的数 据点,严格讲并不是区间,但SPSS仍将其归 在广义区间的范畴内,目的是方便一些其他 的应用Date31(1)选择菜单Transform-Count,出现如下窗口 :3. 计数的基本操作Date32(2)将参与计数的变量选到Variables框 中 (3)在Target Variable框中输入存放 计数结果的变量名,并在Target Label 框中输入相应的变量名标签 (4)单击Define Values按钮定义计数 区间,出现如下图窗口:Date33通过单击Add、Change、Remove按钮 完成计数区间的增加、修改和删除Date34(5)如果仅希望对满足某条件的个案进 行计数,则单击If按钮并输入相应的 SPSS条件表达式否则,本步可略去Date35n利用[02-1]居民储蓄调查数据分析储户 收入的总体状况我们认为如果储户收 入今年比去年增加了,且认为今后收入 仍会增加,则认为收入状况较好。

      试分 析有多少个储户的收入状况较好计数的应用举例Date36第五。

      点击阅读更多内容
      相关文档
      国庆中秋双节假期安全主题班会课件:欢度双节安全护航.pptx 情绪管理心理健康主题班会课件:你可以生气但别越想越气.pptx 国庆中秋假期安全主题班会教案.docx 内驱力主题班会课件.pptx 禁止说脏话主题班会课件.pptx 抓班风促学风主题班会课件.pptx 2025第45个世界粮食日节约粮食我在行动一稻一粟当为之珍惜.pptx 幼儿园世界粮食日节约粮食主题班会爱粮节粮你我童行.pptx 2025社区党支部作风建设专题党课抓实党员教育管理擦亮为民服务底色.pptx 解读要素市场化配置改革是什么怎么改在哪改.pptx 《纵深推进全国统一大市场建设》把全国统一大市场建设好增强我们从容应对风险挑战的底气.pptx 《关于扩大服务消费的若干政策措施》加强政策支持搭建平台载体扩大对外开放强化标准引领优化消费环境.pptx 2025世界粮食日节约粮食主题班会拒绝舌尖上的浪费.pptx 学习2025年国家网络安全宣传周重要论述网络安全为人民网络安全靠人民.pptx 普及食品安全常识建立科学饮食文化诚信尚俭共享食安.pptx 《玫瑰与教育》读书分享会读书心得读后感以玫瑰为铭写教育的诗行.pptx 学习建设开放型世界经济相关重要论述专题培训.pptx 解读《关于扩大服务消费的若干政策措施》课件.pptx 抓实党员教育管理擦亮为民服务底色课件.pptx 纵深推进全国统一大市场建设专题课件.pptx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.