
spss 问卷的数据处理.ppt
62页Statistical Program for Social Sciences第一讲第一讲 SPSSSPSS简介及数据编码录入简介及数据编码录入1 简介SPSS是Statistical Program for Social Sciences 的简称,即社会科学统计程序,由美国SPSS公司1970年代推出,迄今已有近30年的历史是国际著名三大社会科学统计软件包之一(SAS、SPSS、Statis)2 进入SPSS之前的准备工作2-1-1数据资料的形式:矩阵式数据数据要求每一横行为一个个案(Case),纵列按变量排列,形成矩阵格式2-1数据资料的形式及编码编码 录入2-1-2 编码的概念: 根据一定的规则将研究资料转换为可进行统计分析 的数码资料的过程问题025:您认为打工的外地人对北京市的社会秩 序是否有影响?(单选) 1□有很大影响 2□有较大影响 3□没有影响 4□不好说 4编码答案2-1-3编码的步骤:1)确定变量;•变量:用来反映文意概念的量化形式在统计中往往指最小的分析单位编码就是对变量进行编码变量由两个部分构成:变量名和变量值。
要注意区分何为变量,何为变量值在调查问卷中还要注意区分问题和变量问题009:您有几个儿子?几个女儿?1□儿子_______人 2□女儿________人 2 3 问题变量1变量2变量1的值变量2的值2)制作编码表直接过录0-1编码变量名: 一个数据文件中, 一个变量只能有一个唯一名称码位:某一变量在 数据文件中占据的栏位码数: 某一变量由几位数组成该变量是数值型(Numeric)——如定距、定比, 还是字串型(String),如定类、定序 前者在统计中可以做高级运算,后者则不可以不适于被访人回答的问题的编码 一般采用7,97,997等被访人回答不知道时的编码 一般采用8,98,998等被访人拒绝回答某变量时的编码 一般采用9,99,999等问卷中出现漏答时的处理编码 一般采用9,99,999等231000113)编码:根据编码表对问卷进行编码,而后将编码结果记录 在问卷上或编码纸上2-2 数据录入外部式录入内部式录入采用DOS、WPS、CCED等软件,按ASCII码 方式录入成文本文件(*.dat;*.txt)这种 录入方式的特点是,数据之间没有间隔,录 完一个数码后自动后移,录入速度较快。
缺 点是容易错位采用SPSS数据编辑器(SPSS Data Editor)录 入其优点是不容易错位,缺点是不能自动 后移,录入速度慢,数据错误不容易修改用SPSS进行问卷处理一、按照问卷处理的步骤进行描述 1、数据输入 1)数据编码n在进行问卷调查之后,首先要对问卷资料进 行整理,包括对调查所得的各种原始资料进 行审查、检验和分类汇总在完成了资料的 基本整理以后,就要开始对资料进行编码 所谓资料的编码就是使用一个规定的数字或 字符代表一个种类回答对资料进行编码, 可以使众多的资料简化为一连串数字,使这 些资料能输入并存储在计算机中,便于进一 步分析研究n例如,我们正在进行一项消费者对某种商 品评价的调查,要求被调查者回答以下问 题:①消费者的性别②消费者的职业 ③消费者的年龄④消费者对此商品综合 评价分数(0~10)编码说明书如下:n编码的含义为:①用数字1代表男性; 2代表女性②根据分析的需要,将消 费者的职业分为工人、农民、军人、机 关干部、学生、公司职员、教师和其他 8大类,并分别用数字1~8代表③根 据分析的需要,将消费者的年龄分为18 岁以下、19~30岁、31~45岁、46岁以 上四组,并分别用数字1~4代表。
④根 据分析需要,用数字1~10分别代表消费 者对商品评价的n举一个具体例子:消费者甲,男性,职 业是农民,年龄为36 岁, 对商品评价为 10分其编码为10203010n在资料编码中,应把握好以下问题:① 正确掌握分类的尺度,避免过细导致过 于复杂,或者过粗造成资料信息流失 ②为保证每一类回答都有类可归,又避 免分类过细,可设置一个“其他”的分类 ③每一个问题中的分类应含义明确,避 免与其他分类产生交叉④对错误或疏 漏的回答可作为特殊的分类,并指定一 个特殊的数字或字符代表,如用0或-1等 ,而不应将其归入其他类中n但是在多项选择题中就要注意到,不同 的题型使用不同的方法进行分析的时候 ,编码也会有所不同,用二分法进行编 码时和用分类法进行编码时就会有所不 同,根据对一个题目的拆分内容不同编 码也不同,具体的说明在数据录入部分 会说明2)数据录入n编码结束以后,就要把数据录入到电脑中,但 是在此之前还需要对变量进行定义这些在 SPSS中都可以在Data View中完成,包括对变 量名、变量类型、变量标签、指标签、缺失值 和变量尺度等变量的属性进行规定,规定好以 后就可以输入问卷数据了。
需要特别注意的是 字符型变量的录入字符型变量仍然可以转化 为数字录入,但是必须在Data View中对本变 量的Value进行规定,用0表示男,1表示女 定义好之后在录入的时候就不必输男或女,只 需要输入1或0就可以了n在具体处理各种类型问题的数据录入的 时候,情况要区分为单项选择题、多项 选择题和开放题型三种情况n①单项选择题:单选题情况比较简单, 只需要将各题的选项数字录入到所对应 的题目序号位置就可以了但是要注意 的是,输入的时候按照一行一份问卷( 即一行一个个案),一列一个问题(即 一列一个变量)进行录入n②多项选择题:多选题比单选题要复杂,通常 的处理方法有如下两种:二分法和分类法n当一个多项选择题没有规定要选多少个选项的 时候,对多选题的录入采用二分法二分法要 求按照选项来把问题拆开,有几个选项就拆为 几个变量,然后每个变量再分别赋值,选择了 则赋值为1,不选则赋值为0比如下面的题目 ,4、(代表题号)选择您喜欢的颜色_____ (可以多选)红色、橙色、黄色、绿色、蓝 色、其他 n根据二分法,就可以处理成这样:n选择您喜欢的颜色? n4.1 红色:1=有选,0=没选n4.2 橙色:1=有选,0=没选n4.3 黄色:1=有选,0=没选n4.4 缘色:1=有选,0=没选n4.5 蓝色:1=有选,0=没选n4.6 其他:1=有选,0=没选n这样对这道题进行拆分之后,就可以像 处理单项选择题一样来处理多选题了。
n当一个多项选择题规定要了选择的项目数时, 就采用分类法它是多选题中要求要选择几个 选项,就定义几个单选变量每个变量的选项 都和多项选择题的选项相同每个变量代表被 调查者的一次选择,即记录的是被选中的选项 的代码比如,有一道多选题(设为题1), 请选出三个最喜欢的洗涤剂品牌,1汰渍,2碧 浪,3立白,4雕牌,5其他这时则设置三个 单选变量,1.1、1.2、1.3,如果被调查者选择 的是汰渍,雕牌和其他,则变量值1.1取值为1 ,1.2取值为4,1.3取值为5不过此时要注意 ,在对数据进行分析的时候,一定要把这几个 变量打包在一个集里,SPSS才能识别这是对 多选题的处理关于多项选择题的分析,将在 最后一部分的实例中进行详细说明量表分析 n在社会调查研究中,常常涉及到需要测量一些比 较抽象的量,例如“经济地位”、“传统价值观”、“ 现代化成都”、“生活态度”、“兴趣爱好”等等这 样就需要围绕有关的研究目的或主题设计合理的 问卷,那么根据设计出的问题(这里主要是指量 表的设计)得到的问卷结果数值是否可靠、准确 ?这就涉及到问卷信度和效度的分析问题,而在 SPSS中,可以很方便地进行这一方面的分析。
因 此,在进行问卷调查前,应先对问卷进行信度和 效度的分析n经验上,如果克朗巴哈系数大于0.9,则认为量 表的内在信度很高,如果克朗巴哈系数大于 0.8,则认为是克接受的,如果系数大于0.7,则认 为量表的设计存在一定的问题,但仍有一定的 参考价值;如果克朗巴哈系数小于0.7,则认为 量表设计存在很大问题应考虑重新设计n用SPSS进行信度分析时注意的问题:由于综 合评价量表中通常包含若干个子方面,因此, 信度分析应针对各个方面主格进行,不可直接 对整个量表进行分析 n如果某特征下设的多个评估项目并非全 部同向,存在反向计分题时,应对它们 进行反向处理后再进行信度分析对于 事先设计好的量表进行预测试,就可以 用得到的数据在SPSS中进行信度分析, 选择菜单项Analyze下的Scale, Reliability Analysis,把参与信度分析的 表量选择好,并且选择信度系数和要输 出的统计量,就可以对量表进行信度分 析了n在进行了信度和效度分析之后,还可以进行问卷 的难易度和鉴别度进行分析,这些主要是在进行 一些试卷研究的分析中采用的n如果在问卷中有一个题目是以量表的形式出现的 ,那么分析问卷中的此题可以用因子分析来进行 ,如现要对远程学习者对教育技术资源的了解和 使用情况进行了解,设计一个李克特量表, 远程 学习者对于教育技术资源的了解和使用。
n将该量表发放给20人回答,可以得到回 收后的原始数据,然后就可以用SPSS进 行因子分析的操作,具体操作步骤如下 :n① 录入数据n② 因子分析 n(1)选择“Analyze Data Reduction Factor…”命令,将变量“A1”到“A10”选入 “Variables”框中n(2)设置描述性统计量 n(3)设置对因子的抽取选项,即选择因 子模型的估计方法,在本题目中选择主 成分法 (4)设置因子转轴,即选择因子载荷矩 阵的旋转方法,在本题目中选择方差最 大旋转法 (5)设置因子分数,即计算因子得分, 并且使用回归法来求因子得分 (6)设置因子分析的选项 n③结果分析n当SPSS把结果输出时,就可以对结果进行分 析了! (1)KMO及Bartlett’ 检验 (2)对共同度的分析,即公共因子对原始变 量的方差贡献n(3)陡坡图,SPSS中显示出来的图示可以较 为直观得保留的因子数目,即当从第几个因素 以后,坡线甚为平坦,因而以保留几个因素较 为适宜n(4)整体解释的变异数——未转轴前的数据n(5)未转轴的因素矩阵n(6)转轴后的因素矩阵,旋转后的载荷 矩阵就可以明显地看出各个因子了,在 本题目分析总A1、A8、A6、A5、A4为 因子一,A10、A9、A7为因子二,A3、 A2为因子三。
题项在其所属的因素层面 顺序是按照因素负荷量的高低排列 (7)因素转换矩阵n④结果说明根据因素的特征值和旋转后的因素 矩阵,采用了主成份分析法抽取出3个因 素作为共同因素,并使用因素转轴方法 中的Varimax最大旋转法,转轴后去掉了 因素负荷量小于0.1的的系数,按照从大 到小的顺序进行排列,使得变量与因素 的关系豁然明了并且可以分析得到, 称第一个因子为电脑网络资源因子,第 二个因子为互动交流资源因子,第三个 因子为录音资源因子n四、问卷分析实例n下面对一份问卷进行具体的分析,来体 现SPSS在问卷处理中的作用问卷见下 :n小学生与电视传播调查问卷[1]n一、姓名:n二、性别:1、男 2、女n三、年级:n四、年龄n [1] 本问卷选自《调查研究中的统计分析 法》一书n五、在学校和班里是否担任职务? n1、少先队干部 2、班干部 3、课代表 4 、学习小组长 5、其他(请具体列出)n六、你是否曾经获得荣誉称号? n1、区、市级三好学生 2、校级三好学生 3、区、市级优秀少先队员 4、校级优秀 少先队员 5、班里的学习积极分子 6、 其他(请具体列出) 7、未曾获得荣誉 称号n七、你是否曾在各种比赛中获奖? n1、在教学竞赛中获奖 2、在英语竞赛 中获奖 3、在作文竞赛中获奖 4、在体 育竞赛中获奖(包括田径、球类、棋类 、航模类) 5、在文艺竞赛中获。
