SPSS数据定义与基本统计.ppt
29页Statistical Program for Social Sciences第一讲 SPSS简介及数据编码录入1 简介简介SPSS是Statistical Program for Social Sciences 的简称,即社会科学统计程序,由美国SPSS公司1970年代推出,迄今已有近30年的历史是国际著名三大社会科学统计软件包之一(SAS、SPSS、Statis)我们现在使用的是SPSS for Windows 8.0版2 进入进入SPSS之前的准备工作之前的准备工作2-1-1数据资料的形式:矩阵式数据数据要求每一横行为一个个案(Case),纵列按变量排列,形成矩阵格式2-1数据资料的形式及编码编码编码录入录入2-1-2 编码的概念: 根据一定的规则将研究资料转换为可进行统计分析的数码资料的过程问题问题025:您认为打工的外地人对北京市的社会秩:您认为打工的外地人对北京市的社会秩序是否有影响?(单选)序是否有影响?(单选)1□有很大影响 2□有较大影响 3□没有影响 4□不好说 4编码答案2-1-3编码的步骤:1)确定变量;•变量:变量:用来反映文意概念的量化形式。
在统计中往往指最小的分析单位编码就是对变量进行编码变量由两个部分构成:变量名变量名和变量值变量值要注意区分何为变量,何为变量值在调查问卷中还要注意区分问问题题和变量变量问题问题009:您有几个儿子?几个女儿?:您有几个儿子?几个女儿? 1□儿子_______人 2□女儿________人 23问题变量1变量2变量1的值变量2的值2)制作编码表直接过录直接过录0-1编码编码变量名变量名: 一个数据文件中一个数据文件中,一个变量只能有一个唯一名称一个变量只能有一个唯一名称码位:某一变量在码位:某一变量在数据文件中占据的栏位数据文件中占据的栏位码数:码数:某一变量由几位数组成某一变量由几位数组成该变量是数值型(该变量是数值型(Numeric))——如定距、定比,如定距、定比,还是字串型(还是字串型(String),如定类、定序如定类、定序前者在统计中可以做高级运算,后者则不可以前者在统计中可以做高级运算,后者则不可以不适于被访人回答的问题的编码不适于被访人回答的问题的编码。
一般采用一般采用7,,97,,997等被访人回答不知道时的编码被访人回答不知道时的编码一般采用一般采用8,,98,,998等被访人拒绝回答某变量时的编码被访人拒绝回答某变量时的编码一般采用一般采用9,,99,,999等问卷中出现漏答时的处理编码问卷中出现漏答时的处理编码一般采用一般采用9,,99,,999等231000113)编码:根据编码表对问卷进行编码,而后将编码结果记录在问卷上或编码纸上2-2 数据录入外部式录入内部式录入采用DOS、WPS、CCED等软件,按ASCII码方式录入成文本文件(*.dat;*.txt)这种录入方式的特点是,数据之间没有间隔,录完一个数码后自动后移,录入速度较快缺点是容易错位采用SPSS数据编辑器(SPSS Data Editor)录入其优点是不容易错位,缺点是不能自动后移,录入速度慢,数据错误不容易修改作业:将问卷填答好,并做出问题001—问题011的编码表,将自己的答案在问卷上编码下一节课带问卷上机练习:第二讲 SPSS数据定义SPSS的运行步骤如下:录入数据定义数据整理数据统计数据察看结果SPSS数据定义的命令共有4个,分别用来定义数据的变量名、变量名标签、变量值标签和缺失值。
1 变量名定义命令:变量名定义命令:Data List1-1命令格式:Data List File=‘原始数据文件名(原始数据文件名(*.dat))’/变量变量1名名 码位码位 变量变量2名名 码位码位……变量变量n名名 码位码位.这些数据定义命令都要写在这些数据定义命令都要写在SPSS的语句窗口的语句窗口((Syntax)里,而后运行里,而后运行示例:示例:Data list file=’c:\lianxi\lianxi.dat’/Data list file=’c:\lianxi\lianxi.dat’/num 1-4 W01 5 W01a 6-7 W02 8 W03 9 W04 10.num 1-4 W01 5 W01a 6-7 W02 8 W03 9 W04 10.或:或:Data list file=’c:\lianxi\lianxi.dat’/Data list file=’c:\lianxi\lianxi.dat’/num 1-4 num 1-4 W01 5 W01 5 W01a 6-7 W01a 6-7 W02 8 W02 8 W03 9 W03 9 W04 10.W04 10.1-2要求:•变量名不能超过8个字符;•变量名不能以数字开头;•变量名中不能包含+,-,×,/、?、=等运算和逻辑符号。
•当相邻变量名称上存在顺序且码位相同时,可用简略方法 : W02 8 W03 9 W04 10.W02 8 W03 9 W04 10.可换为可换为 W02 to W04 8-10.W02 to W04 8-10.•当变量值是字符时,在码位后加(a);如:W7 12(a);;•当变量值包含小数时,在码位后加(n),n表示小数的位数如:446.79,在录入时要录成44679,定义时为:W12 12-16(2);;练习:练习:问卷问卷 p1变量名定义;变量名定义;问卷问题问卷问题010、、011变量名定义;变量名定义;问题问题012变量名定义;变量名定义;运行2 变量名标签定义命令:变量名标签定义命令:Variable labels 该命令是给变量名一个说明标注2-1 命令格式: Variable labels 变量变量1名名 标签标签 /变量变量2名名 标签标签 /变量变量3名名 标签标签 ………/变量变量n名名 标签标签 .示例:Variable Labels num Variable Labels num 编号编号 /W01 /W01 性别性别/W01a /W01a 出生年出生年 /W02 /W02 婚姻状况婚姻状况 /W03 /W03 文化程度文化程度 . .或:或: Variable Labels Variable Labels num num 编号编号 /W01 /W01 性别性别/W01a /W01a 出生年出生年 /W02 /W02 婚姻状况婚姻状况 /W03 /W03 文化程度文化程度 . .或:或: Variable Labels Variable Labels num num 编号编号 W01 W01 性别性别W01a W01a 出生年出生年 W02 W02 婚姻状况婚姻状况 W03 W03 文化程度文化程度 . .2-2 要求:要求:•变量名要和已定义过的名称相一致;变量名要和已定义过的名称相一致;•标签用中、西文均可,但长度不要超过标签用中、西文均可,但长度不要超过120个字符,个字符,即即60个汉字。
个汉字练习:练习:问卷问卷 p1变量名标签定义并运行变量名标签定义并运行3. 变量值标签定义命令:变量值标签定义命令:Value labels该命令是给变量的每一取值加一个说明标注3-1 格式:格式: Value Labels 变量名变量名 值值1 ‘标签标签’ 值值2 '标签标签' 值值3 '标签标签' …/变量名变量名 值值1 ‘标签标签’ 值值2 ‘标签标签’ 值值3 ‘标签标签’ … .示例:示例:Value labels Value labels W01 1'男' 2'女'/W02 1‘未婚’ 2‘已婚’ 3‘离婚后未再婚’ 4‘离婚后再婚’ 5‘丧偶后未再婚’ 6‘丧偶后再婚’ 7‘未婚同居'/W03 1‘不识字或识字很少’ 2‘初小’ 3‘高小’ 4‘初中’ 5‘高中中专或中技’ 6‘大专’ 7‘大学本科’ 8‘研究生以上’/W04 1‘不识字或识字很少’ 2‘初小’ 3‘高小’ 4‘初中’ 5‘高中中专或中技’ 6‘大专’ 7‘大学本科’ 8‘研究生以上’ 0‘不适用’ .3-2 要求:要求:•变量名要和已定义过的名称相一致;变量名要和已定义过的名称相一致;•标签用中、西文均可,但长度不要超过标签用中、西文均可,但长度不要超过60个字符,个字符,即即30个汉字。
个汉字练习:练习:问卷问题问卷问题001—007的变量值标签定义并运行的变量值标签定义并运行4 缺失值定义命令:缺失值定义命令:Missing Value4-1 格式:格式: Missing Value 变变量量名名 变变量量名名 变变量量名名……(缺缺失失值值1,缺失值,缺失值2,,……)/变变量量名名 变变量量名名 变变量量名名……(缺缺失失值值1,,缺缺失失值值2,,……) .示例:示例:Missing Value W01 W02 W03Missing Value W01 W02 W03((9 9))/W04 /W04 ((0 0,,9 9))/W01a W8.1 W8.2 W8.3(99) ./W01a W8.1 W8.2 W8.3(99) .4-2 要求:要求:缺失值的定义与前面的命令格式不同,它是按照缺失值的定义与前面的命令格式不同,它是按照缺失值的码位数来排列变量的有相同码位数的缺失值的码位数来排列变量的有相同码位数的变量放在一组变量放在一组上机作业:上机作业:1、在、在DOS下的下的Edit编辑器下录入问卷编辑器下录入问卷2、运用、运用SPSS的的4个数据定义命令对问卷的个数据定义命令对问卷的第一页进行定义。





