
spss思路和标准答案.docx
10页一、1) 对数据集居民储蓄调查数据(存款).sav按照户口类型和年龄对存款金额进行分类汇总,计算其均值和标准差方法一:打开数据-分类汇总-“年龄和户口”移入分组变量、将“存款金额”两次移动到变量摘要里-分别点击下方函数——得到变量摘要里“a5 mean 和 a5sd”---再点击下方“创建只包含汇总变量)(方法二:利用拆分-比较组点进“年龄和户口”-分析-描述统计-描述-点进“存款金额”)得到如下:描述统计量户口年龄N均值标准差城镇户口20岁以下存(取)款金额71525.142376.640有效的 N (列表状态)720~35岁存(取)款金额1101955.444444.935有效的 N (列表状态)11035~50岁存(取)款金额743140.807346.756有效的 N (列表状态)7450岁以上存(取)款金额324407.915685.931有效的 N (列表状态)32农村户口20~35岁存(取)款金额532312.1911047.613有效的 N (列表状态)5335~50岁存(取)款金额261674.274648.642有效的 N (列表状态)2650岁以上存(取)款金额11815.45888.767有效的 N (列表状态)112) 分组、频数分析(对数据集居民储蓄调查数据(存款).sav进行分析)(原理与上题方法二一样利用拆分--只是最后将“描述统计”中的“描述”换成“频率”)得到:(也可以加上直方图)统计量存(取)款金额 城镇户口20岁以下N有效7缺失020~35岁N有效110缺失035~50岁N有效74缺失050岁以上N有效32缺失0农村户口20~35岁N有效53缺失035~50岁N有效26缺失050岁以上N有效11缺失03) 分析储户的户口和职业的基本情况(听老师说可以直接做饼状图:去掉拆分——图形-——旧对话框——饼图——个案组摘要、定义——职业移入“定义区分”,户口移入“行”)得出:4) 分析储户一次存款金额的分布,并对城镇储户和农村储户进行比较。
存款金额分为500元以下(包括500元)、500~2000元,2000~3500元、3500-5000元,5000以上将存款金额重新编码为不同变量,定义新值,做拆分—描述——频率:转换——重新编码不同变量——这个应该都熟悉具体不赘述,重新定义完后要返回到变量视图给“金额等级”赋值1代表500一下,2代表500-2000.然后做拆分(选入户口)——分析——频率——选入“金额等级”)得到:g户口频率百分比有效百分比累积百分比城镇户口有效500一下10446.646.646.6500-20006227.827.874.42000-3500114.94.979.43500-5000198.58.587.95000以上2712.112.1100.0合计223100.0100.0农村户口有效500一下4853.353.353.3500-20003437.837.891.12000-350044.44.495.63500-500011.11.196.75000以上33.33.3100.0合计90100.0100.0然后可以利用 “复式条形图 ” 做出下面:(去掉拆分——图形——旧对话框——条形图——复式条形图、定义——“金额等级”到类别轴,户口到定义类聚。
两个颠倒无所谓)二. 打开数据Employee data.sav,进行如下操作: 1)计算薪水增加额(saladd = salary- salbegin) (简单不说了)2)将薪水增加额分为四组(1:<=10000;2:10000-20000;3:20000-30000;4:>30000)并将分组结果保存在为变量saladd_g,定义变量saladd_g的Label(变量名标签)为薪水增加等级与上第四题一样,重新定义变量)3)利用描述统计分析不同性别的薪水增加情况,并以图表显示方法一:利用交叉表:分析——描述统计——交叉表——行、列内分别选入“性别”或“薪水增加等级”,两者顺序没要求方法二:利用拆分——把“性别”拆分——分析——描述统计——分析——选入“薪水增加等级”)得出:salary add* Gender 交叉制表计数 Gender合计FemaleMalesalary add1.006922912.001271372643.001553684.0054651合计216258474三1) a1、a2、a3、a4、a5、a6、a7、a8是运动员对本次赛事的印象数据,试分析运动员对本次赛事的印象情况,列出比例最高的前三项。
多选题的做法是要重新把所有选项定义为一个变量集:分析——多重响应——定义变量集——选入a1到a8所有选项,定义名称为 “印象”,然后对这个变量集做描述分析:分析——多重响应——频率——选入“印象”确定,完工)得出$印象 频率响应个案百分比N百分比Ga健康53726.1%79.7%高水平1346.5%19.9%国际化38718.8%57.4%大众38818.9%57.6%刺激954.6%14.1%时尚1225.9%18.1%高雅301.5%4.5%快乐36317.7%53.9%总计2056100.0%305.0%a. 值为 1 时制表的二分组2)2) 分析不同年龄段运动员对本次赛事的印象情况,列出比例最高的前三项方法一:将“年龄段”进行拆分,然后做:分析——多重响应——频率——选入“印象”确定方法二:利用交叉表做:分析——多重响应——交叉表——将“年龄段”和“印象”分别选入“行”和“列”,顺序无所谓——要看看变量视图里面,“年龄段”被赋了几个值——然后“定义范围”最小值为0,最大值为6)得出:年龄*$印象 交叉制表Ga总计健康高水平国际化大众刺激时尚高雅快乐年龄7-20岁计数1182787972625687151年龄 内的 %78.1%17.9%57.6%64.2%17.2%16.6%4.0%57.6%21-30岁计数29168211211506913198360年龄 内的 %80.8%18.9%58.6%58.6%13.9%19.2%3.6%55.0%31-40岁计数922967651423664120年龄 内的 %76.7%24.2%55.8%54.2%11.7%19.2%5.0%53.3%41-50岁计数187128123921年龄 内的 %85.7%33.3%57.1%38.1%4.8%9.5%14.3%42.9%51-60岁计数183107432522年龄 内的 %81.8%13.6%45.5%31.8%18.2%13.6%9.1%22.7%总计计数5371343873889512230363674百分比和总计以响应者为基础。
a. 值为 1 时制表的二分组4、 某研究者调查了一减肥产品的使用效果,结果如下表所示:(建立新数据库——切换到变量视图——建立三个变量“体重控制情况”赋值“0无效,1有效”;“使用情况”0未使用,1使用;频数——切换到数据视图输入数据——加权个案,将“频数”选入“频率变量”——分析—描述统计——交叉表——“体重控制情况”和“使用情况”选入“行”和“列”,在“单元格”里的“行”上打钩 ,ok)得出:体重控制情况* 使用情况 交叉制表使用情况合计未使用使用体重控制情况无效计数193352体重控制情况 中的 %36.5%63.5%100.0%有效计数272047体重控制情况 中的 %57.4%42.6%100.0%合计计数465399体重控制情况 中的 %46.5%53.5%100.0%体重控制情况有效无效合计是否使用该产品未使用271946使用203353合计4752991)请做出下表体重控制情况Total有效无效是否使用该产品未使用58.70%41.30%100%使用37.74%62.26%100%Total47.47%52.53%100%。
