
《统计分析与SPSS的应用》课后练习答案(第4章).docx
11页《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第4章SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条 形图分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图—— 图表值(频率) 继续,勾选显示频率表格,点击确定Statistics户口所在 地职业年龄Valid282282282NMissing000户口所在地FrequencyPercentValidPercentCumulativePercent中心城市20070.970.970.9Valid边远郊区8229.129.1100.0Total282100.0100.0职业FrequencyPercentValidPercentCumulativePercent国家机关248.58.58.5商业服务业5419.119.127.7文教卫生186.46.434.0公交建筑业155.35.339.4Valid经营性公司186.46.445.7学校155.35.351.1一般农户3512.412.463.5种粮棉专业户41.41.464.9种果菜专业户103.53.568.4工商运专业 户3412.112.180.5退役人员176.06.086.5金融机构3512.412.498.9现役军人31.11.1100.0Total282100.0100.0年龄FrequencyPercentValidPercentCumulativePercent20岁以下41.41.41.420~35 岁14651.851.853.2Valid 35~50 岁9132.332.385.550岁以上4114.514.5100.0Total282100.0100.0尸口所在地_ -o O5 OAQUalnbalt0-•■'I一户口所在地o-职业60-军职业年龄年龄Aouanbai分析:本次调查的有效样本为282份。
常住地的分布状况是:在中心城市的人最多,有 200人,而在边远郊区只有82人;职业的分布状况是:在商业服务业的人最多,其次是一 般农户和金融机构;年龄方面:在35-50岁的人最多由于变量中无缺失数据,因此频数分 布表中的百分比相同2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款 金额的基本特征,并与标准正态分布曲线进行对比进一步,对不同常住地储户存款金额的基本特征进行 对比分析分析——描述统计——描述,选择存款金额到变量中点击选项,勾选均值、标准差、方差、最小值、最 大值、范围、偏度、峰度、按变量列表,点击继续——确定Descriptive StatisticsNMe日nStd. DeviationSkewnessKurtosisStatisticStatisticStatisticStatisticStd. ErrorStatisticStd. Error存陋)款金颔Valid N (listwise)2822824738.0910945.5695.234.14533.656.289分析:由表中可以看出,有效样本为282份,存(取)款金额的均值是4738.09,标准差为 10945.09,峰度系数为33.656,偏度系数为5.234。
与标准正态分布曲线进行对比,由峰 度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出, 此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大Descripitive Statistics户口所在地NMeanStd. DeviationSkewnessKurtosisStatisticStatisticStatisticStatisticStd. ErrorStatisticStd. Error中怙城市存隈)款金额Valid N (listwise)2002004956.949792.51 54.293.17223.208.342边远郊区存隈)款金额Valid N (listwise)82824204.3213402.4255.948.26638.060.526分析:由表中可以看出,中心城市有200人,边远郊区为82人两部分样本存取款金额均 呈右偏尖峰分布,且边远郊区更明显3、 利用第2章第7题数据,如果假设存款金额服从正态分布,能否利用本章所讲解的功能, 找到存款金额“与众不同”的样本,并说明理由分析——描述统计——描述,选择存款金额到变量中。
对“将标准化得分另存为变量”打上 勾,然后对数据编辑窗口中的最后一列变量标准化Z变量进行排序,并观察,找到它的绝对 值大于3的都是“与众不同”的样本理由:标准化值反映的是样本值与样本均值的差是几个标准差单位如果标准化值等于0, 则表示该样本值等于样本均值;如果标准化值大于0,则表示该样本值大于样本均值;如果 标准化值小于0,则表示该样本值小于样本均值如果标准化值的绝对值大于3,则可认为 是异常值4、 利用第2章第7题数据,结合被调查者的常住地或职业或年龄状况,分析储户的收入分布特征分析——描述统计——交叉表,选择常住地、职业、年龄到行中,选择收入水平到列中,勾选“显示复式 条形图”点击单元格——选择观测值、期望、行、列、合计点击统计量——选择卡方点击继续确定 利用列联分析实现首先编制列联表,然后进行卡方检验以户口和收入的列联分析为例:户口所在地*收入水平Crosstabulation收入水平Total100CI元以下1000-3000元3000-5000元50叩元以上户口所在地中心城市Count191274014200Expected Count35.5116.335.512.8200.0% within户口所在地9.5%63.5%20.0%7.0%100.0%% within收入水平38.0%77.4%80.0%77.8%70.9%边远郊区Count313710482Expected Count14.547.714.55.282.0% within户口所在地37.8%45.1%12.2%4.9%100.0%% within收入水平62.0%22.6%20.0%22.2%29.1%TotalCount501 645018282Expected Count50.0164.050.01 8.0282.0% within F 口所在地17.7%58.2%17.7%6.4%100.0%% within收入水平1 00.0%100.0%100.0%100.0%100.0%Chi-Square TestsValuedfAsymp. Sig.(2-sided)Pearson Chi-Square32.06433.000Likelihood Ratio29.3663.000Linear-by-Linear Association15.8961.000N ofValid Cases282a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 5.23.表中,卡方统计量的观测值等于32.064,概率-P值等于0.001。
若显著性水平设为0.05, 由于0.001<0.05,拒绝原假设,表明户口地与收入水平不独立5、说明第2章第7题资料中的多选项问题是按照哪种拆分方式拆分的利用多选项分析被调查者本次存 款的最主要目的是什么答:第2章第7题资料的多选项问题是按照分类法拆分的目的是为了把多选项问题的分析转化为对多个 问题的分析,即对多个SPSS变量的分析多选项分类法;$set FrequenciesResponsesPerce nt ofCasesNPercent$seta 买高档消费品677.9%23.8%结婚用516.0%18.1%正常生活零用18021.3%63.8%做生意526.1%18.4%购买农业生产资料161.9%5.7%买证券及单位集资344.0%1 2.1 %买房或逹房8810.4%31.2%支付孩子教育费769.0%27.0%养老金556.5%19.5%防以外爭故10712.6%37.9%得利息1 2014.2%42.6%Total846100.0%300.0%a. Group存款的最主要目的是正常生活零用6、三代同堂的家庭中,婆婆与儿媳妇关系紧张的现象并不少见,为了了解住房条件对婆媳关系的影响, 对600户家庭进行了调查并进行了列联分析,如下表:1)补充表中第一行和第四行空缺的计算结果。
婆媳关系*住房条件Cross tabula tion住房条件Total差一般好婆媳关系紧张Cou nt577860195Expected Count48.7568.2578195% wit hin婆媳关系29.23%40.00%30.77%100.00%% wit hin住房条件38.00%37.14%25.00%32.50%般Cou nt458763195Expected Count48.7568.2578195% wit hin婆媳关系23.08%44.62%32.31%100.00%% wit hin住房条件30.00%41.43%26.25%32.50%和睦Cou nt4845117210Expected Count52.573.584210% wit hin婆媳关系22.86%21.43%55.71%100.00%% w。












