
spss教程第二章均值比较检验与方差分析.doc
19页第二章 均值比较检验与方差分析 在经济社会问题的研究过程中,常常需要比较现象之间的某些指标有无显著差异,特别当考察的样本容量n比较大时,由随机变量的中心极限定理知,样本均值近似地服从正态分布所以,均值的比较检验主要研究关于正态总体的均值有关的假设是否成立的问题u 本章主要内容:1、单个总体均值的 t 检验(One-Sample T Test);2、两个独立总体样本均值的 t 检验(Independent-Sample T Test);3、两个有联系总体均值均值的 t 检验(Paired-Sample T Test);4、单因素方差分析(One-Way ANOVA);5、双因素方差分析(General Linear Model®Univariate)u 假设条件:研究的数据服从正态分布或近似地服从正态分布在Analyze菜单中,均值比较检验可以从菜单Compare Means,和General Linear Model得出如图2.1所示图2.1 均值的比较菜单选择项§2.1 单个总体的 t 检验(One-Sample T Test)分析 单个总体的 t 检验分析也称为单一样本的 t 检验分析,也就是检验单个变量的均值是否与假定的均数之间存在差异。
如将单个变量的样本均值与假定的常数相比较,通过检验得出预先的假设是否正确的结论例1:根据2002年我国不同行业的工资水平(数据库SY-2),检验国有企业的职工平均年工资收入是否等于10000元,假设数据近似地服从正态分布首先建立假设:H0:国有企业工资为10000元;H1:国有企业职工工资不等于10000元打开数据库SY-2,检验过程的操作按照下列步骤:1、单击Analyze ®Compare Means ®One-Sample T Test,打开One-Sample T Test 主对话框,如图2.2所示 图2.2 一个样本的t检验的主对话框 2、从左边框中选中需要检验的变量(国有单位)进入检验框中3、在Test Value框中键入原假设的均值数100004、单击Options按钮,得到Options对话框(如图2.3),选项分别是置信度(默认项是95%)和缺失值的处理方式选择后默认值后返回主对话框 图2.3 一个样本t检验的Options对话框5、单击OK,得输出结果如表2.1所示 表2.1(a).数据的基本统计描述 One-Sample Statistics N 样本容量Mean均值Std. Deviation标准差Std. Error Mean标准误国有单位3113559.90324809.97099863.89629表2.1 (b).一个样本均值t检验的检验结果 One-Sample Test Test Value = 10000t 值df自由度Sig. (2-tailed)P值Mean Difference均值差95% Confidence Interval of the Difference置信区间LowerUpper国有单位4.12130.0003559.903231795.59165324.2148从上面检验结果表2.1(a)可以得出国有单位职工工资的平均值、标准差和均值的标准误等反映数据特征的数据。
从表2.1(b)中可知检验的结果即相应的检验统计量t值为4.229,自由度为30,假设检验的P值(sig)小于0.05,故原假设不成立,检验结论是拒绝原假设H0,接受假设H1即认为国有企业职工的平均工资与10000元的假设差异显著§2.2 两个总体的 t 检验§2.2.1 两个独立样本的t检验(Independent-samples T Test)Independent-sample T Test是检验两个没有联系的总体样本均值间是否存在显著的差异,两个没有联系的总体样本也称独立样本如两个无联系的企业生产的同样产品之间的某项指标的均值的比较,不同地区的儿童身高、体重的比较等,都可以通过抽取样本检验两个总体的均值是否存在显著的差异例2.某医药研究所考察一种药品对男性和女性的治疗效果是否有显著差异,调查了10名男性服用者及7名女性服用者,对他们服药后的各项指标进行综合评分,服用的效果越好,分值就越高,每人所得的总分见表2.2,试根据表中的数据检验这种药品对男性和女性的治疗效果是否存在显著差异解:由于药品对男性或女性的影响是无联系的,因此这两个样本是相互独立的可以应用两独立样本的假设检验。
首先,建立假设H0:该药品对男性和女性的治疗效果没有显著差异; H1:该药品对男性和女性的治疗效果有显著差异 表2.2 男,女治疗效果的综合得分表性别分数序号男女11501402160120367784801355110896801007132105811596010100然后,根据表1的数据建立数据文件SY-4,并使用SPSS进行假设检验,具体操作步骤:1、单击Analyze ®Compare Means ®Independent-sample T Test,打开Independent-sample T Test 主对话框如图2.4 图2.4 两个独立样本t检验的主对话框2、选择要检验的变量“综合得分”进入检验框中3、选择分组变量“性别”进入分组框中,然后单击Define Group按纽,打开分组对话框如2.5图所示,确定分组值后返回主对话框,如果没有分组,可以选择Cut point单选项,并在激活的框内输入一个值作为分组界限值4、由Option选择按纽确定置信度值和缺失值的处理方式5、点击OK可得输出结果,见表2.3统计分析检验结果。
图2.5 独立样本t检验Define Groups 对话框6、分析输出结果并对结果作出分析见表2.3表2.3(a)Group Statistics分组统计描述表 性别NMeanStd. DeviationStd. Error Mean综合得分男10105.4034.39410.876 女7109.5723.1438.747表2.3(b)独立样本的均值比较检验表 方差齐性检验Levene's Test for Equality of Variances均值相等的t检验t-test for Equality of Means F值P值Sig. 统计量t自由度dfP值Sig. (2-tailed)均值差Mean Difference标准差Std. Error Difference95%的置信区间95% Confidence Interval of the Difference LowerUpper综合得分Equal variances assumed1.445.248-.27815.784-4.1714.980-36.10127.758 Equal variances not assumed-.29914.997.769-4.1713.957-33.92225.579检验表2.3(a) 基本统计表,检验表2.3(b)第三列和第四列是检验两样本数据的方差是否相等,从检验结果得知两样本的方差没有显著差异。
从第五列开始是对两个样本的均值的是否相等进行检验从假设检验的P值看出,它大于显著性水平0.05,所以说男女之间的机械能力之间并无显著差异,因此接受原假设H0而第八列之后分别是均值差、均值差标准误、均值差的置信区间§2.2.2 两个有联系总体间的均值比较(Paired-Sample T Test)Paired-Sample T Test是检验两个有联系正态总体的均值是否存在显著的差异又称配对样本的 t 检验经常用于生物、医药、农业、工业等多个行业如检验某种药品使用的效果是否显著,需要对使用者使用前后进行比较;再如对某种粮食进行品种改良,也需要比较改良前后粮食产量有无显著差异等例3:某企业对生产线上的工人进行某种专业技术培训,要对培训效果进行检验,从参加培训的工人中抽取30人,将他们培训前后的数据每加工500个零件的不合格品数进行对比,得到数据表见表2.4试根据表中数据检验培训前后工人的平均操作技术水平是否有显著提高,也就是检验培训效果是否显著表 2.4 工人培训前后不合格品数据表序号培训前培训后序号培训前培训后120166423117623321862441196254120646422163742226384323639522463105225631153267312532773135228741453297415533083解:这显然是配对样本均值的假设检验的问题。
所以要建立假设:H0:培训前后工人的技术水平没有显著差异;H1:培训前后工人的技术水平有显著差异;根据表2.3建立数据文件SY-5,根据中心极限定理,在大样本的情况下,样本均值近似地服从正态分布所以可以利用正态参数的检验方法进行均值的检验其检验过程的具体操作步骤为:1、单击Analyze ®Compare Means ® Paired-Sample T Test,打开Paired-Sample T Test主对话框如图2.62、选择要检验的两变量进入检验框中,注意,一定要选择两个变量进入检验框内,否则将无法得到检验结果3、由Option选择按纽确定置信度值95%和缺失值的处理方式4、点击OK得输出结果5、根据输出结果作出结论如表2.5所示图2.6 配对样本的t检验主对话框表2.5(a) Paired Samples Statistics 样本统计量分析 Mean样本容量N标准差Std. Deviation均值标准误Std. Error MeanPair 1培训前5.30301.368.250 培训后2.5330.973.178表 2.5(b) Paired Samples Test 配对样本均值差检验表 Paired Differences检验统计量t自由度dfP值(双尾)Sig. (2-tailed) MeanStd. DeviationStd. Error Mean95% Confidence Inte。












