1240编号表3 统计分析流程与的SPSS应用(t检验)
5 表表 3 统计分析流程与 SPSS 应用(计量资料的统计推断) 一二三四五六 资料 类型 分析 目的 分析 类型 统计指标指标的用途及注意事项SPSS 分析提示 点估计用样本均数作为总体均数 的估计值X 总体均 数的可 信区间 1、估计总体参数 是按预先给定的概率 (1- 常取 95%)确定 可能出现的范围。 (注意可信区间与个体参考值范围的区别) 。 已知时 ),( ,2,2 XX uXuX 未知时 ),( ,2,2 XX StXStX 未知, 但n足够大 ),( ,2,2 XX SuXSuX 1、建立数据库。 2、Analyze Compare Means,显示均数间比较子菜单。 3、选 OneSample T Test 显示“单个样本 t 检验对话框”。 4、将 X(变量)Test Variable 框中,在 Test Value: 中输入 0。此 时 0 相当于总体均数,输出的是样本所在总体均数 1- 的可信区间。 5、单击显示“Options对话框”,在Confidence Interval 框中,输 入需要计算的均数差值的可信区间范围,系统默认95%,可自行更改。 6、单击 按钮, 输出总体均数1-的可信区间。 参数 估计 区 间 估 计两总体 均数之 差的可 信区间 2、两个总体均数之差值的可信区间具有验 证假设检验作用。公式: ) ,( 21212121 ) 2( , 2 21 ) 2( , 2 21 XX nn XX nn StXXStXX 意义:当(1-)包含 0 时差异没有统计学意义, 当该区间不包含 0 时差异有统计学意义。 1、 2 同上。 3IndependentSample T Test, 显示独立样本 t 检验对话框。 4、 将 XTest Variables框, 单击 按钮, 显示 “Define Groups对话框”, 在Group 1:中输入1,Group 2:中输入 2。5、单击 显示“Options 子对话框”,输入需要计算的均数差值的可信区间的范围。 6、单击 按钮,输出两总体均数差值 1- 的可信区间。 单个样本均 数的 t 检验 1、公式: 1, 0 n S X t x 2、随机变量应具有独立性、正态性、方差齐。 1、2、3 步同总体均数可信区间的操作。 4、将 XTest Variable 框中,在 Test Value: 中输入总体均数。 5、单击按钮,输出 t 检验和均数差值的 95%可信区间的分析结果。 配对设计样 本均数比较 的 t 检验 1、公式: 1, 0 对子数 dd S d S d t 2、要求随机变量具有独立性、正态性。 1、2 步同上。 3、选 PairedSamples T Test,显示配对 t 检验对话框。 4、将 X1 Variable 1,X2 Variable 1。其它选默认。 5、单击 按钮,配对t 检验和均数差值的95%可信区间的分析结果。 两独立样本 均数比较的 t 检验 1、公式: 2, 21 21 21 nn S XX t xx 2、要求随机变量具有独立性、正态性、 方差齐性。 1、2、步同上。3IndependentSample T Test,显示独立样本 t 检验对话框。 4、将 XTest Variables框,将yGroupig Variable”框。 5、选Define Groups,在Group 1:中输入1,Group 2:中输入 2。 6、单击 输出结果。 数值 变量 资料 统计 推断 假设 检验 (两 个以 下样 本均 数比 较的 t 检验) 正态性检验 1、根据专业 知识判断。 2、图示法。 3、计算法。 1、建数据库。2、选 Graphs 菜单。3、选 P-P 或 Q-Q(图法)得 P-P 和 Q-Q 概率图。 4、Analyze Compare Means Means。5、将 XDependent List 栏。 6、单击 显示“Options 对话框”,在“Statistics 列表”中选 Kurtosis (偏度系数),Std. Error of Skweness (偏度系数的标准误), Kurtosis (峰度系数)、Error of Kurtosis (峰度系数的标准误)。 7、单击 输出结果。 6 两个小样本资料比较的 t 检验演示: 某克山病地区测得 11 名急性克山病人和 13 名健康人的血磷值(mol/L)如下:问该地急 性克山病人与健康人血磷值有无不同? 病 人:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健康人:0.54 0.64 0.64 0.75 0.75 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 1、分析资料、分析资料 该资料的因变量为血磷值,属数值变量,病人与健康人为分类变量。 回答上述问题可用两个独立样本均数的 t 检验。 2、建立数据库、建立数据库 设变量 X 为血磷,变量标签为血磷值(mol/L), 设变量 Y 为分组,变量值标签为 1=克山病人,2=健康人。 3、录入数据、录入数据 录入数据后的数据视窗,见图 1。 4、SPSS 分析操作分析操作 (1) 在主菜单中, 选择 “Analyze Compare Mean IndependentSample T Test”,显示 “两个样本 t 检验对话框”,见图 2。 ( 2) 将 X 送 入 “Test Variables”框 , 此 时 “Groupig Variable”框,栏内显示 Y? 与此 同时 按钮被激活,单击它显示 “确定分 组对话框”,指定哪一组与哪一组比较。 见图 3。 (3)在“Define Groups对话框”中输入对比分组的标签, 在 Group 1:中输入 “1”,在 Group 2:中输入“2”,其含义第 1 组为克山病人组,第 2 组为健康 人组。见图 3。单击 ,返回主对话框,单击“OK”,执行程序,输出结果。 5、输出结果并分析、输出结果并分析 共输出两张表格。 表 3.1 输出基本统计描述结果,横排依次为分组、例数、均数、标准差和标准误。 表3.2输出的是两个样本方差齐性检验和均数比较的t检验结果及均数差值95%可信区 间的分析结果。见表中标注。 分析结果的表述:分析结果的表述: 由表由表 3.2 可知:可知:F=0.032,Sig(确切概率)(确切概率)=0.8600.05,说明两组方差齐; 应使用 说明两组方差齐; 应使用 Equal variances assumed 行行 t 检验结果,本例检验结果,本例 t 值为值为 t=2.524,df(自 由度) (自 由度)=22,Sig (2tailed 双侧确切概率双侧确切概率) =0.019。按检验水准。按检验水准 =0.05,现双侧 概率 ,现双侧 概率 P=0.0190.05。因此拒绝。因此拒绝 H0,接受接受 H1,差异具有统计学意义。由表,差异具有统计学意义。由表 3.1 可可 方差齐性检 验与 t检验 两个小样本均数比较时,应先做方差 齐性检验,如方差不齐需做 t检验。 在 IndependentSample T Test过程中,自动输出方差不齐时的 t 检验结果,表中 第二行 Equal variances not assumed 即为 t检验结果。 图 2 两个样本 t 检验主对话框 图 1 录入数据后的数据视窗 3.8 Group Statistics 111.5209.42179.12718 131.0846.42215.11708 NMeanStd. DeviationStd. Error Mean 表3.1表3.1 图 3 确定分组变量对话框 3.9 Independent Samples Test .032.8602.52422.019.4363.17288.07777.79482 2.52421.4.020.4363.17286.07716.79542 Equal variances assumed Equal variances not assumed FSig. Levenes Test for Equality of Variances tdf Sig. (2-tailed) Mean Difference Std. Error DifferenceLowerUpper 95% Confidence Interval of the Difference t-test for Equality of Means 表3.2表3.2 t 检验结果 均数差值 的标准差 差值的 95%可信区间 在方差齐时用 上一行结果否 则用下行结果 均数差值的标准误 方差齐性 检验结果 7 知克山病人血磷值为知克山病人血磷值为 1.5209(mol/L),健康人血磷值为,健康人血磷值为 1.0846 (mol/L),故可以 认为克山病人的血磷值高于健康人。 另外从表 ,故可以 认为克山病人的血磷值高于健康人。 另外从表 3.2 给出的差值的给出的差值的 95%可信区间 分析结果可知,两均数差值的 可信区间 分析结果可知,两均数差值的 95%可信区间为可信区间为 0.077770.79482(mol/L),该 区间不包含 ,该 区间不包含 0,说明两样本均数间差异有统计学意义。此结果与,说明两样本均数间差异有统计学意义。此结果与 t 检验的结果 一致。 检验的结果 一致。