excel在假设检验中的应用
- 40 - 江苏统计 · 计算机应用2002. 08 患者编号12345678910 治疗前112 113 134 110 125 117 108 120 118 138 治疗后104 96 103 90 108 119 9290 102 121 一、基本原理 假设检验是推断统计中的一项重 要内容,它先对研究总体的参数作出 某种假设,然后从所研究总体中抽取 样本进行观察,用样本所提供的信息 对假设的正确性进行判断,从而决定 假设是否成立 。若观察结果与理论不 符,则须放弃假设;否则,认为无充 分证据表明假设错误 。假设检验的一 般步骤是:提出零假设和备择假设; 确定适当的检验统计量并计算其值; 根据显著性水平定出拒绝区;作出 最终结论。 二、单个样本的假设检验 对单个样本的假设检验,我们可 以根据抽样推断的思路,用相应函数 计算临界值,来判断是接受还是拒绝 零假设。以检验均值为例,当样本是 小样本(即n 30)时,我们使用t统 计量;当样本是大样本时,我们使用z 统计量。 例1.某工人包装果脯,假定果脯 的重量服从正态分布 。检验员随机抽 查12包,计算出样本平均数为159克, 样本标准差为115克,果脯的包装要求 是平均重量= 160克。 若显著性水平为 011 ,该工人包装的果脯是否合格? 解: H0:= 160H1: 160 计算t统计量: t = x ?- s/n = 159- 160 1. 5/11 = - 2. 31 显著性水平为011,自由度为11, 所以输入 “= TINV(011, 11)”,可得 ta= 11796,即为临界值。 t的绝对值大于临界值ta 落入 拒绝区, H0被否定,即该工人包装的 果脯不合格。 特别注意假设检验是分单边和 双边的。如果例1的问题是“该工人包 装的干果是否偏少?”,那么这就是 单边检验,在计算临界值是则为“= TINV(012,11)”, ta= 11363。 例2.某工人包装大量果脯,检验 员随机抽查50包,计算出样本平均数 为159克,样本标准差为115克,果脯 的包装要求是平均重量= 160克。若 显著性水平为0105,该工人包装的果脯 是否合格? 解: H0:= 160H1: 160 计算z统计量: z= x ?- s/n = 159- 160 1. 5/50 = - 4. 71 输入“= NORMSINV(01 025) ”,可 得za= 1196 ,即为临界值。 z的绝对值大于临界值za 落入 拒绝区, H0被否定,即该工人包装的 果脯不合格。 Excel提供的数据分析工具主要是 用于解决成对数据或两个样本的假设检 验问题。这些工具包括:成对观测值t 检验、方差相等的两样本t检验、方差 不等的两样本t检验、两平均差的Z检 验、两样本方差的F检验。下面我们列 举说明这些数据分析工具的使用方法。 三、成对观测值的t检验 实际工作中往往会遇到均值的成对 比较,如采用新教育方法前后学生的成 绩、进行体育疗法前后患者的血压等。 Excel数据分析工具中有一项“t检验: 平均值的成对二样本分析”,它就是用 以对两组成对数据进行均值是否相等的 检验。进行成对样本的t检验要求被比 较的两个样本有配对关系,要求两个样 本均来自正态总体,但并不要求两个总 体的方差相等。成对样本t检验实际上 是先求每对观测值之差值,对差值求均 值,检验成对变量均值之间差异是否显 著,其实质检验的假设实际上是差值的 均值与零均值之间差异的显著性。如果 差值均值与0均值无显著性差异说明成 对变量均值之间无显著性差异。当样本 是满足上述条件的成对数据时,可以使 用该工具进行检验,统计值t的公式如 下: t = x ? 1 - x ? 2 s2( 1 n1 + 1 n2 ) t (n1 - 1) 其中: s2= n1s1 2 + n 2s2 2 n1 + n 2 - 2 例3.10个高血压患者在施以体 育疗法前后测定舒张压资料如下: 假设两个总体为正态,以0105的 显著性水平,检验体育疗法对降低血 压是否有疗效。 解: H0:1 2= 0H1:1 20 操作如下: 将成对的原始数据置放在区域 A1:C11中; 选择菜单“工具” “数据分 析”,打开“数据分析”对话框;并 选择“t检验:平均值的成对二样本分 析”项。 打开“t检验:平均值的成对二 样本分析”分析工具对话框。 填入适当的参数,点击 “确 定”,则在工作表中自动生成结果。 我们可以得出: t = 5164; t= 2126(双边) t的绝对值大于临界值 落入拒 绝区, H0被否定,即体育疗法对降低 血压有显著疗效。 例4.有一个健美中心声称,参加 他们的训练班至少可以使肥胖者平均 减少17斤以上。为了验证其说法,调 查人员随机抽取了10名参加者,得到 他们的体重记录,资料如下: 假设两个总体为正态,以0105的 显著性水平,检验健美中心的说法是 否有依据。 编号12345678910 训练前189 202 220 107 194 177 193 202 208 233 训练后170 179 203 192 172 161 174 187 186 204 (南京经济学院,江苏南京210003) EXCEL在假设检验中的应用 文/胡荣华,管于华 - 41 - 江苏统计 · 计算机应用2002. 08 s = (n 1- 1)s1 2+ (n 2- 1)s2 2 n1+ n2- 2 t = x ? 1- x ? 2 s(1 n1 + 1 n2 ) t (n1+ n2 - 2) t = = x ? 1 - x ? 2 s12 n1 + s22 n2 t (l ) l = (s 12/ n1 + s 22n2) (s 12/ n1)2/ (n1- 1) + (s 22/ n2)2/ (n2 - 1) 编号12345678910 老方法85926785596882798275 新方法86689497755675808983 解: H0:1 2 17 操作如下: 将成对的原始数据置放在区域 A1:C11中; 选择菜单“工具” “数据分 析”,打开“数据分析”对话框;并 选择“t检验:平均值的成对二样本分 析”项,在分析工具对话框中,在 “假设平均差”中填写“17“ ; 点击“确定”,则在工作表中 自动生成结果: 图1:“t检验:平均值的成对二 样本分析”的分析结果 从图1中我们可以看出: t = 1194; t= 1183(单双) t的绝对值大于临界值 落入拒 绝区, H0被否定,即健美中心可以达 到其声称的减肥目的。 四、方差相等的两样本的t检验 Excel数据分析工具中有一项 “t 检验:双样本等方差假设”,其应用 条件是两个总体为正态分布,方差均 为未知,但假定两者相等 。在小样本 的情况下,可以使用它来检验两个样 本均值是否相等 。统计值t的公式如 下: 其中: 例5.对某课程的教学方法进行 改进,为对比其效果,以老方法对10 名学生讲授,用新方法对另10名学生 讲授,然后进行测验,资料如下: 假设两个总体为正态总体,且方 差相等,以0105的显著性水平,检验 新方法是否效果显著。 解: H0:1=2H1:1 2 操作如下: 将成对的原始数据置放在区域 A1:C11中; 选择菜单“工具” “数据分 析”,打开“数据分析”对话框;并 选择 “t检验:双样本等方差假设” 项; 打开“t检验:双样本等方差假 设”分析工具对话框; 填入适当的参数,点击“确定”, 则在工作表中自动生成结果: 中我们可以得出: t = - 0157; t= 211(双边) t的绝对值小于临界值 落入接 受区, H0被接受,即老方法与新方法 没有显著差异。 五、两样本方差相等的F检验 Excel的数据分析工具中有一项 “F检验:双样本方差检验”,其应用 条件是两个总体为正态分布,均值相 等,在小样本的情况下,根据独立样 本的方差可以来比较两个总体的方差 是否相等。统计值F的公式如下: F= s12 s22F(n1- 1 ,n2 - 1) 例6.有人认为在数学方面,女孩 总体来说比较平稳,没有尖子,也很 少有差生;而男孩总体差异较大,好 的好,坏的坏。 果真如此吗?假定分别挑 选男生和女生各14名进行数学测验,成 绩在图8的A1: B15区域。若将12和 22分别代表男生和女生成绩的方差,并 假定总体是服从正态的,以0105的显著 性水平检验12和22是否相等。 解: H0:1=2H1:1 2 操作如下: 选择菜单“工具” “数据分 析”,打开“数据分析”对话框; 从“数据分析”对话框中分析 工具列表中选择“F检验:双样本方差 分析”,打开对话框。 填入适当的参数,点击 “确 定”,如图2: 图2:“F检验:双样本方差分 析”的分析结果 从图2中我们可以看出:t = 110897; t= 2157(双边) F值小于临界值FH0被接 受,即没有理由认为男女生数学成绩 的方差有别。 六、其它假设检验工具 一是Excel数据分析工具中“z检 验:双样本平均差检验”,其应用条 件是两个总体服从正态分布,方差已 知。在大样本的情况下,可以使用它 来检验两个样本均值差是否与某一常 数d相等。统计值z的公式如下: z= x ? 1- x ? 2- d 12 n1 + 22 n2 二是Excel数据分析工具中“t检 验:双样本异方差假设”,其应用条 件是两个总体服从正态分布,方差均 未知且不相等 。在小样本的情况下, 可以使用它来检验两个样本均值是否 相等。统计值t的公式如下: 其中: l是自由度,它是通过计算求得 的,有可能的小数。 (责任编辑:张海峰)