好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

十章双样本假设验及区间估计.ppt

50页
  • 卖家[上传人]:人***
  • 文档编号:580444749
  • 上传时间:2024-08-29
  • 文档格式:PPT
  • 文档大小:1.52MB
  • / 50 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第十章第十章 双样本假设检验及区间估计双样本假设检验及区间估计 我们在掌握了单样本检验与估计的有关方法与原理我们在掌握了单样本检验与估计的有关方法与原理之后,把视野投向双样本检验与估计是很自然的双样之后,把视野投向双样本检验与估计是很自然的双样本统计,除了有大样本、小样本之分外,根据抽样之不本统计,除了有大样本、小样本之分外,根据抽样之不同,还可分为同,还可分为独立样本独立样本与与配对样本配对样本 独立样本独立样本, 指指双样本是在两个双样本是在两个总体中相互独立总体中相互独立地抽取的地抽取的 配对样本,指只有一配对样本,指只有一个总体,双样本是由于样个总体,双样本是由于样本中的个体两两匹配成对本中的个体两两匹配成对而产生的配对样本相互而产生的配对样本相互之间不独立之间不独立8/29/20241 第一节第一节 两总体大样本假设检验两总体大样本假设检验 为了把单样本检验推广到能够比较两个样本的均值的检验,必须为了把单样本检验推广到能够比较两个样本的均值的检验,必须再一次运用中心极限定理下面是一条由中心极限定理推广而来的重再一次运用中心极限定理。

      下面是一条由中心极限定理推广而来的重要定理:如果从要定理:如果从 和和 两个总体中分别抽取容量为两个总体中分别抽取容量为n1和和n2 的独立随机样本,那么两个样本的均值差的独立随机样本,那么两个样本的均值差 的抽样分的抽样分布就是布就是 与单样本的情况相同,在大样本的与单样本的情况相同,在大样本的情况下情况下(两个样本的容量都超过两个样本的容量都超过50),这个定理可以推广应用于任何具,这个定理可以推广应用于任何具有均值有均值μ1和和μ2以及方差以及方差 和和 的两个总体当的两个总体当n1和和n2逐渐变大逐渐变大时,时, 的抽样分布像前面那样将接近正态分布的抽样分布像前面那样将接近正态分布8/29/20242 1.大样本均值差检验.大样本均值差检验 ((1)零假设:)零假设:((2)备择假设:)备择假设: 单侧单侧 双侧双侧 或或((3))否定域:单侧否定域:单侧 双侧双侧((4)检验统计量)检验统计量((5)比较判定)比较判定8/29/20243 [例例]为了比较已婚妇女对婚后生活的态度是否因婚为了比较已婚妇女对婚后生活的态度是否因婚龄而有所差别,将已婚妇女按对婚后生活的态度分为龄而有所差别,将已婚妇女按对婚后生活的态度分为“满满意意”和和“不满意不满意”两组。

      从满意组中随机抽取两组从满意组中随机抽取600名妇女,名妇女,其平均婚龄为其平均婚龄为8.5年,标准差为年,标准差为2.3年;从不满意组抽出年;从不满意组抽出500名妇女,其平均婚龄为名妇女,其平均婚龄为9.2年,标准差年,标准差2.8年试问在年试问在0.05显著性水平上两组是否存在显著性差异?显著性水平上两组是否存在显著性差异? 样本样本人数人数均值均值标准差标准差满意组满意组6008.52.3不满意组不满意组5009.22.88/29/20244 [解解] 据题意,据题意,“不满意不满意”组的抽样结果为:组的抽样结果为: ==9.2年,年, S1==2.8年,年, n1==500;; “满意满意”组的抽样结果为:组的抽样结果为: ==8.5 年,年,S2==2.3 年,年, n2==600 H0::μ1―μ2==D0==0 H1:: μ1―μ2 ≠0 计算检验统计量计算检验统计量 确定否定域,确定否定域, 因为因为α==0.05,因而有,因而有 Zα/2==1.96<<4.47 因此否定零假设,即可以认为在因此否定零假设,即可以认为在0.05显著性水平上,婚龄对妇女婚显著性水平上,婚龄对妇女婚后生活的态度是有影响的。

      同时我们看到,由于样本计算值后生活的态度是有影响的同时我们看到,由于样本计算值Z==4.47 远大远大于单侧于单侧 Z0.05 的临界值的临界值1. 65,因此本题接受,因此本题接受μ1―μ2 >>0 的备择假设,即可的备择假设,即可以认为妇女婚龄长容易对婚后生活产生以认为妇女婚龄长容易对婚后生活产生“不满意不满意” 8/29/20245 2..大样本成数差检验大样本成数差检验 ((1)零假设:)零假设:((2)备择假设:)备择假设: 单侧单侧 双侧双侧 或或((3))否定域:单侧否定域:单侧 双侧双侧((4)检验统计量)检验统计量 其中其中: 为总体为总体1的的 样本成数样本成数 为总体为总体2的的 样本成数。

      样本成数8/29/20246 当当p1和和p2未知,须用样本成数未知,须用样本成数 和和 进行估算时,分以下两进行估算时,分以下两种情况讨论:种情况讨论: ①① 若零假设中两总体成数的关系为若零假设中两总体成数的关系为 ,这时两总体可看作成数,这时两总体可看作成数P 相同的总体,它相同的总体,它们的点估计值为们的点估计值为 此时上式中检验此时上式中检验统计量统计量 Z 可简化为可简化为 ②② 若零假设中两总体成数若零假设中两总体成数 ,那么它们的点估计值有,那么它们的点估计值有 此时上式中此时上式中 检验统计量检验统计量Z为为((5)判定)判定8/29/20247 [例例]有一个大学生的随机样本,按照性格有一个大学生的随机样本,按照性格“外向外向”和和“内向内向”,把他们分成两类。

      结果发现,新生中有,把他们分成两类结果发现,新生中有73%%属属于于“外向外向”类,四年级学生中有类,四年级学生中有58%属于%属于“外向外向”类样本样本中新生有中新生有171名,四年级学生有名,四年级学生有117名试问,在名试问,在0.01水平水平上,两类学生有无显著性差异?上,两类学生有无显著性差异?外向外向内向内向四年级四年级58%((117))42%一年级一年级73%((171))27%8/29/20248 [解解] 据题意据题意 新生组的抽样结果为:新生组的抽样结果为: ==0.73,, ==0.27,,n1==171 四年级学生组的抽样结果为四年级学生组的抽样结果为: ==0.58,, ==0.42,,n2==117 H0::p1―p2==D0==0 H1::p1―p2==D0≠0 计算检验统计量计算检验统计量 确定否定域确定否定域 因为因为α==0.01,因而有,因而有 Zα/2==Z0.005==2.58<<2.66 因而否定零假设,即可以认为在因而否定零假设,即可以认为在0.01显著性水平上,两类学生在显著性水平上,两类学生在性格上是有差异的。

      性格上是有差异的 8/29/20249 第二节第二节 两总体小样本假设检验两总体小样本假设检验 与对单总体小样本假设检验一样,我们对两与对单总体小样本假设检验一样,我们对两总体小样本假设检只讨论总体满足正态分布的情总体小样本假设检只讨论总体满足正态分布的情况1. 小样本均值差假设检验小样本均值差假设检验 (1) 当当 和和 已知时,小样本均值差已知时,小样本均值差检验,与上一节所述大样本总体均值差检验完全检验,与上一节所述大样本总体均值差检验完全相同,这里不再赘述相同,这里不再赘述8/29/202410 (2) 和和 未知,但假定它们相等时,未知,但假定它们相等时, 关键是要解决关键是要解决 的算式 现又因为现又因为σ未知,所以要用它的未知,所以要用它的无偏估计量无偏估计量 替代它由于两个样替代它由于两个样本的方差基于不同的样本容量,因而本的方差基于不同的样本容量,因而可以用加权的方法求出可以用加权的方法求出σ的无偏估计的无偏估计量,得量,得 注意,上式的分母上减注意,上式的分母上减2,是因为,是因为根据根据 和和 计算计算S1和和S2时,分别损时,分别损失了一个自由度,一共损失了两个自由失了一个自由度,一共损失了两个自由度,所以全部自由度的数目就成为度,所以全部自由度的数目就成为(n1+ n2―2)。

      于是有于是有8/29/202411 这样,对小样本正态总体,这样,对小样本正态总体, 和和 未知,但未知,但σ1==σ2 ,,其均值差的检验步骤如下其均值差的检验步骤如下: ((1)零假设:)零假设:((2)备择假设:)备择假设: 单侧单侧 双侧双侧 或或((3))否定域:单侧否定域:单侧 双侧双侧((4)检验统计量)检验统计量((5)比较判定)比较判定8/29/202412 [例例]为研究某地民族间家庭规模是否有所不同,各做为研究某地民族间家庭规模是否有所不同,各做如下独立随机抽样:如下独立随机抽样: 民族民族A::12户,平均人口户,平均人口6.8人,标准差人,标准差1.5人人 民族民族B::12户,平均人口户,平均人口5.3人,标准差人,标准差0.9人人 问:能否认为问:能否认为A民族的家庭平均人口高于民族的家庭平均人口高于B民族的家民族的家庭平均人口(庭平均人口( α=0.05)?()?(假定家庭平均人口服从正态假定家庭平均人口服从正态分布,且方差相等)分布,且方差相等)t=2.97 [例例] 某市对儿童体重情况进行调查,抽查某市对儿童体重情况进行调查,抽查8岁的女岁的女孩孩20人,平均体重人,平均体重22.2千克,标准差千克,标准差2.46千克;抽查千克;抽查8岁的岁的男孩男孩18人,平均体重人,平均体重21.3千克,标准差千克,标准差1.82千克。

      若男女千克若男女儿童体重的总体方差相等,问在显著性水平儿童体重的总体方差相等,问在显著性水平5%上,该年上,该年龄男女儿童之体重有无显著差异龄男女儿童之体重有无显著差异? 8/29/202413 [解解] 据题意,据题意,女孩组的抽样结果为:女孩组的抽样结果为: ==22.2(千克千克),, S1==2.46(千克千克),,n1==20(人人) 男孩组的抽样结果为:男孩组的抽样结果为: ==21.3(千克千克),,S2==1.82(千克千克),, n2==18(人人) H0::μ1―μ2==D0==0 H1::μ1―μ2≠0 计算检验统计量计算检验统计量 确定否定域确定否定域 因因α==0.05,因而有,因而有t 0.025 (36)==2.028>>1.24 故不能否定故不能否定H0,即可认为男女儿童平均体重无显著性差异即可认为男女儿童平均体重无显著性差异 8/29/202414 (3) 和和 未知,但不能假定它们相等未知,但不能假定它们相等 如果不能假定如果不能假定σσσσ1 1 1 1====σσσσ2 2 2 2 ,那么就不能引进共同的,那么就不能引进共同的σσ简化简化 ,也不能计算,也不能计算σσ的无偏估计量的无偏估计量 。

      现在简单的做法是用现在简单的做法是用 估计估计 ,用,用 估计估计 ,于是有,于是有 [例例] 用上式重新求解前例题用上式重新求解前例题 [解解] 用上式,检验统计量的计算为用上式,检验统计量的计算为 可以看出,求算用可以看出,求算用(10.8)式和式和(10.10)式,得出的结果差别不大式,得出的结果差别不大 8/29/202415 2.小样本方差比检验.小样本方差比检验 在实际研究中,除了要比较两总体的均值外,有时还需要比较两在实际研究中,除了要比较两总体的均值外,有时还需要比较两在实际研究中,除了要比较两总体的均值外,有时还需要比较两在实际研究中,除了要比较两总体的均值外,有时还需要比较两总体的方差例如对农村家庭和城镇家庭进行比较,除了平均收入的总体的方差例如对农村家庭和城镇家庭进行比较,除了平均收入的总体的方差。

      例如对农村家庭和城镇家庭进行比较,除了平均收入的总体的方差例如对农村家庭和城镇家庭进行比较,除了平均收入的比较外,还要用方差比较收入的不平均情况此外,刚刚在小样本均比较外,还要用方差比较收入的不平均情况此外,刚刚在小样本均比较外,还要用方差比较收入的不平均情况此外,刚刚在小样本均比较外,还要用方差比较收入的不平均情况此外,刚刚在小样本均值差的检验中曾谈到,当方差未知时,往往还假设两总体方差相等值差的检验中曾谈到,当方差未知时,往往还假设两总体方差相等值差的检验中曾谈到,当方差未知时,往往还假设两总体方差相等值差的检验中曾谈到,当方差未知时,往往还假设两总体方差相等因此,在总体方差未知的情况下,先进行方差比检验,对于均值差检因此,在总体方差未知的情况下,先进行方差比检验,对于均值差检因此,在总体方差未知的情况下,先进行方差比检验,对于均值差检因此,在总体方差未知的情况下,先进行方差比检验,对于均值差检检验也是具有一定意义的检验也是具有一定意义的检验也是具有一定意义的检验也是具有一定意义的 设两总体分别满足正态分布设两总体分别满足正态分布 和和 。

      现从这两现从这两个总体中分别独立地各抽取一个随机样本,并具有容量个总体中分别独立地各抽取一个随机样本,并具有容量n1,,n2和方差和方差 ,, 根据第八章根据第八章(8.22)式,对两总体样本方差的抽样分布分别式,对两总体样本方差的抽样分布分别有有 8/29/202416 根据本书第八章第四节根据本书第八章第四节F分布中的分布中的(8.25)式有式有 由于由于 ,,所以简化后,检验方差比所所以简化后,检验方差比所用统计量为用统计量为 当零假设当零假设H0:: σ1==σ2时,时,上式中的统计量又简化为上式中的统计量又简化为8/29/202417 这样一来,小样本正态总体方差比检验的步骤有这样一来,小样本正态总体方差比检验的步骤有 (1) 零零 假假 设设H0 :: 备择假设备择假设H1 :: 单侧单侧 双侧双侧 H1 :: H1 :: H1 :: (2) 检验统计量检验统计量 (( )) (( )) (( )) 单单侧侧双双侧侧8/29/202418 (3)(3)否定域否定域( (参见下图参见下图) ) 单侧单侧 F Fαα((n n1 1―1―1,,n n2 2―1―1),双侧),双侧F Fα/α/2 2((n n1 1―1―1,,n n2 2―1―1)) 方差比检验,比起前面所介绍的检验有一个不同点,那就是无方差比检验,比起前面所介绍的检验有一个不同点,那就是无论是单侧检验还是双侧检验,论是单侧检验还是双侧检验,F F 的临界值都只在右侧。

      其原因是我的临界值都只在右侧其原因是我们总是把和中的较大者放在分子上,以便使用者掌握因此有们总是把和中的较大者放在分子上,以便使用者掌握因此有 ≥ ≥1 1 或者或者 ≥ ≥1 18/29/202419 [ [ [ [例例例例] ] ] ] 为了研究男性青年和女性青年两身高总为了研究男性青年和女性青年两身高总为了研究男性青年和女性青年两身高总为了研究男性青年和女性青年两身高总体的方差是否相等,分别作了独立随机抽样对体的方差是否相等,分别作了独立随机抽样对体的方差是否相等,分别作了独立随机抽样对体的方差是否相等,分别作了独立随机抽样对男性青年样本有男性青年样本有男性青年样本有男性青年样本有n n n n1 1 1 1====10101010,,,, ====30.8(30.8(30.8(30.8(厘米厘米厘米厘米2 2 2 2) ) ) );对;对;对;对女性青年样本有女性青年样本有女性青年样本有女性青年样本有 n n n n2 2 2 2====8 8 8 8,,,, ====27.8(27.8(27.8(27.8(厘米厘米厘米厘米2 2 2 2) ) ) ),试,试,试,试问在问在问在问在0.050.050.050.05水平上,男性青年身高的方差和女性青水平上,男性青年身高的方差和女性青水平上,男性青年身高的方差和女性青水平上,男性青年身高的方差和女性青年身高的方差有无显著性差异年身高的方差有无显著性差异年身高的方差有无显著性差异年身高的方差有无显著性差异? ? ? ?8/29/202420 [ [解解] ] 据题意,据题意, 对男性青年样本有对男性青年样本有n n1 1 ==1010,, ==30.8(30.8(厘米厘米2 2) ) 对女性青年样本有对女性青年样本有n n2 2 ==8 8,, ==27.8(27.8(厘米厘米2 2) ) H H0 0 :: H H1 1 :: 计算检验统计量计算检验统计量 确定否定域,因为确定否定域,因为αα==0.050.05,, F Fα/α/2 2((n n1 1―1―1,,n n2 2―1―1)=)=F F0.0250.025(9,7)(9,7)==4.824.82>>1.081.08 因而不能否定零假设,即在因而不能否定零假设,即在0.050.05水平上,我们不能说男性青年身水平上,我们不能说男性青年身高的方差和女性青年身高的方差有显著性差异。

      高的方差和女性青年身高的方差有显著性差异 8/29/202421 第三节第三节 配对样本的假设检验配对样本的假设检验 配对样本,是两个样本的单位两两匹配成配对样本,是两个样本的单位两两匹配成对,它实际上只能算作一个样本,也称关联样对,它实际上只能算作一个样本,也称关联样本因此对它的检验,用均值差检验显然是不行本因此对它的检验,用均值差检验显然是不行的因为2 n个样本单位个样本单位(每个样本每个样本n个个)不是全部不是全部独立抽取的而如果把每一配对当作一个单位,独立抽取的而如果把每一配对当作一个单位,在符合其他必要的假定条件下,统计检验与单样在符合其他必要的假定条件下,统计检验与单样本检验相差无几本检验相差无几8/29/202422 1.单一实验组的假设检验.单一实验组的假设检验 对于单一实验组这种对于单一实验组这种“前前—后后”对比型配对样对比型配对样本的假设检验,我们的做法是,不用均值差检验,本的假设检验,我们的做法是,不用均值差检验,而是求出每一对观察数据的差,直接进行一对一的而是求出每一对观察数据的差,直接进行一对一的比较如果采用比较如果采用“前测前测”“后测后测”两个总体无差异两个总体无差异的零的零假设,也就是等于假定实验刺激无效。

      于是,问题假设,也就是等于假定实验刺激无效于是,问题就转化为每对观察数据差的均值就转化为每对观察数据差的均值μd ==0的单样本假的单样本假设检验了求设检验了求每每一对观察值的差,直接进行一对一一对观察值的差,直接进行一对一的比较8/29/202423 设配对样本的样本单位前测与后测的观察数据分别设配对样本的样本单位前测与后测的观察数据分别是是X 0i与与X 1i,其差记作,其差记作di d i== X 1i―X 0i 如果假设两总体前测与后测无显著性差别,即如果假设两总体前测与后测无显著性差别,即μ1 ==μ0 或者或者 那么对取自这两那么对取自这两个总体的配对大样本有个总体的配对大样本有8/29/202424 对于大样本,当二总体的方差未知时,可以用样本标对于大样本,当二总体的方差未知时,可以用样本标对于大样本,当二总体的方差未知时,可以用样本标对于大样本,当二总体的方差未知时,可以用样本标准差来近似。

      准差来近似准差来近似准差来近似 若为小样本则需用若为小样本则需用若为小样本则需用若为小样本则需用 t 分布,即对配对分布,即对配对分布,即对配对分布,即对配对( (小小小小) )样本而言,其样本而言,其样本而言,其样本而言,其均值差的抽样分布将服从于自由度为均值差的抽样分布将服从于自由度为均值差的抽样分布将服从于自由度为均值差的抽样分布将服从于自由度为( (n—1) )的的的的 t 分布所以分布所以分布所以分布所以对单一实验组实验的假设检验,其检验统计量为对单一实验组实验的假设检验,其检验统计量为对单一实验组实验的假设检验,其检验统计量为对单一实验组实验的假设检验,其检验统计量为 8/29/202425 [ [例例例例] ] 随机地选择随机地选择随机地选择随机地选择1313个单位,放映一部描述吸烟有害个单位,放映一部描述吸烟有害个单位,放映一部描述吸烟有害个单位,放映一部描述吸烟有害于身体健康的影片,下表中的数字是各单位认为吸烟有于身体健康的影片,下表中的数字是各单位认为吸烟有于身体健康的影片,下表中的数字是各单位认为吸烟有于身体健康的影片,下表中的数字是各单位认为吸烟有害身体健康的职工的百分比,试在害身体健康的职工的百分比,试在害身体健康的职工的百分比,试在害身体健康的职工的百分比,试在0.050.05显著性水平上检显著性水平上检显著性水平上检显著性水平上检检验实验无效的零假设。

      检验实验无效的零假设检验实验无效的零假设检验实验无效的零假设8/29/202426 [ [解解解解] ] 零零零零 假假假假 设设设设H H0 0::::μ μd d====0 0 备择假设备择假设备择假设备择假设H H1 1::::μ μ1 1>>>>μ μ0 0 根据前三式,并参照上表有根据前三式,并参照上表有根据前三式,并参照上表有根据前三式,并参照上表有 计算检验统计量计算检验统计量计算检验统计量计算检验统计量 确定否定域,因为确定否定域,因为确定否定域,因为确定否定域,因为α α====0.050.05,并为单侧检验,因而,并为单侧检验,因而,并为单侧检验,因而,并为单侧检验,因而有有有有 t t 0.050.05(12)(12)====1.7821.782<<<<2.762.76 所以否定零假设,即说明该实验刺激有效。

      所以否定零假设,即说明该实验刺激有效所以否定零假设,即说明该实验刺激有效所以否定零假设,即说明该实验刺激有效8/29/202427 练习一:练习一:以下是经济体制改革后,某厂以下是经济体制改革后,某厂8个个车间竞争性测量的比较问改革后,竞争性有无车间竞争性测量的比较问改革后,竞争性有无增加?(增加?( 取取α=0.05))t=3.176 改革后改革后 86 87 56 93 84 93 75 79 改革前改革前 80 79 58 91 77 82 74 66 练习二:练习二:为了了解职工的企业认同感,根据为了了解职工的企业认同感,根据男性男性1000人的抽样调查,其中有人的抽样调查,其中有52人希望调换工人希望调换工作单位;而女性作单位;而女性1000人的调查有人的调查有23人希望调换工人希望调换工作,能否说明男性比女性更期望职业流动?作,能否说明男性比女性更期望职业流动?(( 取取α=0.05))8/29/202428 2.一实验组与一控制组的假设检验.一实验组与一控制组的假设检验 单一实验组实验的逻辑,是把实验对象前测单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于实验刺激。

      在社会现后测之间的变化全部归因于实验刺激在社会现实生活进行的实际实验中,对象前测后测之间的实生活进行的实际实验中,对象前测后测之间的变化,有时除了受到实验刺激外,还受到其他社变化,有时除了受到实验刺激外,还受到其他社会因素的作用因而,配对样本的一实验组与一会因素的作用因而,配对样本的一实验组与一控制组之假设检验,要设法把实验变量的作用和控制组之假设检验,要设法把实验变量的作用和额外变量的作用区分开来,然后就像对待单一实额外变量的作用区分开来,然后就像对待单一实验组实验一样,把问题转化为零假设验组实验一样,把问题转化为零假设μd==0的单的单样本检验来处理样本检验来处理 8/29/202429 在一实验组与一控制组的实验设计之中,对前测后在一实验组与一控制组的实验设计之中,对前测后测之间的变化,消除额外变量影响的基本做法如下:测之间的变化,消除额外变量影响的基本做法如下: (1)前测:对实验组与控制组分别度量;前测:对实验组与控制组分别度量; (2)实验刺激:只对实验组实行实验刺激;实验刺激:只对实验组实行实验刺激; (3)后测:对实验组与控制组分别度量;后测:对实验组与控制组分别度量; (4)求算消除了额外变量影响之后的求算消除了额外变量影响之后的 d i 后测实验组后测实验组―前测实验组=前测后测差实验组前测实验组=前测后测差实验组 后测控制组后测控制组―前测控制组=前测后测差控制组前测控制组=前测后测差控制组 实验效应实验效应d di i =前测后测差实验组=前测后测差实验组―前测后测差控制组前测后测差控制组8/29/202430 [ [例例例例] ] 假定实施一种新教学法有助于提高儿童的学习假定实施一种新教学法有助于提高儿童的学习假定实施一种新教学法有助于提高儿童的学习假定实施一种新教学法有助于提高儿童的学习成绩,现将成绩,现将成绩,现将成绩,现将2020名儿童两两匹配成对,分成一实验组与一名儿童两两匹配成对,分成一实验组与一名儿童两两匹配成对,分成一实验组与一名儿童两两匹配成对,分成一实验组与一控制组,然后对实验组实施新教学法两年,下表列示了控制组,然后对实验组实施新教学法两年,下表列示了控制组,然后对实验组实施新教学法两年,下表列示了控制组,然后对实验组实施新教学法两年,下表列示了控制组与实验组前测后测的所有控制组与实验组前测后测的所有控制组与实验组前测后测的所有控制组与实验组前测后测的所有1010组数据,试在组数据,试在组数据,试在组数据,试在0.050.05显显显显著性水平上检验实验无效的零假设。

      著性水平上检验实验无效的零假设著性水平上检验实验无效的零假设著性水平上检验实验无效的零假设8/29/202431 [ [解解解解] ] 零零零零 假假假假 设设设设H H0 0::::μ μd d====0 0 , , 即即即即“ “实验无效实验无效实验无效实验无效” ” 备择假设备择假设备择假设备择假设H H1 1::::μ μ1 1>>>>μ μ0 0 根据前三式,并参照上表有根据前三式,并参照上表有根据前三式,并参照上表有根据前三式,并参照上表有 计算检验统计量计算检验统计量计算检验统计量计算检验统计量 确定否定域,因为确定否定域,因为确定否定域,因为确定否定域,因为α α====0.050.05,并为单侧检验,因而,并为单侧检验,因而,并为单侧检验,因而,并为单侧检验,因而有有有有 t t 0.050.05(9)(9)====1.8331.833<<<<2.132.13 所以否定零假设,即说明该教学法有效。

      所以否定零假设,即说明该教学法有效所以否定零假设,即说明该教学法有效所以否定零假设,即说明该教学法有效8/29/202432 3.对实验设计与相关检验的评论.对实验设计与相关检验的评论 有了独立样本和非独立样本的认识,读者自有了独立样本和非独立样本的认识,读者自然会提出什么时候使用配对样本以及什么时候不然会提出什么时候使用配对样本以及什么时候不使用配对样本的问题很显然,匹配样本损失了使用配对样本的问题很显然,匹配样本损失了自由度,使用配对样本相当于减小了一半样本容自由度,使用配对样本相当于减小了一半样本容量这样做是不是得不偿失呢量这样做是不是得不偿失呢?答案是要看我们答案是要看我们能否恰当地配对能否恰当地配对 在配对过程中,最好用掷硬币的方式决定在配对过程中,最好用掷硬币的方式决定“对对”中的哪一个归入实验组,哪一个归入控制中的哪一个归入实验组,哪一个归入控制组从而使组从而使“对对”内随机化内随机化8/29/202433 第四节第四节 双样本区间估计双样本区间估计 双样本区间估计和双样本假设检验的联系是很紧密的。

      双样本区间估计和双样本假设检验的联系是很紧密的双样本区间估计和双样本假设检验的联系是很紧密的双样本区间估计和双样本假设检验的联系是很紧密的双样本区间估计,即是为均值差或成数差设置置信区间的方双样本区间估计,即是为均值差或成数差设置置信区间的方双样本区间估计,即是为均值差或成数差设置置信区间的方双样本区间估计,即是为均值差或成数差设置置信区间的方法,这需要我们汇合单样本区间估计和双样本假设检验两方法,这需要我们汇合单样本区间估计和双样本假设检验两方法,这需要我们汇合单样本区间估计和双样本假设检验两方法,这需要我们汇合单样本区间估计和双样本假设检验两方面的知识面的知识面的知识面的知识 1.1. 和和和和 已知,对均数差的区间估计已知,对均数差的区间估计已知,对均数差的区间估计已知,对均数差的区间估计 根据本章第一节中心极限定理的推论,既然两样本的均根据本章第一节中心极限定理的推论,既然两样本的均根据本章第一节中心极限定理的推论,既然两样本的均根据本章第一节中心极限定理的推论,既然两样本的均值差值差值差值差 的抽样分布就是的抽样分布就是的抽样分布就是的抽样分布就是 ,那么对,那么对,那么对,那么对统计量统计量统计量统计量Z Z Z Z 自然有自然有自然有自然有 8/29/202434 对于给定的置信水平(对于给定的置信水平(对于给定的置信水平(对于给定的置信水平(1―α1―α),以),以),以),以 构造构造构造构造 的置信区间如下的置信区间如下的置信区间如下的置信区间如下 同理考虑同理考虑同理考虑同理考虑 的置信区间,只需将上式中的的置信区间,只需将上式中的的置信区间,只需将上式中的的置信区间,只需将上式中的 改为改为改为改为 即可。

      即可 8/29/202435 [例例] 设甲乙两乡镇企业职工月收入总设甲乙两乡镇企业职工月收入总体分布的方差分别为体分布的方差分别为 ==120(元元2),, ==90(元元2)现从甲企业随机抽取现从甲企业随机抽取20人,平人,平均月收人为均月收人为840元:从乙企业随机抽取元:从乙企业随机抽取10人,人,平均月收入为平均月收入为670元,试以元,试以95%置信水平估置信水平估计两企业人均月收入差额之范围计两企业人均月收入差额之范围8/29/202436 [ [解解解解] ] 据题意,据题意,据题意,据题意, 甲企业的抽样结果为:甲企业的抽样结果为:甲企业的抽样结果为:甲企业的抽样结果为: ====840(840(元元元元) ),, ==== 120(120(元元元元2 2) ) ,,,, n1====20(20(人人人人) ) 乙企业的抽样结果为:乙企业的抽样结果为:乙企业的抽样结果为:乙企业的抽样结果为: ====670(670(元元元元) ),,,, ====90(90(元元元元2 2) ) ,,,, n2 ==== 10(10(人人人人) ) 由(由(由(由(1―α1―α)=)=)=)=0 0....9595,得,得,得,得Z Zα α/ /2 2====1.961.96,代入前式有,代入前式有,代入前式有,代入前式有 得到在得到在得到在得到在9595%置信水平上,两企业人均收入之差额在%置信水平上,两企业人均收入之差额在%置信水平上,两企业人均收入之差额在%置信水平上,两企业人均收入之差额在162.4162.4元到元到元到元到177.6177.6元之间。

      元之间 8/29/202437 对于大样本,对于大样本,对于大样本,对于大样本, 和和和和 未知,可以用未知,可以用未知,可以用未知,可以用 和和和和 替替替替代,然后用前式求出均值差的置信区间即可代,然后用前式求出均值差的置信区间即可代,然后用前式求出均值差的置信区间即可代,然后用前式求出均值差的置信区间即可 对于小样本,对于小样本,对于小样本,对于小样本, 和和和和 未知,两样本均值差的抽样分未知,两样本均值差的抽样分未知,两样本均值差的抽样分未知,两样本均值差的抽样分布就不再服从布就不再服从布就不再服从布就不再服从Z Z分布,而是服从分布,而是服从分布,而是服从分布,而是服从 t t 分布了此时对给定的置分布了此时对给定的置分布了此时对给定的置分布了此时对给定的置信水平(信水平(信水平(信水平(1―α1―α),得),得),得),得 之估计区间为之估计区间为之估计区间为之估计区间为 2. 2. 和和和和 未知,对均数差的区间估计未知,对均数差的区间估计未知,对均数差的区间估计未知,对均数差的区间估计 8/29/202438 由上式可见,要解决小样本均值差区间估计由上式可见,要解决小样本均值差区间估计由上式可见,要解决小样本均值差区间估计由上式可见,要解决小样本均值差区间估计问题,关键是要解决问题,关键是要解决问题,关键是要解决问题,关键是要解决 的算式问题,而如果的算式问题,而如果的算式问题,而如果的算式问题,而如果能假设能假设能假设能假设 ,这个问题已经在本章第二节中,这个问题已经在本章第二节中,这个问题已经在本章第二节中,这个问题已经在本章第二节中解决了,即解决了,即解决了,即解决了,即8/29/202439 [例例] 某市对儿童体重情况进行调查,某市对儿童体重情况进行调查,抽查抽查8岁的女孩岁的女孩20人,平均体重人,平均体重22.2千克,千克,标准差标准差2.46千克;抽查千克;抽查8岁的男孩岁的男孩18人,平人,平均体重均体重21.3千克,标准差千克,标准差1.82千克。

      若男女千克若男女儿童体重的总体方差相等,试在儿童体重的总体方差相等,试在95%置信水%置信水平上,估计平上,估计8岁男女儿童体重差额之范围岁男女儿童体重差额之范围8/29/202440 [ [解解解解] ] 据题意,据题意,据题意,据题意,女孩组的抽样结果为:女孩组的抽样结果为:女孩组的抽样结果为:女孩组的抽样结果为: ====22.2(22.2(千克千克千克千克) ),,,, S S1 1==== 2.46(2.46(千克千克千克千克) ),,,,n n1 1====20(20(人人人人) ) 男孩组的抽样结果为:男孩组的抽样结果为:男孩组的抽样结果为:男孩组的抽样结果为: ====21.3(21.3(千克千克千克千克) ),,,, S S2 2====1.82(1.82(千克千克千克千克) ),,,, n n2 2====18(18(人人人人) ) 代人前式得代人前式得代人前式得代人前式得 由(由(由(由(1―α1―α)=)=)=)=0.950.95,得,得,得,得t t α α/ /2 2( (n n1 1+ + n n2 2 ―2) ―2)====t t 0.025 0.025 (36)(36)====2.0282.028,于是,于是,于是,于是 [(22.2―21.3)―2.028×0.728[(22.2―21.3)―2.028×0.728,,(22.2—21.3) + 2.028×0.728)] (22.2—21.3) + 2.028×0.728)] 得在得在得在得在9595%置信水平上%置信水平上%置信水平上%置信水平上8 8岁男女儿童体重之差额在岁男女儿童体重之差额在岁男女儿童体重之差额在岁男女儿童体重之差额在―0.58―0.58千克到千克到千克到千克到2.382.38千千千千克之间。

      克之间 8/29/202441 如果不能假设如果不能假设如果不能假设如果不能假设 ,求算,求算,求算,求算 则要用下则要用下则要用下则要用下式,即式,即式,即式,即 [ [例例例例] ] 研究正常成年男女血液红细胞的平均数之差别,研究正常成年男女血液红细胞的平均数之差别,研究正常成年男女血液红细胞的平均数之差别,研究正常成年男女血液红细胞的平均数之差别,抽查男子抽查男子抽查男子抽查男子2020人,计算得红细胞平均数人,计算得红细胞平均数人,计算得红细胞平均数人,计算得红细胞平均数465465万/毫米万/毫米万/毫米万/毫米3 3,样本,样本,样本,样本标准差为标准差为标准差为标准差为54.854.8万/毫米万/毫米万/毫米万/毫米3 3;抽查女子;抽查女子;抽查女子;抽查女子2424名,计算得红细胞名,计算得红细胞名,计算得红细胞名,计算得红细胞平均数平均数平均数平均数422422万/毫米万/毫米万/毫米万/毫米3 3,样本标准差为,样本标准差为,样本标准差为,样本标准差为4949....2 2万/毫米万/毫米万/毫米万/毫米3 3,试,试,试,试以以以以9999%的置信水平,求正常成年男女红细胞平均数的差异%的置信水平,求正常成年男女红细胞平均数的差异%的置信水平,求正常成年男女红细胞平均数的差异%的置信水平,求正常成年男女红细胞平均数的差异范围。

      范围 8/29/202442 [ [解解解解] ] 据题意,据题意,据题意,据题意, 男性组抽查结果为:男性组抽查结果为:男性组抽查结果为:男性组抽查结果为: ====465465,,,, S S1 1====54. 854. 8,,,, n n1 1====20(20(人人人人) ) 女性组抽查结果为:女性组抽查结果为:女性组抽查结果为:女性组抽查结果为: ====422422,,,, S S2 2====49. 249. 2,,,, n n2 2====24(24(人人人人) ) 代人前式得代人前式得代人前式得代人前式得 由(由(由(由(1―α1―α)=)=)=)=0.990.99,得,得,得,得t t α α/ /2 2( (n n1 1+ + n n2 2 ―2) ―2)====t t 0.005 0.005 (42)(42)====2.6982.698,于是,于是,于是,于是 [(465―422)―2.698×16.2[(465―422)―2.698×16.2,,(465—422) + 2.698×16.2)] (465—422) + 2.698×16.2)] 得在得在得在得在9999%置信水平上,正常成年男女红细胞平均数之差异范围在%置信水平上,正常成年男女红细胞平均数之差异范围在%置信水平上,正常成年男女红细胞平均数之差异范围在%置信水平上,正常成年男女红细胞平均数之差异范围在―0.7―0.7万/毫米万/毫米万/毫米万/毫米3 3到到到到86.786.7万/毫米万/毫米万/毫米万/毫米3 3之间。

      之间 8/29/202443 3 3.大样本成数差的区间估计.大样本成数差的区间估计.大样本成数差的区间估计.大样本成数差的区间估计 与单样本成数的区间估计一样,成数差区间估计与单样本成数的区间估计一样,成数差区间估计可以被看作均值差的特例来处理可以被看作均值差的特例来处理(但它适用于各种量度但它适用于各种量度层次层次)即对给定的置信水平(即对给定的置信水平(1―α),得两总体成数),得两总体成数差差(p1―p2)之估计区间为之估计区间为 8/29/202444 当当p1和和p2未知,须用样本成数未知,须用样本成数 和和 进行估算,同时分以下两进行估算,同时分以下两种情况讨论:种情况讨论: ①① 若能假设若能假设 ,上式变为,上式变为 式中式中: ②②若不能假设若不能假设 ,上式变为,上式变为 8/29/202445 [例例] 有一个大学生的随机样本,按照有一个大学生的随机样本,按照性格性格“外向外向”和和“内向内向”,把他们分成两类。

      把他们分成两类结果发现,新生中有结果发现,新生中有73%属于%属于“外向外向”类,类,四年级学生中有四年级学生中有58%属于%属于“外向外向”类样本中新生有中新生有171名,四年级学生有名,四年级学生有117名试在99%的置信水平上,求新生、老生性性格%的置信水平上,求新生、老生性性格“外向外向”的成数差的置信区间的成数差的置信区间8/29/202446 [ [解解解解] ] 据题意,据题意,据题意,据题意, 新生组的抽样结果为:新生组的抽样结果为:新生组的抽样结果为:新生组的抽样结果为: ====0.730.73,,,, ====0 270 27,,,, n n1 1====171(171(人人人人) ) 四年级学生组的抽样结果为:四年级学生组的抽样结果为:四年级学生组的抽样结果为:四年级学生组的抽样结果为: ====0.580.58,,,, ====0. 420. 42,,,,n n2 2====117(117(人人人人) ) 由(由(由(由(1―α1―α)=)=)=)=0.990.99,得,得,得,得Z Zα/2α/2====Z Z0.0050.005====2.582.58,代入上式得,代入上式得,代入上式得,代入上式得 得在得在得在得在9999%置信水平上,新生、老生性格%置信水平上,新生、老生性格%置信水平上,新生、老生性格%置信水平上,新生、老生性格“ “外向外向外向外向” ”的成数差的置的成数差的置的成数差的置的成数差的置信区间为信区间为信区间为信区间为(0.003(0.003,,,,0.297)0.297)。

      8/29/202447 4 4.配对样本均值差的区间估计.配对样本均值差的区间估计.配对样本均值差的区间估计.配对样本均值差的区间估计 配对样本均值差的区间估计与独立样本均值差的区间配对样本均值差的区间估计与独立样本均值差的区间配对样本均值差的区间估计与独立样本均值差的区间配对样本均值差的区间估计与独立样本均值差的区间估计不同,它实质上是估计不同,它实质上是估计不同,它实质上是估计不同,它实质上是μ μd d的单样本区间估计的单样本区间估计的单样本区间估计的单样本区间估计 既然对统计量既然对统计量既然对统计量既然对统计量 t t 有有有有 对给定的置信水平(对给定的置信水平(对给定的置信水平(对给定的置信水平(1―1―α α),),),),μ μd d 的区间估计是的区间估计是的区间估计是的区间估计是 8/29/202448 [ [例例例例] ] 在在在在8 8名患者身上用名患者身上用名患者身上用名患者身上用A A和和和和B B两种催眠药加以试验,两种催眠药加以试验,两种催眠药加以试验,两种催眠药加以试验,增多睡眠小时数的数据如下表所示,试在增多睡眠小时数的数据如下表所示,试在增多睡眠小时数的数据如下表所示,试在增多睡眠小时数的数据如下表所示,试在9595%的置信水%的置信水%的置信水%的置信水置信水平上,求置信水平上,求置信水平上,求置信水平上,求μ μd d的置信区间。

      的置信区间的置信区间的置信区间8/29/202449 [ [解解解解] ] 据据据据(10.14)(10.14)式和式和式和式和(10.15)(10.15)式,计算过程参见上表,得式,计算过程参见上表,得式,计算过程参见上表,得式,计算过程参见上表,得 由(由(由(由(1―α1―α)=)=)=)=0.950.95,得,得,得,得t tα α/ /2 2( (n n ―1) ―1)====t t 0.025 0.025 (7)(7)====2.3652.365,代入上式有,代入上式有,代入上式有,代入上式有 得在得在95%的置信水平上,两种催眼药平均药效之差%的置信水平上,两种催眼药平均药效之差μd的置信区间为的置信区间为1.15土土0.97(小时小时),即,即 0.18(小时小时) ≤ μd ≤ 2.12(小时小时) 8/29/202450 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.