
生物统计学:第五章 对单个和两个总体平均数的假设检验.ppt
58页第五章对单个和两个总体平均数对单个和两个总体平均数的假设检验的假设检验总体总体样本样本估计估计 & 检验检验统计量统计量 (X)随机抽样随机抽样实验结果实验结果抽样分布规律抽样分布规律小小概概率率原原理理假设检验的基本步骤:假设检验的基本步骤:1、提出假设、提出假设 H0::原假设或零假设,被直接检验的假设,否定原假设或零假设,被直接检验的假设,否定 或接受或接受 HA::备择假设,一旦否定原假设就接受备择假设备择假设,一旦否定原假设就接受备择假设2、计算统计量、计算统计量 利用原假设所提供的信息,而且其抽样分布已知利用原假设所提供的信息,而且其抽样分布已知3、确定否定域、确定否定域 根据小概率事件原理,比较检验统计量和临界值的关系,根据小概率事件原理,比较检验统计量和临界值的关系,确定其落在否定域还是接收域确定其落在否定域还是接收域4、对假设进行统计推断、对假设进行统计推断 显著水平:显著水平:0.01;;0.05 ((1))差异不显著:接受原假设差异不显著:接受原假设((2)差异显著:在)差异显著:在 0.05 水平下,否定原假设,水平下,否定原假设, 接受备择假设接受备择假设((3)差异极显著:在)差异极显著:在 0.01 水平下,否定原假水平下,否定原假 设,接受备择假设设,接受备择假设5 对单个和两个总体平均数的假设检验对单个和两个总体平均数的假设检验需要解决的问题:需要解决的问题:5.1 对单个总体平均数的检验对单个总体平均数的检验样本样本平均数平均数总体总体均数均数推断推断??已知已知样本样本随机抽样随机抽样总体总体5.1.1 Z检验-总体的方差检验-总体的方差σ2 已知已知利用利用 Z 统计量进行检验,统计量进行检验,Z统计量服从标准正态统计量服从标准正态分布,因而称为分布,因而称为Z检验。
检验检验步骤如下:检验步骤如下:1、提出假设:针对不同的具体情况,有、提出假设:针对不同的具体情况,有3种假设 ((1)) H0::μ==μ0;;HA::μ≠μ0 双双侧检验 ((2)) H0::μ==μ0;;HA::μ<μ0 单侧检验单侧检验 ((3)) H0::μ≤μ0;;HA::μ > μ0 单侧检验单侧检验2、计算统计量、计算统计量Z 3、确定否定域、确定否定域或者或者依据相伴概率做出统计推断依据相伴概率做出统计推断 对于给定的显著性水平,针对对于给定的显著性水平,针对3种不同的假设,种不同的假设,原假设的否定域分别为:原假设的否定域分别为:uα 和和u2α:分别为标准正态分布:分别为标准正态分布 两尾概率为两尾概率为 α和和2α时时 的分位点的分位点见附表见附表2α==0.05时,时, uα==1.96 u2α==1.64 α==0.01时,时,uα==2.58 u2α==2.335.1.2 t 检验-总体的方差检验-总体的方差σ2未未知知在实际情况下,总体方差在实际情况下,总体方差 σ2 一般是未知的,因此一般是未知的,因此无法计算无法计算Z 统计量,不能采用统计量,不能采用Z 检验。
检验这时,用样本方差这时,用样本方差 S2 代替总体方差代替总体方差为什么服从为什么服从t 分布呢?证明如下:分布呢?证明如下:标准正标准正态分布态分布Χ2分布分布所以,统计量t服从自由度为所以,统计量t服从自由度为n-1 的的t 分布t 检验:将利用服从检验:将利用服从t 分布的检验统计量来进行的分布的检验统计量来进行的 假设称为假设称为t 检验t 检验检验 的否定域与的否定域与Z 检验的否定域相似,不同之处检验的否定域相似,不同之处仅仅在于其临界值要由仅仅在于其临界值要由t 分布的分位数表查得分布的分位数表查得t检验检验 同同z检验相似,可以依据统计量计算出相伴概检验相似,可以依据统计量计算出相伴概率并得到对总体的推断率并得到对总体的推断/2/2-t t 对于给定的显著性水平,针对对于给定的显著性水平,针对3种不同的假设,原假设的否定种不同的假设,原假设的否定域分别为:域分别为:例:母猪怀孕期应该是例:母猪怀孕期应该是114天,今调查了某种猪场天,今调查了某种猪场8头母猪,头母猪,各头母猪的怀孕期为:各头母猪的怀孕期为:113,,115,,115,,114,,116,,117,,115,,113天。
试检验天试检验8头母猪的怀孕期与头母猪的怀孕期与114天是否有天是否有显著差异显著差异1.假设假设 H0::μ== μ0==114 HA::μ ≠ μ0==1142.计算检验统计量计算检验统计量 3、确定否定域并做统计推断、确定否定域并做统计推断 不能否定原假设,接受不能否定原假设,接受H0,,认为该样本是取自怀孕期为认为该样本是取自怀孕期为114天的总体天的总体【例5.1】 按照规定,100g罐头番茄汁的平均维C含量不得少于21mg/g,现从工厂的产品中随机抽取17个罐头分别测得维C含量,设维C含量服从正态分布,问此批罐头是否符合规定要求解:H0:μ=21,HA:μ<21, 由于总体的方差未知,服从t分布 n=17,x=20,s=3.98∴ 该批罐头的平均维C含量与规定的21mg/g无显著差异,可以出厂 p = 0.157例例::随随机机抽抽测测10头头长长白白猪猪和和10头头大大白白猪猪经经产产母母猪猪的的产产仔仔数,数据如下:数,数据如下: 长白:长白:11,,11,,9,,12,,10,,13,,13,,8,,10,,13 大白:大白: 8,, 11,,12,,10,,9,, 8 ,,8,, 9,,10,,7 经经计计算算得得,,长长白白猪猪 10头头经经产产母母猪猪产产仔仔平平均均数数 x 1=11头头,,标标准准差差S1=1.76头头;;大大白白猪猪10头头经经产产母母猪猪产产仔仔平平均均数数 x 2=9.2头,头, 标标 准准 差差S2=1.549头。
头 能能否否仅仅凭凭这这两两个个平平均均数数的的差差值值 x 1-- x 2=1.8头头,,得得出长白与大白两品种经产母猪产仔数不同的结论呢?出长白与大白两品种经产母猪产仔数不同的结论呢?结论?结论?5. 2 两个总体平均数的比较两个总体平均数的比较结论:哈白猪一定比大白猪的产仔数高结论:哈白猪一定比大白猪的产仔数高0.90.9头吗?头吗? 样本样本= =总体?总体?回答:不一定!!!回答:不一定!!!原因:原因:1.1.这个资料仅仅是一个样本,如果我们再随机抽测这个资料仅仅是一个样本,如果我们再随机抽测1010头哈白猪和头哈白猪和1010头大白猪,二者的平均数差异就不是头大白猪,二者的平均数差异就不是0.90.9了因为有抽样误差的存在以及样本含量的不同为有抽样误差的存在以及样本含量的不同 2.2.我们研究的目的不在于了解样本的情况,而是由我们研究的目的不在于了解样本的情况,而是由 样本推断总体,给总体做出全面的结论样本推断总体,给总体做出全面的结论为了比较两个总体均数的差异,不可能对两个总为了比较两个总体均数的差异,不可能对两个总体的所有个体进行测定,只能通过样本来推断总体的所有个体进行测定,只能通过样本来推断总体。
体分别从两个总体随机抽取一定数量的个体,从而分别从两个总体随机抽取一定数量的个体,从而获得两个独立的样本,然后通过对样本数据的分获得两个独立的样本,然后通过对样本数据的分析来对两个总体平均数有无差异进行检验析来对两个总体平均数有无差异进行检验针对不同的具体问题,有针对不同的具体问题,有3种形式的假设种形式的假设双侧检验双侧检验单侧检验单侧检验单侧检验单侧检验在实验研究中,虽然我们尽量排除各种偶然因在实验研究中,虽然我们尽量排除各种偶然因素的干扰,以突出处理结果,但是实验总会受素的干扰,以突出处理结果,但是实验总会受到一些偶然因素的影响而产生实验误差到一些偶然因素的影响而产生实验误差即使同一个处理的不同重复的观察值表现也不即使同一个处理的不同重复的观察值表现也不同,观察值仅仅是实验的表面结果,它是实验同,观察值仅仅是实验的表面结果,它是实验处理的理论值(即总体均数)与实验误差之和处理的理论值(即总体均数)与实验误差之和 设有一个样本,含有设有一个样本,含有n n次重复观察值,其数据次重复观察值,其数据为为x x1 1、、x x2 2…………x xn n,,假定总体均数(实验处理的理论值)假定总体均数(实验处理的理论值)为为μ μ ,第,第i i个观察值的实验误差为个观察值的实验误差为εεi i,, 则则 x xi i= μ+ ε= μ+ εi i(i=1(i=1、、2 2…………n) n) 目的就是分析表面效应主目的就是分析表面效应主要是由处理效应引起,还要是由处理效应引起,还是由实验误差引起。
从而是由实验误差引起从而分析处理效应是否存在分析处理效应是否存在表面效应可以计算,实验表面效应可以计算,实验误差可以估计,根据这些误差可以估计,根据这些推断处理效应是否显著推断处理效应是否显著5. 2.1 统计量统计量 的抽样分布的抽样分布如果两个总体都是正态总体,则:如果两个总体都是正态总体,则:因此,可以计算检验统计量因此,可以计算检验统计量Z 对总体均数进行假设对总体均数进行假设检验,分三种情况分别介绍检验,分三种情况分别介绍一、一、 如果两总体的方差已知时,用如果两总体的方差已知时,用Z Z统计量进行统计量进行假设检验假设检验σσ1 12 2=σ=σ2 22 2=σ=σ2 2,,σσ2 2已知已知 例例5.2 5.2 教材第教材第6969页页例例5.2 某某单单位位测测定定31头头犊犊牛牛和和48头头成成年年母母牛牛100ml血血液液中中血血糖糖含含量量,,犊犊牛牛的的平平均均血血糖糖含含量量为为81.23mg,,成成牛牛为为70.23mg已已知知犊犊牛牛血血糖糖的的总总体体方方差差为为15.642mg2, 成成牛牛为为12.072mg2问犊牛和成牛间血糖含量有无差异。
问犊牛和成牛间血糖含量有无差异解解:由于两个总体方差已知,故两平均数的差服从:由于两个总体方差已知,故两平均数的差服从Z分布分布•查表可得,u0.05=1.96,u0.01=2.58 < 3.27或者 计算相伴概率 p = 0.001•所以否定H0,犊牛和成牛间血糖含量有犊牛和成牛间血糖含量有极显著差异极显著差异二、未知二、未知σσ1 12 2,,σσ2 22 2,但是,但是σσ1 12 2=σ=σ2 22 2已知两总体方差相等,但是不知道它的具体已知两总体方差相等,但是不知道它的具体值是多少值是多少合并的方差可以用两个样本的均方的加权平均来估计合并的方差可以用两个样本的均方的加权平均来估计所以:所以:均数差异标准误均数差异标准误为为均数差异标准误均数差异标准误t值为值为自由度为:自由度为:df=(n1-1)+(n2-1)= n1+n2-2例例5.3::70页页例例5.4::71页页三、未知三、未知σσ1 12 2,,σσ2 22 2,且,且σσ1 12 2≠≠σσ2 22 2(一)方差的齐性检验(一)方差的齐性检验 设有两个正态总体,设有两个正态总体,X X1 1服从服从N N( (μμ1 1,, σσ1 12 2) ),, X X2 2服从服从N N( (μμ2 2,, σσ2 22 2) )。
如果有理由怀疑如果有理由怀疑σσ1 12 2≠≠σσ2 22 2,就,就首先进行检验首先进行检验 1.零假设:零假设:H0:: σσ1 12 2= =σσ2 22 2 备择假设:备择假设:H1: σσ1 12 2≠≠σσ2 22 2 2.确定显著水平:确定显著水平:0.05 3.计算统计量计算统计量 查查F表,确定临界值,接表,确定临界值,接受或者拒绝受或者拒绝H0如果检验结果不显著,接受零假设如果检验结果不显著,接受零假设σσ1 12 2= =σσ2 22 2,那,那么还按照前一种么还按照前一种t t检验进行检验检验进行检验如果检验结果显著,接受备择假设如果检验结果显著,接受备择假设σσ1 12 2 ≠≠ σσ2 22 2,,那么按照下面的那么按照下面的t t检验方法进行检验检验方法进行检验 (二)校正(二)校正 t 检验(检验(Welch))若若经经F((双双尾尾))检检验验得得出出的的结结论论是是σ1≠σ2,,这这时时可可用用一一种种近近似法似法——t’检验判定平均数之间的差异显著性检验判定平均数之间的差异显著性–该检验的临界值仍由该检验的临界值仍由t 表查出,表查出,对对自由度自由度进行校正进行校正 ;–t 检验统计量检验统计量•P72,例,例5.5•P73,例,例5.6 以上内容为非配对实验的均数差异显以上内容为非配对实验的均数差异显著性检验著性检验. . 两个样本的变数是相互独立的,可以称做两两个样本的变数是相互独立的,可以称做两个个独立样本独立样本平均数的比较。
如果试验单位变异较平均数的比较如果试验单位变异较大,譬如实验动物的年龄、体重相差较大,若仍大,譬如实验动物的年龄、体重相差较大,若仍采用上述设计方法,有可能使实验处理受实验单采用上述设计方法,有可能使实验处理受实验单位系统误差的影响,而夸大或缩小了实验处理的位系统误差的影响,而夸大或缩小了实验处理的效果,同时还增大了实验误差的估计值效果,同时还增大了实验误差的估计值 四、配对样品平均数间的比较四、配对样品平均数间的比较 为了排除实验单位不一致对实验结果的影响,为了排除实验单位不一致对实验结果的影响,准确地估计实验处理效应,降低实验误差,提高准确地估计实验处理效应,降低实验误差,提高实验的准确性和精确性,如果可能,实验的准确性和精确性,如果可能,应采用配对应采用配对实验设计,可将其看作两个相关样本平均数的比实验设计,可将其看作两个相关样本平均数的比较较 配对的目的是使为了把同一重复内二个实验配对的目的是使为了把同一重复内二个实验单位的初始条件的差异减少到最低限度,使实验单位的初始条件的差异减少到最低限度,使实验处理效应不被实验单位的差异而夸大或缩小,提处理效应不被实验单位的差异而夸大或缩小,提高实验精确度。
高实验精确度1.配对实验设计:配对实验设计: 指先将实验单位按配对的要求两两配对,然后指先将实验单位按配对的要求两两配对,然后将每一个对子内的两个实验单位独立随机地分配到将每一个对子内的两个实验单位独立随机地分配到两个处理组中两个处理组中 配对的要求是,配成对子的两个实验单位的初配对的要求是,配成对子的两个实验单位的初始条件应尽量一致,不同实验对子之间,实验单位始条件应尽量一致,不同实验对子之间,实验单位的初始条件可以有差异的初始条件可以有差异 每一个对子就是实验的一次重复每一个对子就是实验的一次重复 我们将实验单位分为两组的方式称为配对实验我们将实验单位分为两组的方式称为配对实验设计((1)同源配对:)同源配对: 同窝、同性别、同体重或者同卵双生的两头同窝、同性别、同体重或者同卵双生的两头动物配成对子其中一个个体接受接受这个处理,动物配成对子其中一个个体接受接受这个处理,另一个个体接受另一个处理另一个个体接受另一个处理 如同一窝的仔猪增重或者双胞胎的子畜植如同一窝的仔猪增重或者双胞胎的子畜植物的同一片叶子的两半等。
物的同一片叶子的两半等2)自身配对:)自身配对: 同一实验单位的接受实验处理的前后的两次同一实验单位的接受实验处理的前后的两次观察值作为配对也可以看作是特殊的同源配对观察值作为配对也可以看作是特殊的同源配对如:白鼠照射如:白鼠照射X射线前后的体重射线前后的体重配对实验时,两组的实验单位数即两个样本的观配对实验时,两组的实验单位数即两个样本的观察值数目相等,察值数目相等,n1=n2但是反过来,两个样本观但是反过来,两个样本观察值相等的实验则不一定是配对实验察值相等的实验则不一定是配对实验判断配对实验的根据不是两个样本的观察值是否判断配对实验的根据不是两个样本的观察值是否相等,而是分组的方式相等,而是分组的方式在配对实验设计中,由于实验单位是两两配对的,在配对实验设计中,由于实验单位是两两配对的,因此观察值也是两两配对的因此观察值也是两两配对的2.实验结果表示为实验结果表示为::处理处理观察值观察值样本含样本含量量样本平均数样本平均数总体平均数总体平均数12x11 x12 ……x1nx11 x12 ……x1nnnμμ1 1μμ2 2d=x1-x2d1 d2 …… dnnμμd d=μ=μ1 1-μ-μ2 2我们的目的是:我们的目的是: 通过通过 推断推断 ,即,即μμ1 1与与μμ2 2是是否相同。
否相同μμd d=μ=μ1 1-μ-μ2 23. 配对实验的检验步骤:配对实验的检验步骤: ((1)无效假设)无效假设H0 0 ::μμd d=μ=μ1 1-μ-μ2 2 =0=0 备择假设备择假设H HA A ::μμd d≠0≠0,即,即μμ1 1-μ-μ2 2 ≠0≠0 μμ1 1为第一个样本所在总体的平均数为第一个样本所在总体的平均数 μμ2 2为第二个样本所在总体的平均数为第二个样本所在总体的平均数 μμd d为第一个样本所在总体与第二个样本所在总为第一个样本所在总体与第二个样本所在总体配对变数的差数体配对变数的差数d=xd=x1 1-x-x2 2,所构成的差数总体的平,所构成的差数总体的平均数,且均数,且μμd d=μ=μ1 1-μ-μ2 2 ((2 2))t t值的计算公式值的计算公式 1.d1.d为第一、第为第一、第二两个样本二两个样本各对数据之各对数据之差2.2.为第一、第为第一、第二两个样本二两个样本各对数据之各对数据之差的平均数差的平均数3.S3.Sd d为第一、第为第一、第二两个样本二两个样本各对数据之各对数据之差的标准差。
差的标准差4.n4.n为配对的对子为配对的对子数,即实验数,即实验的重复数的重复数例:在比较国产与进口的膘厚测定仪时,对例:在比较国产与进口的膘厚测定仪时,对14头活头活体肥猪进行测定结果如下:试检验两种仪器测定的体肥猪进行测定结果如下:试检验两种仪器测定的结果有无显著差异?结果有无显著差异?进口进口32 40 27 37 32 35 28 43 40 41 41 35 49 34 国产国产dd24344 30 34 30 31 26 26 42 40 42 43 37 43-11 -4 -3 3 2 4 2 17 -2 1 -1 -8 12 -9121 16 9 9 4 16 4 289 4 1 1 64 144 81 同一头猪的两种方法测定可以看作是配对设计同一头猪的两种方法测定可以看作是配对设计1. 无效假设无效假设H0 0 ::μμd d=μ=μ1 1-μ-μ2 2 =0=0 备择假设备择假设H HA A ::μμd d≠0≠0,即,即μμ1 1-μ-μ2 2 ≠0≠02.确定显著平准:确定显著平准:0.05、、0.013.计算差异标准误计算差异标准误4.计算计算t值值 5. df =n-1=14-1=13 查查t值表得:值表得:t 0.05((13))=2.0160 t =0.1026< t 0.05=2.160,即,即P>0.05,, 则认为则认为d属于误差的概率大于属于误差的概率大于0.05,因此接受无效,因此接受无效假设。
认为这两种仪器测定的结果是一样的认为这两种仪器测定的结果是一样的两个总体平均数的差异显著性检验两个总体平均数的差异显著性检验 内容回顾内容回顾一、两种实验设计:一、两种实验设计: 独立成组设计和配对设计独立成组设计和配对设计二、显著性检验的目的:二、显著性检验的目的:表面效应表面效应处理效应处理效应排除实验误差排除实验误差三、显著性检验的步骤三、显著性检验的步骤 1.零假设:零假设:H0:: μμ1 1=μ=μ2 2 备择假设:备择假设:H1: 1≠ 2 ; 1> 2 ; 1< 2 2.确定显著平准:确定显著平准:0.05、、0.01 3.计算计算Z值或者值或者t值值 4.计算相伴概率计算相伴概率 p 5.接受或者拒绝零假设接受或者拒绝零假设四、四、Z检验:检验: σσ1 12 2与与σσ2 22 2已知已知 均数差异标准误均数差异标准误五、五、t t检验检验 σσ1 12 2,,σσ2 22 2未知,首先进行方差齐性检验未知,首先进行方差齐性检验1.零假设:零假设:H0:: σσ1 12 2= =σσ2 22 2 备择假设:备择假设:H1: σσ1 12 2≠≠σσ2 22 2 2.确定显著水平:确定显著水平:0.05 4. 根据根据F值计算相伴概率,得出方差齐性与否的推断值计算相伴概率,得出方差齐性与否的推断(一)(一)σσ1 12 2 = =σσ2 22 2均数差异标准误均数差异标准误df = n1+n2-2(二)(二)未知未知σσ1 12 2,,σσ2 22 2,且,且σσ1 12 2≠≠σσ2 22 2 采用校正采用校正t t 检验方法。
检验方法 。
