好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

第6章方差分析.ppt

42页
  • 卖家[上传人]:汽***
  • 文档编号:606803605
  • 上传时间:2025-05-23
  • 文档格式:PPT
  • 文档大小:230KB
  • / 42 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第六章 方差分析,(,一,),第一节 方差分析的基本概念,一、目的:,Analysis of variance ANOVA,用于检验两个或两个以上样本均数间差别有无统计意义,二、样本均数间差别的原因(变异的来源):,1、总变异:全部试验数据大小不等用观察值与总均数的离均差平方和,sum of squares of deviations from mean,表示,记为,SS,总,,或,l,总,;总的自由度,总,N,1,2,、组间变异:各处理组的样本均数大小不一,用各组均数与总均数的离均差平方和表示,记为,SS,组间,或,l,组间,,组间自由度,组间,k-1,MS,组间,l,组间,/,组间,组间变异反映的是处理因素的作用,同时也包括随机误差,均方:mean square,MS,3、组内变异:各处理组内部观察值大小不等,用各处理组内部每个观察值与组均数的离均差平方各表示,记为,l,组内组内,(,n,1,-1)+(n,k,-1)=N-k,MS,组内,l,组内,/,组内,组内变异反映的观察值的随机误差,如个体差异和随机测量误差,4,、三种变异的关系,l,总,l,组间,l,组内,总,N,1,(k-1)+(N-k)=,组间,组内,三、方差分析的基本思想:,总变异可分解为组间变异和组内变异两个部分,相应的总自由度也分解为组间自由度和组内自由度。

      如果各样本均数来自同一总体,即各组之间无差别,则组间变异和组内变异均只反映随机误差,这时若计算组间均方与组内均方的比值,,F,MS,组间,/,MS,组内,,应接近1反之,若各样本均数不是来自同一总体,组间变异较大,,F,值将明显大于1要大到多大程度才有统计学意义?,这个程度就是与随机误差而言即以随机误差进行衡量,若处理组间的变异明显大于组内变异,则不能认为组间的变异仅反映随机误差,也就是说处理因素有作用R.A.Fisher,于20世纪20年代推导出在无效假设成立的情况下,统计量,F,的分布规律1934年,G.W.,Snedecor,以,Fisher,的名字命名了这一分布,称,F,分布,故,ANOVA,又称,F,检验F,(,组间,,,组内,)查表,基本思想:,根据资料变异的不同来源,将全部观察值总的离均差平方和和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用,(,或某几个因素的交互作用,),加以解释,如各组均数间的变异,SS,组间,,可由处理因素的作用加以解释,通过比较不同变异来源的均方,用,F,分布作出统计推断,从而了解该因素对观察指标有无影响注意:,1,、,ANOVA,与试验设计类型联系在一起,并非任何变异都有适当的分解。

      2、数据要求:,各次观察独立,即任何两个观察值间均不相关;,每一水平下的观察值,x,ij,分别服从总体均数为,ij,的正态分布;,各总体的方差相等,即方差齐性,homogeneity of variance.(,任何观察值都是独立地来自具有等方差的正态总体),第二节 完全随机设计的单因素,ANOVA(one,-way ANOVA),按完全随机化的原则将受试对象随机分配到一个研究因素的多个水平中去,然后观察试验效应目的:比较不同水平下,各组均值间的差别是否具有统计学意义,基本步骤:,P59,,,例61为例,1,、建立检验假设和确定检验水准:,Ho,:,4,种衣料吸附硼,氢,量的总体均数相等,即,1,2,3,=,4,H,1,:,4,种衣料吸附硼,氢,量的总体均数不全相等,0.05,2、计算检验统计量,F,值:如下表,成组设计方差分析计算表,以,P59,表61实例进行计算:先计算基本数据结果,再代入上表的公式计算:,C,、,SS,、,MS,、,F,等,一般将计算结果列为表62的形式,见,P61,3,、,确定,P,值和作出统计推断结论,按计算所得,F,值:11.1644,查附表62,表中,1,指分子均方的自由度,,2,为分母均方的自由度。

      F=11.164F,0.01(3,16),=5.29,,,故,PF,0.01,,,P0.01,,,说时放置时间长短对血糖浓度的变化是有影响的另外,不同受试者间血糖浓度亦有差别第四节 均数间的相互比较,一、几点说明,1,、,ANOVA,并不能回答哪几个均数间差别有统计学意义,需进一步做两两间的多重比较,multiple comparison,2,、,两两比较,不可用,t,检验,因为会增加第一类错误的概率k,个样本均数可做,k!/2!(k-2)!,次比较,如:,5,个样本,10,次,不犯第一类错误的概率为,(1-0.05),10,=0.5987,,,正确接受全部,10,次无效假设的概率,,一类错误概率为,1-0.5987=0.4013,二、常用的多重比较的方法,1,、,LSD-t,检验:称最小有意义差别,(least significant difference)t,检验,检验,k,组某一对或某几对在专业上有特殊意义的均数,d,AB,=X,A,-X,B,的总体水平是否为,0,算得的,t,值以误差自由来查,t,值表,与前述,t,检验的的不同:,举例说明计算过程,:t,0.001(16),=4.015,LSD t,检验,对比组,A,与,B,两均数之差,两均数之差标准误,LSD,t,值,t,临界值,P,值,棉与府,棉与的,棉与尼,府与尼,府与的,的与尼,2,、,Dunnett-t,检验,用于,k-1,个实验组与一个对照组均数差别的多重比较:,P66,,例,6-5,Dunnet,t,检验,对比组,A,与,B,两均数之差,两均数之差标准误,t,值,处理数,T,t,临界值,0.05,t,临界值,0.01,P,值,棉与府,棉与的,棉与尼,3,、,Student-Newman-,Keuls,法,SNK,法,检验统计量为,q,,,通常称,q,检验,用于多个样本均数间的两两比较,SNK q,检验,对比组,A,与,B,两均数之差,两均数之差标准误,q,值,处理数,T,q,临界值,0.05,q,临界值,0.01,P,值,棉与府,棉与的,棉与尼,府与尼,府与的,的与尼,比较时应将均数按大小顺序排列,一般先比较相关最大的两个均数,q,的分布与两比较组间跨度,a,及自由度有关。

      组间跨度,a(,对比组内包含组数,a),是指,X,A,与,X,B,之间涵盖的均数个数,包括,X,A,与,X,B,自身在内,MS,误差,为误差均方或组内均方,依,q,值、组间跨度,a(,处理数T,i,),、,误差自由度及检验水准查,q,值表,,q,q,(a,),时,有统计学意义,(P553,附表64,),两两比较方法选用,1,、在研究设计阶段未预先考虑或预料到,经假设检验得出多个总体均数不全相等的提示后,才决定的多个均数的两两,事后,比较,(post hoc comparisons/unplanned comparisons),,常用于探索性研究,exploratory research,,两两比较用:,SNK,法、,Bonfferoni,t,检验、,Sidak,t,检验,2,、在设计阶段就根据研究目的或专业知识而计划好的某些均数间的两两比较,(planned contrasts/comparisons),或称,事前,beforehand,比较,常用于事先有明确假设的证实性研究,confirmatory research,,如多个处理组与对照组的比较、某一对或某几对在专业上有特殊意义的均数间的比较,用,Dunnett-t,检验、,LSD-t,检验,也可用,Bonfferoni,t,检验(,该方法最保守,)或,Sidak,t,检验,第五节 拉丁方设计资料的方差分析*,一、拉丁方设计,latin,square design:,设计因素,(,标志,),两个以上,各因素的水平数相同,可用此设计。

      拉丁方是以拉丁字母排列的方阵的简称二、分析步骤:,例,6-6,,,P68,1,、求,C,2,、求,l,总,3,、求,l,受试者,4,、求,l,日期,5,、求,l,防护服,6,、求,l,误差,7,、自由度:总格子数减,1,为总变异自由度,防护服间、受试者间、试验日期间均为,n-1=5-1=4;,误差自由度,=,总自由度,-,防护服间,-,受试者间,-,试验日期间,=24-4-4-4=12,8,、列拉丁方分析表,见,P70,,表,6-16,9,、查表,判断结果,优点:可以从较少的实验数据获得较多的信息,比随机区组设计来得优越控制受试者间个体的差异,及实验日期间的差异,),缺点:各因素间有交互作用时,不适用实施时,要求各因素的水平数相等,实际中不易办到拉丁方可由统计书中查到,亦可自己编写第七节 方差齐性检验,检验多个样本的方差齐性用,Bartlett,法,一、各组样本含量相等时:,P71,,例,6-7,卡方值略大于某一临界值时,应计算校正卡方值,公式见,P72,二、各样本含量不等时:,P72,,例,6-8,Bartlett,法在各样本含量相等时是不敏感的所以各组样本含量相差不大,各组,S,2,相差不过大,可不必进行,Bartlett,检验。

      第七节 近似,F,检验,方差不齐时:采用以下两方法,1,、对原始数据进行转换,2,、用加权的方法计算加权的方差进行,F,检验,即近似,F,检验,(F,检验或,pseudo F test),,,具体计算方法,参见,P73,74,第八节 变量变换,ANOVA,的要求:任何观察值都独自地来自具有等方差正态总体不能满足时,可导致,F,值偏大,从而有增加第一类错误的危险,尤其违反独立性假设时,影响较为严重明显偏离可进行变量变换样本例数较多时,对总体的正态性并不苛求;每组样本例数相等时,对方差齐性亦不苛求,故最好采用例数相等的平衡设计方案一、变量变换:是将原始数据作某种函数转换,可使各组达到方差齐性,亦可使资料转换成正态分布,以满足方差分析和,t,检验的要求通常适当转换,可同时满足以上两个目的二、常用方法,1,、对数变换,logarithmic transformation,X=,lgX,;X=lg(X+1);X=,lg(X+k,);X=,lg(X-k,),用于:,1),、使服从对数正态分布的数据正态化如环境中某些污染物的分布,人体中某些微量元素的分布,2),、使数据达到方差齐性,特别是各样本的标准差与均数成比例或变异系数接近一个常数时,2,、平方根转换,square root transformation,常用于:,1),、使服从,Poisson,分布的计数资料或轻度偏态的资料正态化,2),、当各样本的方差与均数呈正相关时,可使资料达到方差齐性,3,、倒数转换,reciprocal transformation,X=1/X,常用于:数据两端波动较大的资料,可使极端值的影响减小,4,、平方根反正弦变换,arcsine transformation,常用于:服从二项分布的率或百分比的资料。

      一般认为总体率较小,(,如,70%),时,偏离正态较为明显,通过平方根反正弦转换可使资料接近正态分布,达到方差齐性要求,说明:,使用数据转换进行方差分析后,各均数间差别的比较及可信区间的计算,应该用转换后的数据进行计算,而当分析最终结论时,需返回原测量单位加以说明。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.