
第4章-方差分析.ppt
67页第四章 多个样本均数比较的方差分析2021/5/2112021/5/212主要内容n第一节 方差分析的基本概念n第二节 完全随机设计的方差分析n第三节 随机区组设计的方差分析n第四节 拉丁方设计资料的方差分析n第五节 两阶段交叉设计资料的方差分析n第六节 多个样本均数间的多重比较n第七节 多样本方差齐性检验2021/5/213第一节第一节 方差分析的基本概念方差分析的基本概念n什么是方差方差?n离均差n离均差平方和SSn方差(方差( 2 S2 ))均方(均方(MS))n 标准差:Sn自由度: n关系: MS= SS/ 一、方差分析的几个名词一、方差分析的几个名词2021/5/214 原始数据对于总均数的离差平方和可分解成几个部分,每一部分代表一种变异的来源,自由度也可得到相应的分解通过对不同来源变差的均方的比较,以判断某种变异原因的存在与否二、方差分析的基本思想二、方差分析的基本思想2021/5/215三、统计量三、统计量F 的计算及其意义的计算及其意义 F=MS组间/MS组内自由度: 组间=组数-1 组内=N-组数 通过这个公式计算出统计量F,查表求出对应的P值,与进行比较,以确定是否为小概率事件。
2021/5/216第二节第二节 完全随机设计的方差分析完全随机设计的方差分析(单因素方差分析单因素方差分析)2021/5/217何谓完全随机设计 是一种将研究对象随机地分配到处理因素各水平组的单因素设计方法,其研究目的是推断处理因素不同水平下的试验结果的差异是否有统计学意义,即该处理因素是否对试验结果有本质影响.2021/5/218例4-1 某医师为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名患者,采用完全随机设计方法将患者等分为4组进行双盲试验问如何进行分组?分组方法:先将120名高血脂患者从1开始到120编号,见表4-2第一行;从随机数字表中的任一行任一列开始,如第5行第7列开始,依次读取三位数作为一个随机数录于编号下见表4-2第二行;然后将全部随机数从小到大编序号(数据相同的按先后顺序编序号),将每个随机数对应的序号记在表4-2第三行;规定序号1-30为甲组,序号31-60为乙组,序号61-90为丙组,序号91-120为丁组,见表4-2第四行2021/5/219表4-2 120名患者等分为4组的完全随机设计分组结果编号12345678910...119120随机数260873373204056930160905886958...220634序号241063915311413109108117...1675分组结果甲丁乙甲甲丁甲丁丁丁...甲丙2021/5/2110n例4-2 某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组(具体分组方法见例4-1),进行双盲试验。
6周后测得低密度脂蛋白作为试验结果,见表4-3问4个处理组患者的低密度脂蛋白含量总体均数有无差别?2021/5/2111表4-3 4个处理组低密度脂蛋白测量值(mmol/L)2021/5/2112Xij第i 个组的第j 个观察值I=1,2,…gJ=1,2,…ni ni第i 个处理组的例数∑ni=N各种符号的意义各种符号的意义2021/5/2113数据结构2021/5/2114SS组内组内MS组内SS组间组间MS组间 三者之间的关系•SS总= SS组内+ SS组间•总= 组内+ 组间各种变异(各种变异(SS))的表示方法的表示方法SS总总MS总2021/5/2115 ,即4个试验组的整体均数相等 H1: 4个试验组的整体均数不全相等按表4-4中的公式计算各离均差平方和SS、自由度 、均方MS和F值 =102.91+81.46+80.94+58.99=324.30 =367.85+233.00+225.54+132.13=958.52C=(324.30)2/120=876.42 SS总=958.52-876.42=82.10, =120-1=1192021/5/2116方差分析表见表4-5。
按 水准, =3, =116 查附表3的F界值表,得结论:按 水准,拒绝H0,接受H1,认为4个处理组患者的低密度脂蛋白总体均数不全相等,即不同剂量药物对血脂中低密度脂蛋白降低有影响.2021/5/21172021/5/2118表4-5 例4-2的方差分析表 表4-4 完全随机设计资料的方差分析表2021/5/2119在满足下列条件下:1)各处理组所代表的总体服从正态分布;2)各处理组所代表的总体相互独立;3)各处理组所代表的总体方差齐性;4)各处理组所代表的总体均数相等 均方(MS)之比的意义2021/5/2120v1=vA,v2=veF(v1,v2)f(F)F分布及其上侧F界值2021/5/2121第三节 随机区组设计资料的方差分析2021/5/2122也叫也叫 配伍组设计的多个样本均数的比较配伍组设计的多个样本均数的比较 (双因素方差分析)(双因素方差分析) 应用分层的思想,事先将全部受试对象按某种或应用分层的思想,事先将全部受试对象按某种或某些特性分为若干个区组,区组内的试验对象均衡,某些特性分为若干个区组,区组内的试验对象均衡,区组之间试验对象具有较大的差异,这样利用区组控制区组之间试验对象具有较大的差异,这样利用区组控制非处理因素的影响,并在方差分析时将区组间的变异从非处理因素的影响,并在方差分析时将区组间的变异从组内变异中分解出来。
当区组间差别有统计学意义时,组内变异中分解出来当区组间差别有统计学意义时,这种设计的误差比完全随机设计小,试验效率得以提高这种设计的误差比完全随机设计小,试验效率得以提高是配对(两个组)资料的扩充(两个以上组) 2021/5/2123例4-3 如何按随机区组设计,分配5个区组的15只小白鼠接受甲、乙、丙三种抗癌药物? 方法为先将小白鼠的体重从轻到重编号,体重相近的3只小白鼠配成一个区组,见表4-6然后在随机数字表(附表15)中任选一行一列开始的2位数作为1个随机数,如从第8行第3列开始纪录,见表4-6;在每个区组内将随机数按大小排序,各区组中内序号为1的接受甲药,序号为2的接受乙药,序号为3的接受丙药,分配结果见表4-62021/5/2124表4-6 15只小白鼠分5个区组的随机区组设计分配结果乙 甲 丙乙 丙 甲丙 乙 甲甲 丙 乙丙 乙 甲分配结果2 1 32 3 13 2 11 3 2 3 2 1序号48 34 5652 70 0593 61 2800 99 5368 35 26随机数1 2 31 2 31 2 31 2 31 2 3小白鼠54321区组号2021/5/2125n例4-4 某研究者采用随机区组设计进行实验,比较三种抗癌药物对小白鼠肉瘤的抑瘤效果,先将15只染有肉瘤小白鼠按体重大小配成5个区组,每个区组内3只小白鼠随机接受三种抗癌药物(具体分配方法见例4-3),以肉瘤的重量为指标,试验结果见表4-9。
问三种不同药物的抑瘤效果有无差别?2021/5/2126表4-9 三种不同药物作用后小白鼠肉瘤重量(g)2021/5/2127分析变异分析变异总变异总变异:组间变异(因素一的变异)组间变异(因素一的变异):误差(组内)变异(随机误差)误差(组内)变异(随机误差):配伍间变异(因素二的变异)配伍间变异(因素二的变异):2021/5/2128统计量统计量F 的计算的计算 F1=MS组间/MS组内 F2=MS区间/MS组内自由度: 组间=组数-1=3-1=2 区间=区数-1=8-1=7 组内=(组数-1)(区数-1)=14都是和随机误差进行比较都是和随机误差进行比较 2021/5/2129H0: 即三种不同药物作用后小白鼠肉瘤重量的总体均数相等H1:三种不同药物作用后小白鼠肉瘤重量的总体均数不全相等按表4-8中的公式计算各离均差平方和SS、自由度 、均方MS和F值C=6.812/15=3.0917SS总=3.6245-3.0917=0.5328, =15-1=142021/5/2130表4-8 随机区组设计资料的方差分析表2021/5/2131按 水准, 查附表3的F界值表,得按 水准,拒绝H0,接受H1,认为三种不同药物作用后小白鼠肉瘤重量的总体均数不全相等,即不同药物的抑瘤效果有差别.2021/5/2132SS误差误差MS误差SS处理处理MS处理 四者之间的关系•SS总= SS误差+ SS处理 + SS区组 •总= 误差+ 处理+ 区组各种变异(各种变异(SS))和自由度的表示方法和自由度的表示方法SS总总MS总SS区组区组MS区组2021/5/2133v1,v2F(v1,v2)f(F)F分布及其上侧F界值2021/5/2134n方差分析结果提供了各组均数间差别的总的信息,但尚未提供各组间差别的具体信息,即尚未指出哪几个组均数间的差别具有或不具有统计学意义。
n为了得到这方面的信息,可进行多个样本间的两两比较注意2021/5/2135第四节 拉丁方设计资料的方差分析2021/5/2136 完全随机设计只涉及到一个处理因素随机区组设计涉及一个处理因素、一个区组因素(配伍因素)倘若实验研究涉及一个处理因素和两个控制因素,且每个因素的水平数相等时,此时可采用拉丁方设计来安排试验2021/5/2137例 4-5 某研究者为了比较甲、乙、丙、丁、戊、己6种药物给家兔注射后产生的皮肤疱疹大小(mm2),采用拉丁方设计,选用6只家兔,并在每只家兔的6个不同部位进行注射试验结果见表4-11,试做方差分析2021/5/2138表4-11 例4-5的拉丁方设计与试验结果(皮肤疱疹大小,mm2)2021/5/2139 ,即6种药物注射后家兔产生皮肤疱疹大小的总体均数相等 :6种药物注射后家兔产生皮肤疱疹大小的总体均数不全相等 ,即6只家兔皮肤疱疹大小的总体均数相等 6只家兔皮肤疱疹大小的总体均数不全相等 ,即6个注射部位皮肤疱疹大小的总体均数相等 6个注射部位皮肤疱疹大小的总体均数不全相等据例4-5的结果表4-11,按表4-12中的公式计算各离均差平方和SS、自由度 、均方MS和F值,计算过程从略,将计算结果按表4-12汇总,得方差分析表,见表4-13。
2021/5/2140拉丁方设计资料采用三向分类的方差分析,总变异可分解为处理组变异、行区组变异、列区组变异和误差4部分,其方差分析表见表4-12表4-12 拉丁方设计资料的方差分析表2021/5/2141表4-13 例4-5结果(表4-11)的方差分析表35.16703.35820误差>0.050.3713.06765.3375部位间>0.051.4350.333251.6635家兔间<0.053.74131.467657.3365药物间1686.3035总变异PFMSSS自由度变异来源2021/5/2142按 水准, 查附表3的F界值表, 按 水准,拒绝 ,接受 ,即6种药物注射后家兔产生皮肤疱疹大小的总体均数不全相等 按 水准,不拒绝 ,还不能认为6只家兔皮肤疱疹大小的总体均数不全相等; 按 水准,不拒绝 ,还不能认为6个注射部位皮肤疱疹大小的总体均数不全相等。
2021/5/2143第五节 两阶段交叉设计资料的方差分析2021/5/2144B处理A处理洗脱期洗脱期B处理A处理随机化分组两阶段交叉设计2021/5/2145例 4-6 表4-14是A、B两种闪烁液测定血浆中 的交叉试验结果第 Ⅰ 阶段1、3、4、7、9号用A测定,2、5、6、8、10号用B测定;第 Ⅱ 阶段1、3、4、7、9号用B测定, 2、5、6、8、10号用A测定试对交叉试验结果进行方差分析 表4-14 两种闪烁液测定血浆中 的交叉试验T2=7352T1=7289A、B合计14641( )S2=7370S1=7271各阶段设计1603A(803)B(800)101058B(530)A(528)9890A(450)B(440)81285B(650)A(635)71892A(952)B(940)61918A(958)B(960)51580B(800)A(780)41170B(602)A(568)31715A(855)B(860)21530B(770)A(760)1BiⅡⅠ合计 阶段 受试者2021/5/21462021/5/2147将以上结果列成方差分析表,见表4-15。
表4-15 例4-6的方差分析表n结论:①还不能认为A和B两种闪烁液的测定结果有差别;②可认为测定阶段对测定结果有影响;③可认为各受试者的 值不同2021/5/2148第六节 多个样本均数间的多重比较2021/5/2149能否用t检验或u检验?4个样本均数两两比较,若用t检验,共需做6次比较,若每次不犯第一类错误的概0.95,则10次都不犯一类错误的概率不是0.95,而是:0.956=0.74,这样总的检验水准变为0.402,犯一类错误的概率较0.05有了较大的提高2021/5/2150n最小有意义最小有意义t((LSD- t))检验:检验:检验K组中某一对或几对在专业上有特殊意义的均数(DAB =XA-XB)的总体水平是否为02021/5/2151LSD-t检验(Least significant difference)2021/5/2152例 4-7 对例4-2资料,问高血脂患者的降血脂新药2.4克组、4.8克组、7.2克组与安慰剂组的低密度脂蛋白含量总体均数有无差别?降血脂新药2.4克组与安慰剂组的比较: , ,有统计学意义。
可认为降血脂新药2.4g组的低密度脂蛋白含量总体均数低于安慰剂组 同样,对降血脂新药4.8g组、7.2g组,可算出LSD-t为-4.29、-8.59,都得P<0.001可认为降血脂新药4.8g组、7.2g组的低密度脂蛋白含量总体均数低于安慰剂组2021/5/2153Dunnett-t检验:K-1个实验组与一个对照组均数差别的多重比较2021/5/2154例 4-8 对例4-2资料,问高血脂患者的三个不同剂量降血脂新药组与安慰剂的低密度脂蛋白含量总体均数是否有差别? , , 2021/5/2155(双侧),得 有统计学意义可认为降血脂新药各组与安慰剂组的低密度脂蛋白含量总体均数有差别,即三个不同剂量降血脂新药都可降低血脂中低密度脂蛋白含量。
2021/5/2156SNK法法也叫也叫Student-Newman-Keuls((SNK-Q))检验检验计算统计量计算统计量Q的公式:的公式:组间跨度组间跨度a:把均数从小到大排,把均数从小到大排,A与与B间包含的组数间包含的组数利用统计量q做统计推断的方法:2021/5/2157例4-9 对例4-4资料,问三种不同药物的抑瘤效果两两之间是否有差别? , ,将三个样本均数由小到大排列,并编组次:均数 0.314 0.434 0.614组别 C药 B药 A药组次 1 2 3MS误差=0.0096, 2021/5/2158按 水准,三个对比组中的1与3组、2与3组拒绝H0,接受H1,有统计学意义,可认为C药与A药间、B药与A药间抑瘤效果有差别。
但1与2组不拒绝H0,还不能认为C药与B药间抑瘤效果有差别<0.054.753.264.1120.1802,3<0.015.644.046.8530.3001,3>0.054.753.262.7420.1201,2(7)(6)(5)(4)(3)(2)(1)Pqa对比组次2021/5/2159第七节 多样本方差比较的Bartlett检验和Levene检验2021/5/2160方差分析的应用条件: 各样本相互独立,均服从正态分布并且方差具有齐性(homogeneity of variance)方差齐性检验方法:Bartlett法、Levene法2021/5/2161例 4-10 对例4-2资料,试分析各处理组的低密度脂蛋白值是否满足方差齐性? 表4-17 例4-2的方差齐性检验表-0.5850.5577.2g组-1.3980.2474.8g组-0.8980.4072.4g组-0.6710.511安慰剂组分组2021/5/2162还不能认为4个试验组的低密度脂蛋白值不满足方差齐性2021/5/2163Levene法 所分析资料可不具有正态性;其法计算量较大,一般借助统计软件来完成。
2021/5/2164变量变换n目的:将原始资料变换成适用于检验方法的资料n方法:对数变换、平方根变换、倒数变换等2021/5/2165小 结2021/5/2166部分资料从网络收集整理而来,供大家参考,感谢您的关注!。












