
重复测量方差分析.ppt
66页方 差 分 析单因素:完全随机设计两因素:随机区组设计多因素:???重复测量设计单组多组单因素方差设计只涉及一个处理因素 该因素至少有两个水平有两水平时:称为两样本均数比较两水平以上:称多个样本均数比较的方差分析知识点:多重比较时有 特定的方法,不能用两 样本均数比较,此时容 易加大Ⅰ类错误(把本无差别的两个总体判为 有差别)的概率为什么 ?Why?举例:有4个样本均数如果用t检验每次比较选α=0.05,不犯Ⅰ错误的概率1-α6次不犯Ⅰ错误( 1-α)6总的水准:1-( 1-α)6= 1-( 1-0.05)6=0.26比0.05大多了!!比较的次数越多犯Ⅰ错误的概率越大!!把无差别的结果判为有差别完全随机设计如比较4种饲料对小鼠体重增加量的影响,处理 因素是饲料,有4个水平(不同饲料)完全随机设计是将n个小鼠随机分为4组随机区组设计是将n个小鼠按出生体重相近的原则,4个一组相配(称为区组)后,再随机分不同的水平组 ,称为两因素方差分析非处理因素应用条件1. 各样本是相互独立的随机样本,均服从正态分布2. 相互比较的各样本的总体方差相等,具有方差齐性重复测量设计一、重复测量资料的数据特征当对同一受试对象在不同时间重复测量次数 p≥3时,称为重复测量设计或重复测量数据。
测 量 时 间 点 受试者1 2 … p1 y11 y12 … y1p2 y21 y22 … y2p: n yn1 yn2 … y n p图例重复测量资料是同一受试对象的同一观察指标在不同时间点上进行多次测量所得的资料,常用来分析该观察指标在不同时间点上的变化有时是从同一个体的不同部位(或组织)上重复测量获得的指标的观测值目的:就是比较不同时间点动态变化趋势的特征问题?想一想?同一观察单位具有多个 观察值,而这些观察值来自同一 受试对象的不同时点(部位等),这类数据间往往有相关性存在, 违背了方差分析要求数据满足独 立性基本条件在这种情况下:若使用一般的方差分析,就不能充分揭示出内在的特点,有时甚至会得出错误结论所以重复测量资料需要采用专门的统计分析方法,该方法是近代统计学研究的热点之一。
实际中:重复测量资料比独立资料更多见●临床研究中,需要观察病人在不同时间的某些生理、生化或病理指标的变化趋势,研究不同时间或疗程的治疗效果●流行病学研究中,观察队列人群在不同时间上的发病情况研究不同职业、性别人群实施某种控制后,不同时间的多次效果考察●卫生学研究中,纵向观察儿童生长发育规律等,不同地区和环境营养状况提醒大家重复测量数据在医学研究中十分常见,在医学类杂志上约占四分之一,而且统计表达和分析误用情况严重主要优点减少样本含量控制个体变异非实验因素(干扰因素)重复测量设计与随机区组设计的区别?1. 随机区组设计要求每个区组内实验单位彼此独立区组号 A营养素 B营养素 C营养素1 50.10 58.20 64.502 47.80 48.50 62.403 53.10 53.80 58.604 63.50 64.20 72.505 71.20 68.40 79.306 41.40 45.70 38.407 61.90 53.00 51.208 42.20 39.80 46.20表 A、B、C 3种营养素喂养小白鼠所增体重(克)处理因素只能在区组内随机分配每个实验单位接受处理是不同的见左表:2. 重复测量设计区组内实验单位 彼此不独立,见表12-3但同一受试的血样重复测量结果是高度相关的,见表12-6:提示:分析存在一定的复杂性。
二、重复测量资料分类 repeated measurement data● 单变量重复测量方差分析● 多变量重复测量方差分析● 单变量重复测量方差分析1. 单组重复测量指同一组内(或接受同一种处理)的多个受试 者,在多个时间点上的反应变量所作的测量, 又称为单变量重复测量测 量 时 间 点 受试者1 2 … p 1 y11 y12 … y1p 2 y21 y22 … y2p : n yn1 yn2 … y n p2.多组重复测量(多组并不等于多因素)指将受试者按处理的不同水平分为几个组,对这 些组内的每一受试者,都在不同时间点对他们的 反应变量进行测量表3.1(余松林)1. 单组重复测量数据方差分析2. 两组重复测量数据方差分析● 单变量重复测量方差分析三、重复测量资料分析的前提条件和基本步骤1.前提条件:首先要求样本是随机的,除了满足一般方差分析条件外,特别强调满足协方差阵(covariance matrix)球形性。
sphericity概念:协方差阵的球对称性是指该对角线元素(方差)相等、非主对角线元素(协方差)为零方差指在某一时点上测定值变异的大小,而协方差是指在两个不同时点上测定值相互变异的大小如果在某个时点上的取值不影响其它时点上的取值则协方 差为0,相反,则不为0由协方差构成的矩阵称为协方差阵00若球对称性得不到满足,方差分析的F值是有 偏的,会增大Ⅰ类错误的概率2. 用Mauchly法检验协方差阵的球形性质如果P值大于α,说明协方差阵的球对称性质得到满足否则,必须对与时间有关的F统计量的分子和分母自由度进行调整,减少Ⅰ类错误的概率调整系数为:ε(读:epsilon)3.自由度常用调整方法①Greenhouse-Geisser 法,简称:G-G法②Huynh-Feldt 法,简称:H-F法③Lower-bound法,简称:L-B下界法以上前两种方法较复杂,采用软件计算4. 举例:单组重复测量数据的方差分析观察10名慢性乙型肝炎患者治疗前、治疗12周、24周 、36周四个时间点上谷丙转氨酶(ALT)水平的变化趋势,结果见下表,试进行统计推断分析: 数据结构上与完全区组设计相似但实质不同各观测点时间顺序是固定的,不能随机分配;不同观测点数据彼此不独立或不完全独立,存在一定的相关性。
SAS结果中包括偏相关阵例题 1.建立假设,确定检验水准α=0.012.进行球对称性检验球对称性通常采用 Mauchly’s test检验标准来判断3.调整时间点F值的自由度调整原则:⑴当资料满足“球对称”(Sphericity)条件时( P>α) ,不作调整⑵当资料不满足“球对称” 条件时( P27的肥胖患者40名随机等分成表9-13可以看出重复测量资料中同一受试对象( 看成区组)的数据高度相关无论哪位受试对象服用曲明片剂或是胶囊,其服药后8 周、16周和24周的体重均和前面时间点(含服药前的0周)的体重相关不同时点数据其相关性较强 重复测量资料方差分析的基本步骤分为三步:⑵计算检验统计量:使用统计软件进行计算结果如下 :⑶确定P值,做出推断结论: 根据专业知识和假设检验,直接由计算机所 给 P值做出推断结论按α=0.05水准,减肥药剂型k(片剂和胶囊),剂型k 与时间i的交互效应ki均不拒绝H0,无统计学意义,还不能认为曲明不同剂型的减肥效果不同,也还不能 认为剂型k与时间i间有交互效应而时间因素i拒绝 H0,接受H1,有统计学意义,可认为服用减肥药盐 酸西市曲明前后不同时间(8周、16周和24周)的平均体重不全相同。
重复测量资料方差分析的前提条件重复测量资料的方差分析,除了满足一般方差 分析的条件外,还要满足协方差阵的球形性或 复合对称性若条件不能满足,F值有偏性,通 常采用Mauchly检验来判断,通过软件选参数计算校正后的结果:两组重复测量数据结构SAS程序显示该资料不满足球对称性,参看校正结果结果表明经G-G和H-F调整后,按α=0.05检验水准,A(不同药物)和A与TIME(时间)无统计学意义,后者无交互作用,而时间因素间有统计学意义例4 用丹参注射液治疗7例慢性肾功能衰竭患者,治疗前后不同时间各患者的血尿素氮(BUN)的变化,如表所示试比较治疗前后不同时间各患者血尿素氮 的变化是否不同?表4-5 丹参注射液治疗慢性肾衰患者不同时间的BUN(mg/dl)变化治 疗 后不同患者 治疗前 第2周 第4周 第6周1 60.7 41.0 34.5 36.22 65.2 44.7 41.2 39.43 66.3 42.4 40.5 37.74 67.1 49.1 43.3 40.25 62.8 38.5 40.1 35.86 72.5 52.3 44.6 37.67 58.0 35.0 38.6 37.2题意分析:本题要探讨治疗前后“不同时间” ,又要研究“不同患者”的血尿素氮的变化,是 属于按两因素分组的多个均数间比较的重复测 量方差分析首先在Insight中建立数据集,本题变量FL为不同治疗时间的分组变量,如治疗前为1,治疗后第2周为2,…,第6周为4。
X为BUN的测定值建好结构录入数据,格式如图4-17所示,数据集名为L2, 存入SASUSER库中,备用 如图所示:。






![河南新冠肺炎文件-豫建科[2020]63号+豫建科〔2019〕282号](http://img.jinchutou.com/static_www/Images/s.gif)





