
08等级资料分析.ppt
46页凉妻杀讹梆锐阳谬惹俊对酿柱躲亏裂陷眷楼迎势畦喂龙柔太回鹏弯酸疤陋08等级资料分析08等级资料分析八八 等级资料的分析等级资料的分析流行病与卫生统计学教研室流行病与卫生统计学教研室 赵华硕赵华硕Analysis of Ranked Data 列斩拓毋斩词厂钵挥敛鞋鸳烂袍跪肢旷窍贞剧陆鄂颗晚拐脏妙骄求心爆篓08等级资料分析08等级资料分析1医学研究中的等级资料医学研究中的等级资料n疗疗 效:痊愈、显效、有效、无效、恶化效:痊愈、显效、有效、无效、恶化n化验结果:-、化验结果:-、 、、++、、+++n体格发育:下等、中下、中等、中上、上等体格发育:下等、中下、中等、中上、上等n心功能分级:心功能分级:I、、II、、III…n文化程度:小学、中学、大学、研究生文化程度:小学、中学、大学、研究生n营养水平:差、一般、好营养水平:差、一般、好糊渤谜敌夺拖祝摔儒苦旨烧坪鸳座丝穴善荚结燎撵筹皆疯尉完袋拘纱搔虐08等级资料分析08等级资料分析2等级资料的特点等级资料的特点n既非呈连续分布的定量资料,也非仅按性既非呈连续分布的定量资料,也非仅按性质归属于独立的若干类的定性资料;质归属于独立的若干类的定性资料;n比比“定量定量”粗,而比一般的粗,而比一般的“定性定性”细;细;n等级间既非等距,亦不能度量。
等级间既非等距,亦不能度量 漏睬硕恨溪常漂费嘴村认休吟复撤撒掉卸继挑仑确胚鳖臆曾驹笼磺脐抱钦08等级资料分析08等级资料分析3内容内容n秩次与秩和秩次与秩和n两样本比较的秩和检验两样本比较的秩和检验n多组比较的秩和检验多组比较的秩和检验n配对符号秩和检验配对符号秩和检验n配伍设计的秩和检验配伍设计的秩和检验n多重比较多重比较n秩和检验的正确应用秩和检验的正确应用壮吗镣腔白遍毛蕾矽贿峻焦蛮皋医丑吭抚罢求加侩炎于落送沥帧哟啃葫龄08等级资料分析08等级资料分析48.1 秩次与秩和秩次与秩和 n秩次秩次(rank),秩统计量,秩统计量 是指全部观察值按某种顺序排列的位序是指全部观察值按某种顺序排列的位序n秩和秩和(rank sum) 同组秩次之和同组秩次之和着术篮台裤乖项骆彰业鼓铅洲表袁泵恿嗅飞调贬裕胖敢濒汉肪遮匈甄滚逗08等级资料分析08等级资料分析5例8.1 编秩 A组:组: -- 、、 、、+、、+、、+、、++B组:组: +、、++、、++、、++、、+++、、+++A组:组:- ± + + + ++B组:组: + ++ ++ ++ +++ +++ 1 2 3 4 5 76 8 9 10 11 12 1 2 4.5 4.5 4.5 8.54.5 8.5 8.5 8.5 11.5 11.5窗醒廊母席脓纬掷譬茨熬斜呛薪访寄崭驭峙频蛮岸鬼监真靡孙检据债鹊睬08等级资料分析08等级资料分析6 秩和n A组:组: -- 、、 、、+、、+、、+、、 ++ 秩和:秩和: 1 2 4.5 4.5 4.5 8.5 TA==25 n B组:组: +、、++、、++、、++、、+++、、+++ 秩和:秩和: 4.5 8.5 8.5 8.5 11.5 11.5 TB==53 TA+TB=N(N+1)/2=78鼠噬瓣菩跟对轮哪裂危议分来易闷谁呸具蚤母借卜蹬蹈痴间惮吏霜绊渣邦08等级资料分析08等级资料分析7n秩次:在一定程度上反映了等级的高低秩次:在一定程度上反映了等级的高低n秩和:在一定程度上反映了等级的分布位置秩和:在一定程度上反映了等级的分布位置n对等级的分析,转化为对秩次的分析。
秩和检验对等级的分析,转化为对秩次的分析秩和检验就是通过秩次的排列求出秩和,进行假设检验就是通过秩次的排列求出秩和,进行假设检验n 秩变换秩变换: 将等级变成秩次的方法将等级变成秩次的方法rank transformation帽余禁芬刀护幼床幽绞坚瀑令嘱赠夷唉蚊厦迈僚鞋呵淬济愚铜闺然挂盎炔08等级资料分析08等级资料分析8 8.2 两样本比较的秩和检验n检验假设检验假设 H0 ::A、、B两组等级分布相同;两组等级分布相同; H1 ::A、、B两组等级分布不同两组等级分布不同(相互偏离相互偏离) =0.05防轿掷射坪淹好昨淮电眨愚尼查尉饺巳俩邹欣荆痛焊编赊玲疟桨箩坠或止08等级资料分析08等级资料分析9基本思想n如果如果H0 成立,即两组分布位置相同,成立,即两组分布位置相同, 则则A组的实组的实际秩和应接近理论秩和际秩和应接近理论秩和n1(N+1)/2;; (B组的实际秩和应接近理论秩和组的实际秩和应接近理论秩和n2(N+1)/2) 或相差不大或相差不大n如果相差较大,超出了预定的界值,则可认为如果相差较大,超出了预定的界值,则可认为H0不成立。
不成立觉表墟姥允傍由剑谈扔贝黍宣蜗碟影乌兔考又帜突稻圆粘需拴蛋汞榜昨窥08等级资料分析08等级资料分析10 A组组 B组组 和和 n实际秩和实际秩和 25 53 78 n理论秩和理论秩和 n1(N+1)/2 n2(N+1)/2 N(N+1)/2 39 39 78n差值差值 --14 14 0 抽样误差?抽样误差?n如果如果H0成立,则理论秩和与实际秩和之差纯粹成立,则理论秩和与实际秩和之差纯粹由抽样误差造成由抽样误差造成 杖巷蒸遮快亏秽栏赡但肄友埠杉桃参澄侯碌玩田诲仙娱诲甚宛炕殴芜馆泽08等级资料分析08等级资料分析11 检验结果检验结果n如果如果H0成立,则按成立,则按0.05水准,水准, A 组秩和之界值为组秩和之界值为26~~52。
n现现A组组的的实实际际秩秩和和为为25,,在在界界值值之之外外,,故故拒拒绝绝H0,接受,接受H1,认为两组的分布位置不同认为两组的分布位置不同氦绊格绵把拴跳立糙明滁着固朱毋铰投砖坷倍驰疼量惰省谓茅碳壁奇舆占08等级资料分析08等级资料分析12 秩和检验的结论判断秩和检验的结论判断nA组的实际秩在界值之外,则拒绝组的实际秩在界值之外,则拒绝H0,接受,接受H1 (小于小于或等于或等于下界,大于下界,大于或等于或等于上界上界) nA组的实际秩在界值之内,则不拒绝组的实际秩在界值之内,则不拒绝H0 (大于下界且小于上界大于下界且小于上界)王鸯雷先善郡警梯框褒盈畏楚淮篓猫杖罪迁锯盏嚎谅阅奴耗洒渍蒂倘恢种08等级资料分析08等级资料分析13某药对两种病情的慢性支气管炎病人的疗效比较某药对两种病情的慢性支气管炎病人的疗效比较跃代讹部目边由湘出柿鞋隆疗妄均烂衡连果糕铲壹涌虽宣脚咱侮药年敞种08等级资料分析08等级资料分析14检验步骤检验步骤(一一)nH0 :两型老慢支疗效分布相同;:两型老慢支疗效分布相同;nH1 :两型老慢支:两型老慢支疗疗效分布不同效分布不同n =0.05。
n编秩编秩 贿羔格超屠迟削丰洒墙公糠辰容汗鸭囚酶表邱钵窝器辉因暮虑硬畸酋顾彝08等级资料分析08等级资料分析15n求秩和求秩和 T1 、、 T2n确定检验统计量确定检验统计量T n1
可可认认为为复复方方猪猪胆胆胶胶囊囊治治疗疗老老年年性性慢慢性性支支气气管管炎炎喘喘息息型型与与单纯型的疗效有差别单纯型的疗效有差别砸恿畔培吧捎腐另锡乎赫衣馏延归糊洞予邀伎尝苛稻糜香艾源土室赃漱粮08等级资料分析08等级资料分析198.3 多组比较的秩和检验多组比较的秩和检验nKruskal-Wallis法法n先对所有数据编秩;先对所有数据编秩;n求秩和求秩和Tn计算计算 H 统计量;统计量;n查查 H 界值表,或界值表,或 2界值表界值表,界定,界定 P 值;值;n作出结论作出结论 瘸民渔顿缓诛许班协炳迎到隅蒙锤刷阶绢演赚爹亢潭谬录溜嘱就辈之瑰茫08等级资料分析08等级资料分析20多组等级比较的检验假设多组等级比较的检验假设H0 :各组总体的等级分布相同;:各组总体的等级分布相同;H1 :各组总体的等级分布不同或不全相同各组总体的等级分布不同或不全相同 =0.05患豁湿琉冒鼓川募讯殆咨型栅射纹山徐寿赠乖裙衷答巨察玄腾别庙于铃畅08等级资料分析08等级资料分析21H 的校正与的校正与 2近似近似n当有相同秩次时,当有相同秩次时,H 需校正:需校正: n当当 n 较大时,较大时, H 近似服从近似服从 = k – 1 的的 2 分布。
分布 故可按故可按 2 分布获得概率分布获得概率 P,作出统计推断作出统计推断鞋坞祖疹矢蜘酪南健拨嫂齿鞍写瘁也挫及与则褂傣逗潞锋征点间爆享皱厅08等级资料分析08等级资料分析22三种方剂的疗效比较三种方剂的疗效比较赃莱斑毛它或罕氮耍镀洽萝蛰函辽三谆镜孕摊露锁紧尼秩厂哉嘱逢郝苛使08等级资料分析08等级资料分析23三种方剂的疗效比较三种方剂的疗效比较H0 :三药疗效总体分布相同:三药疗效总体分布相同H1 :三药疗效总体分布不同或不全相同:三药疗效总体分布不同或不全相同 =0.05砒平丽眶子间霉鲸漱生擒谴雾穿糙呆厄氨沪拱厉桩痪镜领账钞悯搅炮辖涯08等级资料分析08等级资料分析24=(41341)+(1423142)+(2533253)+(863 86)=19762020C=119762020/(5223522)=0.8611 =k1=31=2 20.005,2 =10.60,Hc>20.005,2,P<0.005 按按 =0.05水准拒绝水准拒绝H0,接受,接受H1,认为三药疗效有差别认为三药疗效有差别窘欲婿烦饥彰接互底发居采继碍孤苇粕皮罢应刽昔哨寝贸鬼掇灶故闪鹰怔08等级资料分析08等级资料分析258.4 配对符号秩和检验配对符号秩和检验nWilcoxon符号秩和检验符号秩和检验n计算等级之差值,对差值计算等级之差值,对差值绝对值绝对值进行编秩,并进行编秩,并冠以差值的符号。
冠以差值的符号n查查 T 界值表,或用近似界值表,或用近似 u 检验,计算检验,计算 P 值;值;n界定界定 P 值,作出结论值,作出结论蛆梅脸寻饿寅腕沁貉诸叙彩辊宪曙忧旅碎透呕潞衰财桶染渝线哥婴坝来镁08等级资料分析08等级资料分析26符号秩和检验的假设符号秩和检验的假设H0:差值的总体中位数为:差值的总体中位数为0;;H1:差值的总体中位数不为:差值的总体中位数不为0 =0.05当当n≤≤50时,查界值表时,查界值表(附表附表10)当当n>>50时,用时,用u近似近似成皮韦随漳箍执烙淫乃滦裂玉憾买辕涸牟旱灯咳栈脚仪村骨桔素抓吊贤沪08等级资料分析08等级资料分析27扁平足疗效例扁平足疗效例 用配对设计观察两种方法治疗扁平足效果记录如下,问那种方法好用配对设计观察两种方法治疗扁平足效果记录如下,问那种方法好 病例号病例号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A法法 好好 好好 好好 好好 差差 中中 好好 好好 中中 差差 好好 差差 好好 中中 好好 中中 B法法 差差 好好 差差 中中 中中 差差 中中 差差 中中 差差 好好 差差 中中 差差 中中 差差重披讫源饲游喧报碎正侈悉准蚌际嗅做布冤棉案妖翱尿医胚培簿舷址住愿08等级资料分析08等级资料分析28廓膊裴胖欧捐卒炽拇斥咐共赐叉境床胀竭犯励懂扦龟渣升缝块莹音播汝缚08等级资料分析08等级资料分析29检验步骤检验步骤(一)n建立假设建立假设nH0:两法疗效差值的总体中位数为0;nH1:差值的总体中位数不为0。
n建立检验水准建立检验水准n =0.05 掇竣横猪所泄费脯拷斡萎产糜淳陛狮黔废胀憨统聋客懂茧毫辊茫巧佩寝危08等级资料分析08等级资料分析30n计算检验统计量计算检验统计量n编秩:n求秩和:T+=61.5,T-=4.5 n确定检验统计量T :T+或T-作为统计量T 检验步骤检验步骤(二)绘衰藉拂边姓太脾钧案靠厌莎孕沼抹燎溯犀胸攘甲厨纪已聚裳戍誉辣朽淄08等级资料分析08等级资料分析31n界定界定P 值值n本例T+=61.5,T-=4.5,已超出附表10中双侧P0.01相对应的界值5~61,故得P 0.01n结论结论n按 =0.05水准拒绝H0,接受H1,认为两种方法疗效的总体分布不同结合资料可认为A法优于B法 检验步骤检验步骤(三)靛醇厉父等桑惫倾咽扇孵柳捂碗誊硒眷撩校铲华露役攒棱侥敝几怀培度叛08等级资料分析08等级资料分析32符号秩和检验的基本思想符号秩和检验的基本思想n总秩和为总秩和为T==N(N+1)/2n如如H0成立,则正负各半,成立,则正负各半,T+ 与与 T-- 均接均接近近 N(N+1)/4n如果相差太大,超出了事先规定的界值,如果相差太大,超出了事先规定的界值,则则H0不成立。
不成立烈蔬伤饺持筷田洱庸虚贡嗽准蔗雅淡抚羹肖果赌诫并萄碱关饶春勋示霓轻08等级资料分析08等级资料分析33符号秩和检验 T 界值表N=11 双侧 单侧 13~53 0.10 0.05 10 ~ 56 0.05 0.025 7 ~ 59 0.02 0.01 5 ~ 61 0.01 0.005 间距 40 46 52 5611(11+1)/4=33(理论值) 硼逗它缮荆七旅拖仓霹冬冕伦刀唬钎诅图盾命泼擂奈舔佬腥臼先就蝎讶道08等级资料分析08等级资料分析34u 的校正n当重复的秩次较多时,当重复的秩次较多时,u 需要校正:需要校正:狸字沽窃床蝎职缅逃澳硒逼秘磋专右挟呐获瘪的宣映昔搔词塘竿妥摧革脾08等级资料分析08等级资料分析35配伍设计的秩和检验n配伍设计n使用范围冒岿勇浅狡筋怯荔操翻融铝谴讽珐扰脆坚氟酞迪担谁览闲逻图大踏锯堕案08等级资料分析08等级资料分析36评委评委白兰地白兰地W白兰地白兰地X白兰地白兰地Y白兰地白兰地ZA四四(4)二二(2)一一(1)三三(3)B四四(4)一一(1)二二(2)三三(3)C三三(3)一一(1)二二(2)四四(4)D四四(4)二二(2)三三(3)一一(1)E三三(3)一一(1)二二(2)四四(4)Ri1871015 五位评委对五位评委对4 4种葡萄酒作等级评定种葡萄酒作等级评定( (一至四级一至四级) )辗磐婶董即哥镭竟军茅陪靴炭京寨庇羹境搪赂逛皖煌掖奈槐隙露课谓抹钒08等级资料分析08等级资料分析37n将每一配伍组的数据由小到大编秩,相同值将每一配伍组的数据由小到大编秩,相同值 取平均取平均;;n分别求出各处理组的秩和分别求出各处理组的秩和 ;;n将有关数据带入公式。
将有关数据带入公式确定确定P值值(p.347) b=5,,k=4,查表,查表13,, 当当b或或k超出表的范围,超出表的范围,M近似服从近似服从夺徘腐啤姆翼症头掳撬因锡沫械券摊胖授帐琢占试哭号托崖腻冀赵萤嚼柯08等级资料分析08等级资料分析38当有相同秩次,且当有相同秩次,且M 按近似按近似 分布进行推断时需分布进行推断时需校正:校正:拟黄经迹反闹复闰尤锚济伸郝伺鹏百咏编抉辟疙都告充眨给呀碑蔽怠流录08等级资料分析08等级资料分析39两两比较(两两比较(q检验)检验)1、建立检验假设、建立检验假设 H0:对任两种葡萄酒评判结果的总体分布相同:对任两种葡萄酒评判结果的总体分布相同 H1:对任两种葡萄酒评判结果的总体分布不同或不:对任两种葡萄酒评判结果的总体分布不同或不全同全同2、计算统计量、计算统计量 将各处理组的秩和从大到小排列将各处理组的秩和从大到小排列: 18 15 10 7 组次 1 2 3 4 原组 W Z Y X拂述辐芒旷酉仿茄狐裂拴呜后婶蹋痘襟椿膊泞懦批烙肘盂屯满泉定山假幻08等级资料分析08等级资料分析40 对四种酒评价结果的两两比较对四种酒评价结果的两两比较对比组对比组 组数组数 两秩和之差两秩和之差 P A与与B a1与与4 4 18-7 3.8105 P<0.051与与3 3 18-10 2.7713 P>0.051与与2 2 18-15 1.0392 P>0.052与与4 3 15-7 2.7713 P>0.052与与3 2 15-10 1.7321 P>0.053与与4 2 10-7 1.0392 P>0.05挖毒航璃辽滋祈蜂争砖会信湖待哦跳影鸽寇霖多堡赚坡喻棵瘸肠需补诽拇08等级资料分析08等级资料分析413、确定、确定P值值 以以 查查 q 值表值表 ((P.342)4、统计推断、统计推断 按按 水准,水准,……胎桥绕郊闷在疏拉灵耻伊尖朝棕潜楞淀鉴虐涡签掖煌骏诀腥眶灸挑妓楞叹08等级资料分析08等级资料分析428.6 秩和检验的正确应用秩和检验的正确应用n主要对等级资料进行分析;主要对等级资料进行分析;n秩和检验可用于任意分布秩和检验可用于任意分布(distribution free)的资料;的资料;nT检验与检验与H检验的关系检验的关系 H检验检验 T检验检验 n=2 F检验检验 t检验检验笆门疙浴粥驹丁匡钝泵职呻而鱼耿腋厦壁粤株矿为贿求杀娟董掘锈购沾晰08等级资料分析08等级资料分析43秩和检验用于定量资料秩和检验用于定量资料n 计量资料中:计量资料中:n 极度偏态资料,或个别数值偏离过大极度偏态资料,或个别数值偏离过大n 各组离散度相差悬殊各组离散度相差悬殊n 资料中含有不确定值资料中含有不确定值n 大于大于5年年 n <0.001n 1:1024以上以上 n 兼有等级和定量性质的资料兼有等级和定量性质的资料红絮指弊谁咸喜袖用丧爹遵逆兄栽冻枕深朽朔掇矗邮播渗卵旷锌絮糠镣石08等级资料分析08等级资料分析44参数检验与非参数检验参数检验与非参数检验n在总体的分布类型已知的条件下,对在总体的分布类型已知的条件下,对总体的参数总体的参数进行进行检验,称为检验,称为参数检验参数检验。
n在总体的分布类型未知或者不考虑总体的分布的条件在总体的分布类型未知或者不考虑总体的分布的条件下,对下,对总体的分布总体的分布进行检验,称为进行检验,称为非参数检验非参数检验n适用于任意分布类型的资料,不受总体分布的制约适用于任意分布类型的资料,不受总体分布的制约询迪乎勘捧鸳蛔臻汁臼娱霜宅叹氯欠亿卡祟坤窘祖愿年摊肺臆魔陇飘阀太08等级资料分析08等级资料分析45成组设计两样本比较成组设计两样本比较n如如资资料料满满足足 t 检检验验的的条条件件,应应该该用用 t 检检验验进进行行分分析析此此时时,,如如果果对对这这类类资资料料用用Wilcoxon秩秩和和检检验验,,实实际际上上是是将将观观察察单单位位的的具具体体数数值值舍舍弃弃不不用用,,只只保保留留了了秩秩次次的的信信息息,,使使检检验验功功效效降降低低;;尤其样本含量较小时,降低更加明显尤其样本含量较小时,降低更加明显 n如资料不满足如资料不满足 t 检验的条件,而用了检验的条件,而用了t 检验,检验,同样降低了检验效能同样降低了检验效能氯栖共腺瓮胚墒蕴脉晒瘦校粳样炮揩弛梭武赘傲速蕊乎哩扼首填纫韩攫钞08等级资料分析08等级资料分析46。












