
中科院心理所心理统计学9非参数检验.ppt
36页非非参数检验参数检验任课教师:禤宇明任课教师:禤宇明非参数检验方法非参数检验方法两相关样本的差异显著性检验两相关样本的差异显著性检验n符号检验法符号检验法n符号等级检验法(符号秩次检验法)符号等级检验法(符号秩次检验法)两独立样本的差异显著性检验两独立样本的差异显著性检验n等级和检验法(秩和检验法)等级和检验法(秩和检验法)n中数检验法中数检验法等级方差分析等级方差分析n克-瓦氏单向方差分析克-瓦氏单向方差分析n弗里得曼双向等级方差分析弗里得曼双向等级方差分析1 非参数检验的特点非参数检验的特点1.1 参数检验和非参数检验参数检验和非参数检验参数检验参数检验 parametric testsn指总体分布服从正态分布或总体分布已知条指总体分布服从正态分布或总体分布已知条 件下的统计检验件下的统计检验非参数检验非参数检验 nonparametric testsn又叫自由分布检验又叫自由分布检验 distribution-free tests,,指总体分布不要求服从正态分布或总体分布指总体分布不要求服从正态分布或总体分布情况不明时,用来检验数据资料是否来自同情况不明时,用来检验数据资料是否来自同一个总体的统计检验方法一个总体的统计检验方法1.2 非参数检验的优点和缺点非参数检验的优点和缺点优点优点n假设前提少,容易满足,计算简明、迅速,因此假设前提少,容易满足,计算简明、迅速,因此适适用面较广用面较广w顺序数据顺序数据、小样本数据、小样本数据n一旦参数检验方法的假设条件不成立,其推断就不一旦参数检验方法的假设条件不成立,其推断就不正确。
而非参数检验方法假设较弱,对模型的限制正确而非参数检验方法假设较弱,对模型的限制很少,因而具有很少,因而具有稳健性稳健性robustness 缺点缺点n当等距或比例数据能满足参数统计的所有假设时,当等距或比例数据能满足参数统计的所有假设时,非参数检验方法的效果不如参数检验方法非参数检验方法的效果不如参数检验方法w当数据满足假设时,参数检验方法能够从数据中广泛充分当数据满足假设时,参数检验方法能够从数据中广泛充分地利用有关信息而非参数检验方法只能从中提取一般的地利用有关信息而非参数检验方法只能从中提取一般的信息,相对而言会浪费一些信息信息,相对而言会浪费一些信息n非参数检验不能处理交互作用非参数检验不能处理交互作用2 两相关样本的差异显著性检验两相关样本的差异显著性检验2.1 符号检验法符号检验法 sign test适用条件适用条件n符号检验是通过对两个相关样本的每对数据符号检验是通过对两个相关样本的每对数据差数的符号(正、负号)的检验,来比较这差数的符号(正、负号)的检验,来比较这两个样本差异的显著性两个样本差异的显著性n符号检验是将中数作为集中趋势的度量首符号检验是将中数作为集中趋势的度量。
首先将两个样本中每对数据的差数用正负号表先将两个样本中每对数据的差数用正负号表示若两个样本无显著差异,正差值和负差示若两个样本无显著差异,正差值和负差值大致各占一半因此,零假设值大致各占一半因此,零假设H0 是是“差差值的中数等于零值的中数等于零”符号检验法的步骤符号检验法的步骤样本容量样本容量N<25时时n对于两样本每对数据之差(对于两样本每对数据之差(Xi – Yi),),不计不计大小,只记符号大小,只记符号n+、、n–分别表示差值正、分别表示差值正、负号的多少,零不计负号的多少,零不计n记记N== n+++n– ,,r = min(n+,,n–)n根据根据N与与r,,直接查符号检验表在某一显著直接查符号检验表在某一显著性水平下,若性水平下,若r值大于表中的临界值时,表值大于表中的临界值时,表示差异不显著,这与查其他参数检验临界值示差异不显著,这与查其他参数检验临界值表时不同表时不同P254 例例 9-1将将3岁幼儿经过配对而成的实验组施以岁幼儿经过配对而成的实验组施以5种颜色命名的教学,而对照组不施以教种颜色命名的教学,而对照组不施以教学问颜色教学是否有显著效率?学问颜色教学是否有显著效率?解:解:n+=7,,n–=3,,N=10,,r=3 > r0.05=1 ((有两个差值为零,不计在内)有两个差值为零,不计在内)因为因为r>r0.05,,所以颜色教学没有显著效率。
所以颜色教学没有显著效率符号检验法的步骤符号检验法的步骤样本容量样本容量N>25时时P256 例例 9-2在教学评价活动中,要求学生对教师的在教学评价活动中,要求学生对教师的教学进行教学进行7点评价(即点评价(即1~7分),下表是分),下表是某班学生对一位教师期中与期末的两次某班学生对一位教师期中与期末的两次评价结果,试问两次结果差异是否显著评价结果,试问两次结果差异是否显著??解:解:n+ = 8,,n– = 19, N = 27,,r = n+ = 8因此,在因此,在0.05水平下还不能认为两次评价水平下还不能认为两次评价结果有显著差异结果有显著差异2.2 符号等级检验法符号等级检验法Wilcoxon’sWilcoxon’s Matched-pairs Signed-ranks Test Matched-pairs Signed-ranks Test适用条件适用条件n符号等级检验法也叫添号秩次检验法,其适符号等级检验法也叫添号秩次检验法,其适用条件与符号检验法相同,但它的精度比符用条件与符号检验法相同,但它的精度比符号法高,因为它不仅考虑差值的符号还同时号法高,因为它不仅考虑差值的符号还同时考虑差值的大小考虑差值的大小符号等级检验法步骤符号等级检验法步骤N<25((小样本)小样本)把相关样本对应数据之差值按绝对值从把相关样本对应数据之差值按绝对值从小到大作等级排列小到大作等级排列n注意差值为零时,零不参加等级排列注意差值为零时,零不参加等级排列在各等级前面添上原来的正负号在各等级前面添上原来的正负号分别求出带正号的等级和(分别求出带正号的等级和(T++))与带负与带负号的等级和(号的等级和(T--),),取两者之中较小的取两者之中较小的记作记作T根据根据N,,T查符号等级检验表,当查符号等级检验表,当T大于大于表中临界值时表明差异不显著;小于临表中临界值时表明差异不显著;小于临界值时说明差异显著界值时说明差异显著例例:某幼儿园对:某幼儿园对10名儿童在刚入园时和入园一名儿童在刚入园时和入园一年后均进行了血色素检查,结果如下,试问两年后均进行了血色素检查,结果如下,试问两次检查有否明显变化?次检查有否明显变化?解解::T– = 1 + 6 + 2 + 5 = 14T+= 8 + 4 + 3 + 7 + 9 = 31T = T–= 14,,N = 9,, 查符号等级检验表,双查符号等级检验表,双侧检验,侧检验,T0.05/2 = 6因为因为T > T0.05/2,所以,两次血色素检查差异不,所以,两次血色素检查差异不显著。
显著符号等级检验法步骤符号等级检验法步骤 N> 25((大样本)大样本)按小按小样本的步骤求出样本的步骤求出T当当N>25时,一般认为时,一般认为T的分布接近正态的分布接近正态分布,其平均数和标准差分别为分布,其平均数和标准差分别为对对 P256 例例 9-2 做符号等级检验做符号等级检验2.3 当符号检验法和符号等级检当符号检验法和符号等级检验法出现矛盾验法出现矛盾此时应该相信符号等级检验法的结果,此时应该相信符号等级检验法的结果,因为它既考虑差值的符号,也考虑其大因为它既考虑差值的符号,也考虑其大小,利用了更多的信息,所以结果相对小,利用了更多的信息,所以结果相对可靠些可靠些3.两独立样本的差异显著性检验两独立样本的差异显著性检验3.1 中数检验法中数检验法适用条件适用条件n对应于参数检验法中的独立样本对应于参数检验法中的独立样本t检验,当检验,当“正态总体正态总体”这一前提不成立的条件,不能这一前提不成立的条件,不能用用t检验,可用中数检验法检验,可用中数检验法n两组顺序数据的差异检验两组顺序数据的差异检验零假设:两个独立样本是从具有相同中零假设:两个独立样本是从具有相同中数的总体中抽取的数的总体中抽取的可以是双侧或单侧检验可以是双侧或单侧检验中数检验法的步骤中数检验法的步骤将两个样本数据混合从小到大排列将两个样本数据混合从小到大排列求混合排列的中数求混合排列的中数统计每一样本中大于(小于)混合中数统计每一样本中大于(小于)混合中数的数据个数,列成四格表的数据个数,列成四格表进行卡方检验。
若卡方检验结果显著,进行卡方检验若卡方检验结果显著,则说明两样本的集中趋势(中数)差异则说明两样本的集中趋势(中数)差异显著显著P283 练习练习 5为了研究为了研究RNA核糖核酸是否可以作为记忆促进核糖核酸是否可以作为记忆促进剂,以老鼠为对象分成实验组与控制组,实验剂,以老鼠为对象分成实验组与控制组,实验组注射组注射RNA,,控制组注射生理盐水,然后在同控制组注射生理盐水,然后在同样条件下学习走迷津,结果如下(以所用时间样条件下学习走迷津,结果如下(以所用时间作为指标),试检验两组结果有否显著差异?作为指标),试检验两组结果有否显著差异?n实验组(实验组(n1=16))16.7, 16.8, 17.0, 17.2, 17.4, 16.8, 17.1, 17.0, 17.2, 17.1, 17.2, 17.5, 17.2, 16.8, 16.3, 16.9n控制组(控制组(n2=15))16.6, 17.2, 16.0, 16.2, 16.8, 17.1, 17.0, 16.0, 16.2, 16.5, 17.1, 16.2, 17.0, 16.8, 16.53.2 等级和检验法(秩和检验法)等级和检验法(秩和检验法)Mann-Whitney U test另一种和参数检验中独立样本另一种和参数检验中独立样本t检验相对检验相对应的非参数检验方法应的非参数检验方法适用条件适用条件n当当“总体正态总体正态”这一前提不成立时这一前提不成立时n顺序数据顺序数据U检验法步骤检验法步骤小样本:两个样本容量均小于小样本:两个样本容量均小于10((n1<10,,n2<10,且,且n1≤n2))n将两个样本数据混合由小到大进行等级排列将两个样本数据混合由小到大进行等级排列n把样本容量较小的样本中各数据的等级相加,把样本容量较小的样本中各数据的等级相加,以以T表示表示n把把T值与秩和检验表(值与秩和检验表(P492附表附表12)中的临)中的临界值比较,若界值比较,若T≤T1或或T≥T2,,则表明两样本则表明两样本差异显著;若差异显著;若T1 两班成绩有无显著差异次考试的成绩两班成绩有无显著差异??n实验班:实验班:92,,85,,88,,76,,90n普通班:普通班:75,,85,,96,,90,,68,,87,,85解:解:等级:等级: 1 2 3 1 2 3 5 5 55 5 5 7 8 7 8 9.5 9.5 9.59.5 11 12 11 12 实验班:实验班: 76 76 8585 88 88 9090 92 92 普通班:普通班:68 75 68 75 8585 8585 87 87 9090 96 96T = 3 + 5 + 8 + 9.5 + 11 = 36.5查表可知查表可知T1= 22 < T < T2= 43因此两班成绩无显著差异因此两班成绩无显著差异P275 例例 9-9已知对某班学生进行已知对某班学生进行注意稳定性实验的结注意稳定性实验的结果男女生的注意稳果男女生的注意稳定性有无显著差异?定性有无显著差异?4.等级(秩次)方差分析等级(秩次)方差分析4.1 Kruskal-Wallis单向方差分析单向方差分析KruskalKruskal-Wallis one-way analysis of variance-Wallis one-way analysis of variance又又称为称为H检验法检验法非参数方差分析非参数方差分析n数据不满足数据不满足“总体正态总体正态”和和“方差齐性方差齐性”n完全随机设计完全随机设计H检验法步骤检验法步骤先将各组数据混合,从小到大排出等级,先将各组数据混合,从小到大排出等级,再分别求出各组数据的等级和再分别求出各组数据的等级和Ri式中式中N为为k个样本容量的总和;个样本容量的总和;ni为为样本样本i的容量,的容量,Ri为样本为样本i的等级和的等级和当当 k = 3 且且 ni≤5 时,查时,查P495附表附表15的临的临界值,若界值,若H 大于临界值,拒绝大于临界值,拒绝H0当当 k > 3 或或 ni > 5 时,以时,以df = k-1的的 2为为临界值临界值P278例例9-17 已知分别来自教师、工人和已知分别来自教师、工人和干部家庭的干部家庭的11名学生的创造力测验结果,名学生的创造力测验结果,试问家长的职业与学生创造力有否某些试问家长的职业与学生创造力有否某些联系?联系?P279例例9-11:四所学校的代表队参加物:四所学校的代表队参加物理竞赛的成绩是否有显著差异?理竞赛的成绩是否有显著差异?4.2 弗里得曼双向等级方差分析弗里得曼双向等级方差分析Friedman’s rank test for k correlated samplesFriedman’s rank test for k correlated samples适用于随机区组设计(相关样本)适用于随机区组设计(相关样本)步骤步骤n将每一区组(被试)的将每一区组(被试)的k个数据(个数据(k为实验处为实验处理数)从小到大排出等级;计算每种实验处理数)从小到大排出等级;计算每种实验处理理n个数据(个数据(n为区组数)等级和为区组数)等级和Rin当当n≤9,,k=3或或n≤4,,k=4时,临界值可查时,临界值可查P445附表附表16;;n或或k超出附表范围时以超出附表范围时以df=k-1的的 2值为临界值值为临界值问问6位位教师对教师对3节课的评价是否一致?节课的评价是否一致?。
