
第8章 非参数检验ppt课件.ppt
36页1,第 8 章 非参数检验,2,第 8章 非参数检验, 8.1 概述 8.2 符号检验 8.3 秩和检验 8.4 游程检验,,3,8.1 概 述,非参数检验是一种不依赖对总体分布或参数的知识的检验方法由于它不对总体分布加以限制性的假定,所以也称为自由分布检验4,与参数检验对比,共同点: 对总体的某种数量特征作出假设 建立原假设和备择假设 给定检验的显著性水平 并根据实际的统计量来判断对原假设的取舍 不同点: 参数的检验需要对总体分布作限制性的假定 非参数检验是一种不依赖对总体分布的检验,5,非参数检验评价,优点: 检验条件比较宽松,适应性强 检验方法灵活,用途更广泛 非参数检验计算相对简单,易于理解 缺点: 对总体分布的假定不多,方法缺乏针对性,其功效不及参数检验 利用等级、符号、秩检验,失去许多信息,有效性较差6, 8.2 符号检验,单样本的符号检验步骤 设立假设 将样本各个数据减去原假设的中位数并记录正负号 给定显著性水平a并查表得到临界值 检验判断即接受或拒绝原假设,7,单样本的符号检验(例),例:从入伍的新兵中,随机抽取20名,测量其身高数据如下(公分) 172, 168, 165, 176,167, 173, 157, 158, 174, 170,169, 155, 178, 171, 165, 170, 176, 182, 168, 175, 给定显著性水平a0.1,用符号检验判定新兵总体的身高中位数是否与165公分有显著差异。
8,单样本的符号检验(例),解:(1)设立假设 (2)将样本各个数据减去原假设成立时的假定中位数165公分,并把正负号记录下来其中相减等于0者略去不计结果有: +++++--+++ -+++++++ n+=15, n-=3, n=( n+)+( n-)=15+3=18,9,单样本的符号检验(例),(3)给定显著性水平a=0.1,是双侧检验,每侧为a/2=0.05,查二项分布临界值表当n=18时临界值为13 (4)检验判断由于n+1513,落入拒绝区域,所以拒绝原假设,接受备择假设,即认为新兵总体身高中位数Me165 CM,10,配对样本的符号检验,原 理 设n1=n2且选自不同总体,将两个样本的数据一一配对,得系列配对值求n1-n2的差值 ,并记录其差数的符号(+)或(一)的个数若两样本所选自的总体不存在显著的差异,则n+与n-出现的概率应该一致,各为0.5,反之则认为两个总体存在本质的差异11,配对样本的符号检验(例),例1:某工厂为比较日班生产与夜班生产的效率是否有显著差异,随机抽取两星期进行观察,各日产量比较如下表 试在0.05显著性水平下,判断日、夜班生产是否存在显著性的差异。
12,配对样本的符号检验(例1),13,配对样本的符号检验(例1),解:从上表可知n+=9,n-=4,n=( n+)+( n-)=9+4=13 (1)设立假设 原假设 ,说明日夜班生产不存在显著性差异 备择假设 ,说明日夜班生产存在显著性差异 (2)显著性水平a0.05,双侧检验,a/2=0.025, n=13 查二项分布临界值表得临值为11 (3)检验判断由于n+<临界值,即911,所以不能拒绝原假设,即认为日、夜班生产没有显著性的差异14,配对样本的符号检验,例2:公司开发部门举办一次特别调查以检验市场上甲、乙两种啤酒哪种更受欢迎邀请70位消费者品尝评价味道好坏,结果有38位消费者认为甲啤酒好(记+号),有26位消费者认为乙啤酒好(记-号),其余6位则信为两种啤酒不相上下试按显著性水平a=0.05,判断两种啤酒是否有显著差异15,配对样本的符号检验(例),解: n+=38, n-=26, n=38+26=64. 大样本检验,用正态分布逼近 (1)设立假设 H0:P0.5,表示两种啤酒无差别 H1:P0.5 表示有显著差别 (2)给定显著性水平a0.05,查正态分布表F(Z) Z0.0251.96。
16,配对样本的符号检验(例),()根据样本信息,有,17,配对样本的符号检验(例),(4)由于Z 如果总体1分布于总体2的右边,即,如果总体1分布于总体2的左边,即,T将靠近它的最小可能值T可以作为秩和检验的统计量,当T的实际值超过临界值就拒绝两总体没有显著差异的原假设21,确定临界值,T的分布与n1、n2大小有关秩和检验中临界值的确定有两种方法 若n1、n2均未超过10,查秩和检验临界值表来确定临值的上下限 若如果n1、n2都超过10,此时随机变量T近似服从正态分布,其平均数和标准差,22,确定临界值的基本方法,在这种情况下,可将T标准化为Z统计量,通过查正态概率分布表来确定临界值,23,秩和检验(例),为了比较两种不同规格的灯丝制造的灯泡使用寿命,分别从两批灯泡中独立随机地各抽若干个灯泡进行寿命试验测得数据 (小时)如下: 甲:1420,1453,1425,1470,1465,1480 乙:1425,1445,1410,1415,1420 试在显著性水平a0.05下,判断两种灯泡使用寿命是否显著差异24,秩和检验(例),解:(1)设立假设 原假设 表示两种灯泡使用寿命没有差异 备择假设 用意相反 (2)将样本混合按顺序排列并计算秩和,25,秩和检验(例),秩号:1 2 3.5 3.5 5.55.57891011 数据:141014151420 14201425 142514451450146514701480 数据下加横线的为乙种灯泡。 由于乙种灯泡样本容量少于甲种灯泡样本容量,所以指定乙种灯泡来自总体1(n15),甲种灯泡来自总体2,(n26)乙种灯泡的秩和T1+2+3.5+5.5+719,26,秩和检验(例),(3)给定a0.05下查秩和检验临界值表,双侧检验,且n1=5,n2=6,查表得临界值T1(0.05)20,T2(0.05)40 (4)检验判断由于TT1(0.05)即1920,落入拒绝区域,所以拒绝原假设,而认为两种规格灯丝的灯泡寿命的分布是不同的27,秩和检验(例),经理要比较A牌号和B牌号两种汽油的性能 选用同类型汽车各30辆,试开一星期,一队用A 牌汽油,另一队用B牌号汽油,记录下每辆汽车 每加仑行驶的平均里程,数据如下(公里/加仑) 试按显著性水平a0.05,判断两种汽油的 公里/加仑指标有无明显差别28,秩和检验(例),29,秩和检验(例),(1)设立假设原假设H0:MAMB 牌号汽油指标没有差异 备择假设H0:MAMB 用意相反 (2)计算秩和T n=n1+n2=30+30=60, n1=n2任取B为样本1,则 T1+3+3+6.5+6.5+13+13+13+17.5+17.5+17.5+22.5+22.5 +22.5+22.5+29+29+29+37+37+37+37+37+44+44+49.5 +52.5+52.5+55+55826,30,秩和检验(例),(3)给定显著性水平a0.05,由于是大样本双侧检验,查正态概率分布表,临界值Z0.0251.96。 (4)计算检验统计量,各项指标值 31,秩和检验(例),32,秩和检验(例),(5)检验判断由于ZZ0.025即1.3161.96,所以接受原假设H0,即认为两种牌号汽油的性能不存在显著的差异33,8.4 游程检验,原理 根据混合样本中两样本交替出现的次数来检验秩交替次数是随机的零假设若样本来自同一总体,样本1和样本2的秩差距不应过大34,游程检验的步骤,1、从两个未知的相互独立的总体中分别抽取样本n1、样本n2 2、两样本混合并由小到大排序,序号为其秩 3、点算游程数目 4、根据显著水平确定否定区域,游程数目r的抽样分布可用于建立否定域 5、检验零假设以混合样本中的游程数目r为统计量:游程数目越大,样本混合得越好,不能否定零假设;反之,游程数目小,否定假设35,游程检验(例),在环境质量评比中,随机抽取19所大专院校 按环境质量好坏排序,10所本科和9所专科,排 序情况如下: 本科名次(秩):1、2、4、5、6、7、9、11、14、17 专科名次(秩):3、8、10、12、13、15、16、18、19 在显著水平=0.05下进行游程检验,评价两类院 校在环境质量上是否有明显差异。 36,游程检验(例),解:排序点游程 1、2、3、4、5、6、7、8、9、10、 11、12、13、14、15、16、17、18、19 检验统计量 r=12,由=0.05 查表得临界值 r (n1、n2)= r 0.05 (10、9)=6<12 不能否定零假设即说明在0.05的显著水平上,不能说专科类学校和本科类学校在校园环境质量上有明显差异。












