
《管理统计学》课件—09非参数检验.ppt
28页第九章 非参数检验案例导入案例导入 环境保护是“可持续发展”的题中之意,而居民排污问题一直是环境保护重点关注的问题某市的建筑规格要求居民区所用污水管破坏强度的中位数大于每线英尺2500磅一名想向该市供应污水管的制造商对此项目投了标,并提供了补充信息:有一位独立的承包商从这位制造商那里随机抽选了七节污水管,并检验了每节管子的破坏程度结果(磅/线英尺)列于表9-1那么在总体分布未知,且样本量极小的情形下,如何对假设H0(该制造商提供的污水管符合所要求的规格)做出统计推断?2610275024202510254024902680表9.1 污水管破坏强度检查表学习目标学习目标 本章要求掌握非参检验的应用范围、基本思想以及检验步骤重点掌握两总体比较的非参检验方法9.1 非参数检验的概述非参数检验的概述 非非参检验是相对于参数检验而存在的参检验是相对于参数检验而存在的参数检验是在已知总体分布的条件下(一般要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验,有时还要求某些总体参数满足一定条件如独立样本的T检验和方差检验不仅要求总体符合正态分布,还要求总体方差齐性 对于不服从正态分布的数据,存在很多非参数分析方法。
非参数检验不依赖被抽样总体的分布,因而称为与分布无关的检验9.1 非参数检验的概述非参数检验的概述 非参数检验方法简便,不依赖于总体分布的具体形式因而适用性强,但灵敏度和精确度不如参数检验一般而言,非参数检验适用于以下三种情况:(1)顺序类型的数据资料,这类数据的分布形态一般是未知的;(2)虽然是连续数据,但总体分布形态未知或者非正态,这和卡方检验一样,称为自由分布检验;(3)总体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下(虽然T检验被称为小样本统计方法,但样本容量太小时,代表性毕竟很差,最好不要用要求严格的参数检验法)因为这些特点加上非参检验法一般原理和计算比较简便,因此常用于一些为正式研究进行探路的预备性研究中 当然,由于非参数检验许多牵涉不到参数计算,对数据中的信息利用不够,因而其统计检验力相对于参数检验也差得多9.1 非参数检验的概述非参数检验的概述单个总体的非参数检验法位置检验:分布函数检验符号检验法拟合优度 检验法拟合优度k-s检验法两个总体的非参数检验法两个配对样本的检验两个独立样本的检验符号检验法符号等级检验法秩和检验法中数检验法图9.2 非参数检验的分类框架 前面所学到的参数检验法在非参数检验法中都能找到替代的方法,因此按照和参数检验法相对应的原则可对非参数检验法进行如下分类:9.2单个总体的非参数检验单个总体的非参数检验 9.2.1单个总体的位置检验单个总体的位置检验 由第八章可知,估计总体均值或检验关于总体均值的假设的小样本方法,都要求总体服从某个近似的正态分布。
因此,在非正态总体收集一个小样本的情况下,t检验就失效,必须求助于某种非参数方法适用于此种情形的最简单的非参数方法是正负号检验法(又称符号检验法)这是一种专为检验关于任意连续分布的中位数的假设而设计的方法同平均值一样,中位数是分布中心和分布位置的度量,所以正负号检验有时亦称位置检验9.2单个总体的非参数检验单个总体的非参数检验 9.2.1单个总体的位置检验单个总体的位置检验 例9-1 考虑一个中位数未知的总体,并假定需要检验零假设H0:=100对单尾替代假设H1:100所谓的中位数,是指使总体左右两侧概率分布面积相等的数因此从总体选出大于的 的概率为0.5,即 要是零假设事实上为真,那么可以预期将会观察到差不多有一半样本 值大于 正负号检验所用的检验统计量为S:S=超过100的样本观察值数试求本检验的零假设是否成立9.2单个总体的非参数检验单个总体的非参数检验 9.2.1单个总体的位置检验单个总体的位置检验 解:S只依赖于每个样本值 与100之差的正负号也就是说,我们只需数一数样本差( -100)中有几个正号就行了令每一个样本差( -100)代表由n次相同试验组成的实验中一次试验的结果。
如果称正的差值为“成功”,负的差值为“失败”,则S便是n次试验的成功数在H0之下,观察到任意一次试验为成功的概率为 由于各次试验都是独立的,满足二项实验的性质于是S服从参数n和 =0.5的二项分布,进而计算值,最后根据值与显著性水平的关系,判断H0是否成立9.2单个总体的非参数检验单个总体的非参数检验 9.2.1单个总体的位置检验单个总体的位置检验一般而言,单个总体中位数的正负号检验需要经历以下三个步骤首先,提出零假设和备择假设:H0:=0 H1:0(或H1:0)其次,计算检验统计量S:S=大于0的样本观察值数(或S=小于0的样本观察值数)最后,根据显著性水平,判断是否拒绝原假设H0其判断分小样本和大样本两种情形9.2单个总体的非参数检验单个总体的非参数检验 9.2.1单个总体的位置检验单个总体的位置检验(1)在小样本的情形下(n10)计算值: (9-1)此处 服从参数为n和 的二项分布当值时,则拒绝H02)在大样本的情形下(n10)计算z值: (9-2)当 时,拒绝H0(注:本章所采取的都是单侧检验下的判断准侧)9.2单个总体的非参数检验单个总体的非参数检验 9.2.2单个总体的分布函数检验单个总体的分布函数检验9.2.2.1拟合优度拟合优度 检验检验法法 假设(猜测)总体的概率密度函数为 (若总体为离散型,则假设总体的概率密度为 ),那么用一组样本 , , 如何来检验假设是否成立。
一般而言,要经历以下四个步骤首先,提出零假设和备择假设:H0:总体的累积概率分布函数为 H1:总体的累积概率分布函数不是 其次,在数轴上选取k-1个分点t1,t2,,tk-1将数轴分为k个区间(不必等区间): , , 9.2单个总体的非参数检验单个总体的非参数检验 9.2.2单个总体的分布函数检验单个总体的分布函数检验9.2.2.1拟合优度拟合优度 检验检验法法记 为总体在第 个区间上的概率值,则有 记 为样本 , , 中,落在区间 中的个数(或频数) ,那么,频率 (n至少为50,最好100以上)与概率 之差应当很小,否则就应该拒绝假设H09.2单个总体的非参数检验单个总体的非参数检验 9.2.2单个总体的分布函数检验单个总体的分布函数检验9.2.2.1拟合优度拟合优度 检验检验 可以证明(K. Pearson),在H0成立的条件下,统计量 (9-3)服从 分布,其中 是总体中未知参数的个数再次,对于给定的显著性水平 ,可由 分布表,查出临界值 最后,比较统计量 与临界值 的大小,若 则拒绝H09.2单个总体的非参数检验单个总体的非参数检验 9.2.2单个总体的分布函数检验单个总体的分布函数检验9.2.2.2 k-s检验法检验法 k-s检验法是柯尔摩格罗夫(Kolmogorov)-斯米尔诺夫(Smirnov)检验法的简称。
k-s检验法的基本思路如下所示: (1)把不重复的样本观察值从小到大排列,依据不重复的样本观察值的频率,建立一个样本累积频率函数 (2)对于任何确定的 ,定义 统计量: (9-4)9.2单个总体的非参数检验单个总体的非参数检验 9.2.2单个总体的分布函数检验单个总体的分布函数检验9.2.2.2 k-s检验法检验法 (3)对于任何确定的 ,统计量 的 (累积)概率分布函数为 ,记为 对于计算出来的统计量 的值 ,若 ,则接受H0;若 ,则拒绝H09.3两个总体两个总体的非参数检验的非参数检验 9.3.1 两个配对样本的检验两个配对样本的检验9.3.1.1符号检验法符号检验法 符号检验法是通过对两个配对样本的每对数据之差的符号(正号或负号)进行检验,以比较这两个样本所代表的总体的差异显著性,对应于参数检验中两相关样本差异显著性的T检验其基本思想是:若两总体差异不显著,则两样本差值的正号与负号应大致各占一半,即中位数为0符号检验法一般要经历以下三个步骤首先,提出零假设和备择假设H0:差值的总体中位数为0 H1:差值的总体中位数不为09.3两个总体两个总体的非参数检验的非参数检验 9.3.1 两个配对样本的检验两个配对样本的检验9.3.1.1符号检验法符号检验法其次,标记出每对数据之差的符号,正号个数记为 ,负号的个数记为 ,差值为0的不计算在内,并记 , 。
最后,分小样本和大样本两种情况进行检验1)当为小样本的情形下(N25时)计算值: (9-5)此处 服从参数为N和 的二项分布当值25时)计算z统计量: (9-6)若 ,则拒绝H0,否则,接受H0(注:本章所采取的都是单侧检验下的判断准侧)9.3两个总体两个总体的非参数检验的非参数检验 9.3.1 两个配对样本的检验两个配对样本的检验9.3.1.2符号等级检验法符号等级检验法 符号等级检验法(Wilcoxon Signed-Rank test)是由维尔克松提出的,有时也简称维尔克松检验法(Wilcoxon test)其适用条件与符号检验法相同,也适合于配对样本,但它的精度比符号检验法高,因为它不仅考虑差值的符号同时还考虑差值的大小符号等级检验法一般要经历以下五个步骤首先,提出零假设和备择假设H0:差值的总体分布对称且中位数为0 H1:差值的总体分布不对称,或中位数不为0其次,将两配对样本数据之差按绝对值由小到大排列,若差值为0,则不参与排序再次,在各等级前添上差值的符号9.3两个总体两个总体的非参数检验的非参数检验 9.3.1 两个配对样本的检验两个配对样本的检验9.3.1.2符号等级检验法符号等级检验法然后,记带正号的等级和为 ,记带负号的等级和为 ,并记 , 。
最后,分小样本和大样本两种情况进行检验1)当为小样本的情形下(N25时)根据N查“维尔克森配对差等级和检验临界值表”,得到 若 ,则拒绝H0,否则接受H02)当为大样本的情形下(N25时) 计算z统计量: (9-7)若 ,则拒绝H0,否则,接受H0(注:本章所采取的都是单侧检验下的判断准侧)9.3 两个总体的非参数检验两个总体的非参数检验 9.3.2两个独立总体的非参数检验两个独立总体的非参数检验 9.3.2.1秩和检验法秩和检验法 秩和(the sum of ranks)即秩次的和或者等级之和这一方法首先由维尔克松(wilcoxon)提出,叫维尔克松两样本检验法,后来曼(Mann)与惠特尼(Whitney)二人将其应用到两样本容量不等的情况,因而又称作曼-惠特尼-维尔克松秩和检验,或称曼-惠特尼U检验 秩就是变量值排序的名次可以将数据升序(或降序)排列,每个变量值都会有一个在整个变量值序列中的位置或名次,这个位置或名次就是变量值的秩变量值有几个,对应的秩就有几个 秩和检验法相当于考验两个独立样本平均数之差异t检验法当两个独立样本不符合t检验法的基本假设其总体分布不是正态时,就要用秩和检验法代替t检验法的基本假设。
秩和检验法要经历以下五个步骤9.3 两个总体的非参数检验两个总体的非参数检验 9.3.2两个独立总体的非参数检验两个独立总体的非参数检验 9.3.2.1秩和检验法秩和检验法首先,提出零假设和备择假设H0:两总体分布相同 H1:两总体分布不同其次,将两本数据混合,有小到大排序(相同数据占平均等级)再次,取容量小的样本中各数据的等级相加,记为 最后,分小样本和大样本两种情形进行检验(两样本的容量分别记为 , )1)当为小样本的情形下( 10, 10)根据 , 以及 查“维尔克森等级和检验的临界值”表,得到 和 ,当 时,接受原假设,否则拒绝原假设9.3 两个总体的非参数检验两个总体的非参数检验 9.3.2两个独立总体的非参数检验两个独立总体的非参数检验 9.3.2.1秩和检验法秩和检验法(2)当为大样本的情形下( 10, 10)计算z统计量: (9-8)若 ,则拒绝H0,否则,接受H0(注:本章所采取的都是单侧检验下的判断准侧)。
