
单样本随机性检验.ppt
29页SPSS 16实用教程实用教程第第1010章章 非参数检验非参数检验10.3 SPSS单样本变量值随机性检验统计学上的定义和计算公式统计学上的定义和计算公式定义:单样本变量值的随机性检验定义:单样本变量值的随机性检验是对某变量的取值出现是否随机进是对某变量的取值出现是否随机进行检验,也称为游程检验〔行检验,也称为游程检验〔RunRun过程过程〕游程检验亦称连贯检验或串检验,是一种随游程检验亦称连贯检验或串检验,是一种随机性检验方法,应用范围很广机性检验方法,应用范围很广例如:奖劵的购置是否随机,期货价格的变例如:奖劵的购置是否随机,期货价格的变换是否随机,一个机械流程中产品误差的出换是否随机,一个机械流程中产品误差的出现是否存在规律等等假设事件的发生并非现是否存在规律等等假设事件的发生并非随机,而是有规律可循,那么可作出相应的随机,而是有规律可循,那么可作出相应的对策根本概念根本概念游程:在一个二元游程:在一个二元0-10-1序列里,一个由序列里,一个由0 0或或1 1连续构成的串连续构成的串游程长度:一个游程里数据的个数游程长度:一个游程里数据的个数一个序列里游程个数用一个序列里游程个数用R R表示。
表示例如下面的一个例如下面的一个0 0--1 1序列:序列: 1 1 0 0 0 0 1 1 1 0 1 1 0 0 0 0 1 1 0 0 0 0 1 1 1 0 1 1 0 0 0 0 1 1 1 1 0 01 1 1 1 0 0共共2222个数,个数,0 0的个数为的个数为1111,,1 1的个数为的个数为1111,,共共8 8个游程,个游程,4 4个个0 0游程,游程,4 4个个1 1游程 设某样本 设某样本 设某样本 设某样本n=12n=12n=12n=12人的标志表现为男、女,有以下三种排列人的标志表现为男、女,有以下三种排列人的标志表现为男、女,有以下三种排列人的标志表现为男、女,有以下三种排列 (i) (i) (i) (i) 男男男男\ \ \ \男,女男,女男,女男,女\ \ \ \女女女女\ \ \ \女,男,女女,男,女女,男,女女,男,女\ \ \ \女,男女,男女,男女,男\ \ \ \男男男男\ \ \ \男男男男\ \ \ \男男男男 (ii) (ii) (ii) (ii) 男男男男\ \ \ \男男男男\ \ \ \男男男男\ \ \ \男男男男\ \ \ \男男男男\ \ \ \男男男男\ \ \ \男,女男,女男,女男,女\ \ \ \女女女女\ \ \ \女女女女\ \ \ \女女女女\ \ \ \女女女女 (iii)(iii)(iii)(iii)男,女,男,女,男,女,男,女,男,女,男男,女,男,女,男,女,男,女,男,女,男男,女,男,女,男,女,男,女,男,女,男男,女,男,女,男,女,男,女,男,女,男\ \ \ \男男男男 连续出现男或女的区段称为游程。
连续出现男或女的区段称为游程 连续出现男或女的区段称为游程 连续出现男或女的区段称为游程 每个游程包含的个数为游程长度以 每个游程包含的个数为游程长度以 每个游程包含的个数为游程长度以 每个游程包含的个数为游程长度以r r r r表示序列中游程的个数:表示序列中游程的个数:表示序列中游程的个数:表示序列中游程的个数: (i)r=5,(i)r=5,(i)r=5,(i)r=5, (ii)r=2,(ii)r=2,(ii)r=2,(ii)r=2, (iii)r=11 (iii)r=11 (iii)r=11 (iii)r=11 可以看出,〔 可以看出,〔 可以看出,〔 可以看出,〔i i i i〕是随机性序列;〔〕是随机性序列;〔〕是随机性序列;〔〕是随机性序列;〔iiiiiiii〕〔〕〔〕〔〕〔iiiiiiiiiiii〕是非随机性序列,所以,可以用游程的个数来检〕是非随机性序列,所以,可以用游程的个数来检〕是非随机性序列,所以,可以用游程的个数来检〕是非随机性序列,所以,可以用游程的个数来检验样本的随机性,或总体的分布特征。
验样本的随机性,或总体的分布特征验样本的随机性,或总体的分布特征验样本的随机性,或总体的分布特征游程检验的根本思想:游程检验的根本思想: 固定样本量下,通过游程多固定样本量下,通过游程多少来判断少来判断具体而言:在固定样本量下,假设游具体而言:在固定样本量下,假设游程个数过少,那么说明程个数过少,那么说明0 0和和1 1比较集中,比较集中,序列存在成群的倾向;假设游程个数序列存在成群的倾向;假设游程个数过多,那么说明过多,那么说明0 0和和1 1交替频繁,周期交替频繁,周期特征明显,序列具有混合倾向特征明显,序列具有混合倾向假设检验假设检验 Mood Mood在在19401940年提出如下假设检验问题,年提出如下假设检验问题,设设X1, … , XnX1, … , Xn是一列由是一列由0 0或或1 1构成的序列,构成的序列, H0 H0:样本出现顺序随机:样本出现顺序随机 H1 H1:样本出:样本出现顺序不随机现顺序不随机 假设关心序列是否具有某种倾向,那么假设关心序列是否具有某种倾向,那么可建立单可建立单侧假设检验,侧假设检验,H0H0不变,不变,H1H1为序列具有混合为序列具有混合倾向倾向或或H1H1为序列具有成群倾向。
为序列具有成群倾向检验统计量检验统计量R R及其分布及其分布 取一个序列里的游程总数作为检验取一个序列里的游程总数作为检验统计统计量,记为量,记为R R 设样本总数为设样本总数为N N,其中,其中0 0的个数为的个数为m m个,个,1 1的的个数为个数为n n个,即个,即m+nm+n==N N在H0H0成立的条件成立的条件下,下,出现多少出现多少0 0和和1 1,出现多少游程都与概率,出现多少游程都与概率p p有关,有关,但在但在m m和和n n时,时,R R的条件分布就与的条件分布就与p p无关了 R R的条件分布〔课后思考〕的条件分布〔课后思考〕H0H0成立的条件下,成立的条件下,XiXi~~ b(N,p) b(N,p),那么,那么在有在有m m个个0 0和和n n个个1 1的条件下的条件下 , R , R的条件分的条件分布为布为 检验检验p p值 考虑双边假设检验,给定水平考虑双边假设检验,给定水平αα,设,设r r是由样本算出来的检验统计是由样本算出来的检验统计量的值,那么量的值,那么 p p值=值=2 min { P(R≥r), 2 min { P(R≥r), P(R≤ r) }P(R≤ r) }。
R R分布的进一步讨论分布的进一步讨论在零假设下,可以证明:在零假设下,可以证明:在零假设下,可以证明:在零假设下,可以证明:当样本量很大时,检验统计量当样本量很大时,检验统计量当样本量很大时,检验统计量当样本量很大时,检验统计量近似服从标准正态分布近似服从标准正态分布近似服从标准正态分布近似服从标准正态分布 于是有给定水平于是有给定水平α后,可以用近似公式得后,可以用近似公式得到拒绝域的到拒绝域的上下临界值上下临界值分别为为:分别为为:此临界值有表可查此临界值有表可查此临界值有表可查此临界值有表可查 在在SPSS单样本变量值的随机性检验中,单样本变量值的随机性检验中,SPSS将利用游程构造将利用游程构造Z统计量,并依据正态统计量,并依据正态分布表给出对应的相伴概率值如果相伴概分布表给出对应的相伴概率值如果相伴概率小于或等于用户的显著性水平率小于或等于用户的显著性水平α,那么应,那么应拒绝零假设拒绝零假设H0,认为样本值的出现不是随机,认为样本值的出现不是随机的;如果相伴概率值大于显著性水平,那么的;如果相伴概率值大于显著性水平,那么不能拒绝零假设不能拒绝零假设H0,认为变量值的出现是随,认为变量值的出现是随机的。
机的SPSS中实现过程中实现过程 研究问题研究问题 某村发生一种地方病,其住户沿某村发生一种地方病,其住户沿一条河排列,调查时对发病的住户一条河排列,调查时对发病的住户标记为标记为“1〞,对非发病的住户标记〞,对非发病的住户标记为为“0〞,共〞,共35户,其取值如表户,其取值如表10-3所所示表表表表10-310-33535名住名住名住名住户发户发户发户发病情况病情况病情况病情况住住住住 户户发发 病病病病 情情情情 况况况况住住住住 户户发发 病病病病 情情情情 况况况况住住住住 户户发发 病病病病 情情情情 况况况况1 11 113131 125251 12 20 014141 126261 13 31 115151 127270 04 41 116161 128281 15 51 117170 029290 06 61 118180 030300 07 70 019191 131311 18 80 020201 132320 09 90 021210 033330 010100 022220 034340 011111 123231 135350 012121 124241 1 实现步骤实现步骤图图图图10-9 10-9 在菜在菜在菜在菜单单单单中中中中选择选择选择选择“Runs“Runs〞命令〞命令〞命令〞命令找到找到Analyze / Nonparametric Tests / Runs 选项选项图图图图10-10 “Runs Test10-10 “Runs Test〞〞〞〞对话对话对话对话框框框框在检测变量在检测变量栏〔栏〔Test Variable List〕中添〕中添加要检测的加要检测的变量变量设置数据二设置数据二分法的分割分法的分割点。
小于此点小于此分割点的样分割点的样本数据为一本数据为一类,大于等类,大于等于此分割点于此分割点为另一类为另一类可设置中位可设置中位数、众数、数、众数、均值为分割均值为分割点值,也可点值,也可自定义分割自定义分割点数值Exact、、Options选选项实现的功项实现的功能与前面两能与前面两节完全一样节完全一样图图图图10-11 “Runs Test10-11 “Runs Test::::OptionsOptions〞〞〞〞对话对话对话对话框框框框10.3.3 结果和讨论结果和讨论0.181>0.05,在,在0.05水平下接受原水平下接受原假设,可认为病假设,可认为病患沿河成随机分患沿河成随机分布,无聚集性布,无聚集性例题例题1 1 假定我们掷假定我们掷23次硬币,得到结果如下:次硬币,得到结果如下: 0 0 0 0 0 0 0 1 1 1 1 1 1 0 0 0 0 1 1 1 1 0 0问这个试验是不是随机的?问这个试验是不是随机的? 作业!〔请用作业!〔请用SPSS实现书上研究问实现书上研究问题并解决例题题并解决例题1~4〕〕此例中,总试验次数为此例中,总试验次数为N==23,,0出现次数为出现次数为m==13,,1出现的次数为出现的次数为n==10。
如果称连在一起如果称连在一起的的0或或1为游程,那么上面这组数中有为游程,那么上面这组数中有3个个 0游游程,程,2个个1游程,共游程,共5个游程经计算,经计算,p值约为值约为0.002,所以在水平,所以在水平α>0.002时,拒绝原假设,即认为该数列不是随机的时,拒绝原假设,即认为该数列不是随机的注:一个可以两分的总体,如按性别区分的人注:一个可以两分的总体,如按性别区分的人群,按产品是否为次品区分的总体等,随机从群,按产品是否为次品区分的总体等,随机从中抽取一个样本,样本也可以分为两类:类型中抽取一个样本,样本也可以分为两类:类型 I 和类型和类型 II 假设凡属类型假设凡属类型 I 的,用的,用0表示;表示;凡属类型凡属类型 II的,用的,用1表示所以样本出现是否表示所以样本出现是否随机的问题,就转化为一个二元随机的问题,就转化为一个二元0--1序列出现序列出现的顺序是否随机的问题的顺序是否随机的问题 对于对于连续型数据连续型数据,我们也关心数据是否,我们也关心数据是否随机出现,这时可将连续的数据二元化,将随机出现,这时可将连续的数据二元化,将连续数据的随机性问题转化成为二元数据的连续数据的随机性问题转化成为二元数据的离散化问题。
离散化问题例题例题2 2 某品牌消毒液质检部要求每瓶消毒液的平均容某品牌消毒液质检部要求每瓶消毒液的平均容积为积为500ml,现从流水线上的某台装瓶机上随,现从流水线上的某台装瓶机上随机抽取机抽取20瓶,测得其容量如下所示瓶,测得其容量如下所示509,,505,,502,,501,,493,,498,,497,,502,,504,,506,,505,,504,,508,,498,,495,,496,,507,,506,,507,,508,,505 试检查这台机器装多装少是否随机?试检查这台机器装多装少是否随机? 假设检验问题假设检验问题 H0: 机器装多装少是随机的;机器装多装少是随机的; H1:机器装多装少不是随机的:机器装多装少不是随机的这里采用中位数法,计算样本中位数为这里采用中位数法,计算样本中位数为503,,令,那么相应的令,那么相应的Y样本为:样本为: 1,,1,,0,,0,,0,,0,,0,,0,,1,,1,,1,, 1,,1,,0,,0,,0,,1,,1,,1,,1,,1那么那么0的个数的个数m==9,,1的个数的个数n==12,,R==5。
对于对于α==0.05,查表得到对应的,查表得到对应的R为为6,而,而5<6,拒绝原假设,认为这台机器装多装少,拒绝原假设,认为这台机器装多装少并非随机〔运用精确检验〕并非随机〔运用精确检验〕 例例3 3有一批容器有一批容器,其重量有些差异连续抽查了其重量有些差异连续抽查了15个容器个容器,其重量分别为其重量分别为: 3.6 3.9 4.1 3.6 3.8 3.7 3.4 4.0 3.8 4.1 3.9 4.0 3.8 4.2 4.1问在问在0.05显著性水平下能否认为其重量的变显著性水平下能否认为其重量的变动是随机的动是随机的? 例例4 4为了考察学生的体育达标成绩,从两组为了考察学生的体育达标成绩,从两组学生中分别选取了学生中分别选取了1515和和1414名学生进行测名学生进行测试,测试成绩如下:试,测试成绩如下:甲组:甲组:67 67 70 70 73 74 78 81 83 84 67 67 70 70 73 74 78 81 83 84 84 87 87 97 97 84 87 87 97 97 乙组:乙组:63 66 71 74 74 75 76 77 77 78 63 66 71 74 74 75 76 77 77 78 79 82 86 87 79 82 86 87 运用游程检验的方法检验这两组学生的运用游程检验的方法检验这两组学生的体育成绩测试是否有显著差异?体育成绩测试是否有显著差异?解决思路:解决思路:如果两组成绩没有显著性差异,那么这两组如果两组成绩没有显著性差异,那么这两组学生的合在一起按成绩排序以后,学生的组学生的合在一起按成绩排序以后,学生的组别成随机排列。
别成随机排列于是问题转化为:按成绩排序后,对组别做于是问题转化为:按成绩排序后,对组别做随机性检验如果接受组别的随机性假设,随机性检验如果接受组别的随机性假设,也就等于认为两组学生的体育成绩无显著差也就等于认为两组学生的体育成绩无显著差异。












