好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

非参数统计学讲义(第三章)两样本模型.doc

11页
  • 卖家[上传人]:夏**
  • 文档编号:390439479
  • 上传时间:2022-09-06
  • 文档格式:DOC
  • 文档大小:443KB
  • / 11 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 非参数统计学讲义主讲:统计系 袁靖第三章 两样本模型§1 两个相关样本的非参数检验一、 问题的提出某种统计检验方法应用时,不仅与数据的测量层次有关,与抽样的特点有关在抽取样本时有两种形式:相关的和独立的苦第—次抽样的所有样本某一属性的测量结果,不影响第二次抽样的所有样本同一属性的测量结果,则这种抽样是独立的;若一次抽样的测量结果影响另一次抽样测量结果,则这种抽样是相关的本章介绍两个相关样本的非参数检验方法实际问题中,常会有这样的情况:某种药物对治疗某种疾病是否有效,某种训练方法是否能提高人的能力,某次宣传是否能提高人们的认识,价格上涨是否会产生不良影响等等当研究者希望知道两种处理结果是否相同,或哪种更好时,往往需要采用两个样本的统计检验这时,常用经过处理的一组和未经处理的一组比较,或者一种处理组与另一种处理组相比较,为了避免或尽量减少由于其它因素影引起的两组之间的附加差异,研究中通常采用两个相关样本例如,在接受两种不同训练方法的人员中,由于智力、接受能力、耐力等方面的不同,会导致不同处理的结果产生差异,这不是所要研究的问题,而是其它因素影响产生的附加差异这些因素在实施不同处理前必须排除。

      为获取相关样本,常应用两种方式:一是让每一研究对象作为自身的对照者;一是将研究对象两两配对,分别给每一对两个成员以不同处理在进行配对时,应让每—对在可能影响处理结果的其它因素分面尽量相似,以尽量避免和减小附加差异一般来说,用研究对象自身作为对照者要优于配对方法因为很难在配对过程中,完全控制使其它的影响因素二、 符号检验1.基本方法设有两个连续总体X、Y,累积的分布函狡分别为F(x),F(y)随机地分别从两个总体中抽取数目为n的样本数据和,将它们配对得到,,…,若研究的问题是它们是否具有相同的分布,即F(x)=F(y)是否成立因而可以采用位置参数进行判断若两个样本的总体具有相同分布,则中位数应相同,即在n个数对中,大于的个数与小于的个数应相差不多若P表示概率,则建立的假设组为如果关心的是某一总体中位数是否大于另一总体中位数,则可建立单侧备挥,假设组为 在下,有大于的趋向,在下,有大于的趋向为对假设作出判定,所需的数据至少是定序尺度测量与单样本的符号检验相同,两个相关样本的符号检验也定义、为检验统计量为与差值符号是正的数目,为差值符号是负的数目,若H0为真,大于的配对数目与小于的配对数目相等,也就是与的数值相等。

      由于、的抽样分布是二项分布B(n,1/2),n是配对数目,1/2是各自出现的概率,因而合适的P值能够在二项分布表中查找到当样本的观察数据时,可以利用上面方法找到P值作出判定若样本的观察数据n>20,可以用正态近似办法,根据(2—1)式计算Z值,查正态分布表得到相应的P值 (0.1)2.应用【例3-1】教学参考资料对于指导学生自学是否有效为帮助学生通过自学提高对知识的掌握,编辑了符合教学大纲的教学参考资料针对某一概念的掌握进行实验,随机选取了15名学生,他们在使用参考资料之前的得分如表3—l学习参考资料后,重新对这一概念进行测试,得分也列在表3一l中检验这部资料是否促进学生掌握知识表3-1 学生两次测试成绩学生编号123456789101112131415第一次成绩222233333323323第二次成绩342323442443444分析:由于关心的是学生使用参考资料后是否对概念的掌握更好了,因此应建立单侧备择,假设组为为一次检查的成绩,为第二次测试的成绩由表3一l的分数可知,=2,=10,有3对差值为0,无法记“十”或“一”号,因此,符号总数目n=十=12,而不是l5。

      在附表中查找,n=12,=10的右尾概率P=0.0193,对于显著性水平显然P值够小,因而数据不支持H即学生通过自学参考资料对提高知识有益,表明教学参考资料对促进学生掌握知识是有效的例3-2】母亲是否比父亲更强烈地认识到父亲教育孩书在研究父亲对儿童发展的影响作用时,进行了一项调查随机抽选17对夫妇,其家庭均因两地分居,在孩子出生时,由母亲一人抚养,一年后团聚针对父亲的教育对孩子影响较大这一问题询问,结果如表3—2表中是对父、母态度的评分,5分代表最强烈的认识,1分相对最弱,是父亲的态度,是母亲的态度表3-2 父母对父亲教育孩子重要性的认识编号编号编号12473513542348331425335921155543510351635533112517156321225分析:这是一个配对样本的例子 配对样本位置的符号检验,在第二章中已介绍,实际上那也是两个相关样本的情况例3.1是将研究对象自身作为对照者,形成两个相关样本此例中是采用夫妇配对,讨论同一孩子和同一家庭的情况,因而配对有意义,符合符号检验的条件由于关心的是母亲比父亲更强烈地认识到父亲教育孩于重要,因此是单侧检验,建立的假设组为因为预言母亲比父亲的感受更强烈,因而评分应是母亲比父亲更高,故- <0的数目应较多,备择假设选择了。

      由表3—2可知,其中3对夫妇的态度一样,分数相等,差值为0,不记符号,因此,n=14,=3,=11查附表,得=11右尾概率P=0.0287对于显著性水平=0.05,P值足够小因此,数据不支持H调查结果表明,母亲确实比父亲更强烈地感到父亲教育孩子很重要三、 Wilcoxon符号秩检验1.基本方法两个相关样本的Wilcoxon符号秩检验也是用来检验配对本是否有差异的方法它不仅借助于两个样本差值的符号,而且利用了差值的大小,因此,它比符号检验有更精确的判断设X、Y是两个连续总体,且均具有对称的分布,随机地分别从两个总体中抽取n个观察值,组成n个数对,,…,记,若X与Y具有相同的分布,则等式成立,即大于的概率与小于的概率相等这也意味着全部差值的中位数等于零因此,零假设也可以是这与第二章中配对样本的符号秩检验是一致的,当研究的问题关心两个总体的分布是否相同,或说两个总体中位数是否相同时采用双侧备择;若X、Y之间的相互关系中,存在某种趋势,则应立单侧备择如果认为的大多数值大于相应的值,那么单侧备择为或如果认为的大多数值大于相应的值,那么单侧备择为或若将差值的总体中位数记作MD,那么,两个相关样本的Wilcoxon符号秩检验与第二章中配对样本位置的符号秩检验基本方法相同,判定假设是否成立的原则也一样。

      2.应用【例3-3】幼儿园的生活对孩子的社会知识是否有影响有人认为儿童上幼儿园有助于其认识社会,有人则认为儿童在家一样可以获得社会知识为了解它们是否存在差异,对8个同性孪生儿童进行实验,随机指定8对中一个上幼儿园,另一个则在家经过一个时期后,通过对他们询问,给他们分别作出评价评分结果如表3—3表3-3 父母对父亲教育孩子重要性的认识配对号上幼儿园儿童在家儿童配对号上幼儿园儿童在家儿童1786257680270586727336763785824817788378分析:虽然可以相信得分多的孩子比得分少的孩子社会知识要多,但由于是定距尺度测量,无绝对零值,因此不能认为得80分的孩子社会知识是得40分的孩子的2倍,也不能认为80分与60分的社会知识之差一定是60分与50分之差的2倍但是,可以肯定,80分与60分所代表的社会知识之差一定大于60分与50分之间的差所以将分数差值的绝对值排序是有意义的,这样就有可能运用Wilcoxon符号秩检验判定在家和上幼儿园对孩子的社会知识是否有影响由于只关心两组儿童的社会知识是否有差异因此应建立双侧备择假设组为用文字表述为:原假设为在家和上幼儿园的儿童社会知识没有差异,备择假设为两组儿童的社会知识有差异。

      根据表3—3的数据计算及、,计算过程如表3—4表3-4 检验统计量计算表xyD=x-y的秩D的符号786216168+705812127+6763444.5+8177444.5+7678-222-7273-111-8582333+8378556+由表可知根据n=8,与中较大者=33,在附表中查找相应的P值,得到其右尾概率P=0.0195,这一概率的2倍为0.04,对于显著性水平=0.05,P值显然较小,故调查结果不支持H这表明在5%的显著性水平上,拒绝零假设,在家和上幼儿园对儿童的社会知识有影响从计算结果看出,“十”号大大多于“一”号,表明上幼儿园的儿童社会知识成绩普遍高于在家的儿童§2 Brown-Wood中位数检验一、 列联表主要目的:检验变量之间是否独立,它所讨论的主要是定性资料例3-4】吸烟与肺癌之间的关系这里用变量A表示一个人是否患肺癌,用B表示一个人是否吸烟,调查结果如下:表3-4 吸烟与肺癌关系统计表BA吸烟不吸烟患肺癌603未患肺癌3211问:吸烟是否与肺癌有关?这即是1张2×2列联表,表中考察两个定性变量A和B,每个变量有两类,表中间的数值是频数,一般的2×2列联表形式如下 可以推广到更高阶的列联表。

      表3-5 2×2列联表BA实践中,可以将考察A和B的关联性 关联性是线性相关的推广独立不关联,不关联独立;独立不相关,不相关不能独立问题转化为检验A与B是否独立,检验和判断的方法很多,这里介绍一种常用的Pearson拟合优度检验对2×2列联表,检验A与B是否独立,等价于检验其中表示()的概率,和是相应的边缘概率当独立性成立时,理论频数为,其中;实际频数为:作统计量:该统计量反映了实际频与理论频数的偏差,偏差越大,对H0越不利在例子中,可以计算出拒绝H0,即说明吸烟与肺癌不独立,而是存在关联的二、 Brown-Mood中位数检验【例3-5】沿海地区和非沿海地区的人均GDP的中位数是否一样我国沿海和非沿海省市区的人均国内生产总值(GDP)的1997年抽样数据如下(单位为元)沿海省市区为,而沿海省市区为,数据如下:表3-5 检验统计量计算表Y150441227053457730222758447945581366834951340815500X516342204259646838813715403251224130376320933715273233132901374837315167试问:两个。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.