好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

第十四章非参数检验 定类变量——定序变量 社会统计学内部课件很详细很全面绝对适合考研复习强力推荐.ppt

32页
  • 卖家[上传人]:cl****1
  • 文档编号:573524501
  • 上传时间:2024-08-15
  • 文档格式:PPT
  • 文档大小:291.50KB
  • / 32 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第十四章 非参数检验定类变量——定序变量 一、非参数检验一、非参数检验 定类—定序变量的研究,一要确认变量间存在关系,即检验问题二要确认变量间存在关系的条件下,讨论变量间关系的密切程度变量间关系的密切程度,反映了当知道个案所属的类别,能够预言所在等级的程度 定类—定序变量关系密切程度,即相关程度的讨论,一般采取与定类—定类相同的 系数法和 系数法 对于检验问题,采用的是非参数检验法,即这类方法的使用不需要对总体分布作任何事先的假定,例如正态分布同时从检验的内容来说,也不是检验总体分布的某些参数,如均值、方差等,而是检验总体某些有关的性质例如列联表的 经验,实际就是属于非参数检验,因为它检验的内容是有关总体变量间是否独立这一性质,而不是参数可以说非参数检验方法就是指“对分布类型已知总体、进行参数检验”之外,所有检验方法的总称 非参数检验方法,不仅适用于定类—定序变量的研究,定类—定类变量的列联表中的 检验以及定序—定序变量的等级相关,也属于非参数检验,此外,当样本很小,对于定距变量的总体,无法断言是否满足假定所要求的某种分布时,也可以使用非参数检验。

      非参数检验的优点是对总体分布无须加以限制,计算量也比较少,简单易行其缺点是检验的效率较差例如,如果相同的问题,当参数和非参数检验两种方法都能使用时,为了获得正确的结论,用非参数检验法一般要比相应的参数检验需要较大的样本 二、符号检验二、符号检验 符号检验法,要求对每一个观测单元(个案)做两次观测,形成配对样本配对样本如果观测数据虽然是定距变量,但不能满足正态分布时,也可以用符号检验法) 设观测单元i,其“前”观测值为 ,“后”观测值为 则n个观测单元所组成的二总体为非独立的,其值为:观测单元“前”(x)“后”(y)d=x-yd的符号12n 符号检验的方法只关心x-y是增大了还是减少了,即只研究差值d的符号 不妨设想如果从这样的总体中,进行无数次配对样本的抽样,则其符号将形成“+”和“-”两种情况的二项分布 如果“前”和“后”两个总体的分布是一样,那么,对于均值相同的总体,任抽一个观察单元,其差值d出现正号和负号的概率是相等的这样就构成了符号检验法的原假设 为: 备择假设分为单边和双边两种,单边检验,备择假设为:双边检验,备择假设为:符号检验,就是根据原假设 的总体,按二项分布计算出“+”或“-”数目的概率分布。

      然后看样本中出现“+”号数目或“-”数目如果它是总体 分布下的小概率事件,则否认“前”“后”具有相同分布的假设,即两总体存在平均水平的差别可见,符号检验就是利用二项分布进行检验的实际运用 符号检验的步骤:1.根据差值d=x-y,给出d的符号,若d=0,则略去不计2.计算“+”的总数 和“-”的总数 3.根据备择假设的不同,分以下三中情况讨论:(1)若备择假设为:计算设显著性水平为a,若 ,则接受原假设,若 ,则拒绝原假设,接受备择假设 (2)若备择假设为:计算设显著性水平为a,若 ,则接受原假设,若 ,则拒绝原假设,接受备择假设3)若备择假设为:则无论 或 ,只要有一个足够大就会导致对 的否定这时可用 或 较大的进行同时由于属双边检验,所得 或 应与a/2进行比较 例1.从总体中抽取了“前”和“后”两组数据,现在要研究“前”和“后”的变化是否显著。

      观测单元“前”(x)“后”(y)d=x-yd的符号1234567837725744436455654073594351676174-3-1-21-8-3-6-9---+----可以认为后比前的增加是显著的 可以做成符号检验的临界值表进行检验表中:不能拒绝男女有相同职业声望的假设 职业性别12345678910男女6363747177738580697675749290556168654340d的符号0+++-++-++ 当样本容量n>10时,可用正态分布近似二项分布例1: 符号检验法不仅适用于定类—定序变量的研究,而且还适用于不满足分布要求的定类—定距变量的研究 对于满足分部要求的定类—定距变量的检验也可以使用符号检验法,但这样会降低检验的效率当显著性水平降低,符号检验法就可能得出接受原假设的结论) 三、符号秩检验三、符号秩检验 符号检验法,只研究 的符号,但没有涉及其差值的大小,因此对资料的利用不够充分符号秩就是对符号检验法的改进为了把差值 的大小也考虑进去,可先将差值 的大小排队,然后按大小给予一个顺序号,称为秩,并赋予其差值的符号。

      如果原总体相同,那么不仅d出现的正负号的次数相等,而且序号也是均匀的,或者说正秩与负秩和相差甚远的可能性很小,根据这一点,可以对总体分布是否相同作出判断 符号检验和符号秩检验都只适用于配对样本 •可以根据符号秩检验表进行检验其步骤:•1.将 按从小到大次序排列(等于0的不列入),并给以顺序号,这个顺序号又称秩如果有两组或两组以上的差值,其绝对值相等,则将它们应得的秩均分之•2.根据 的符号,赋予它的秩“+”或“-”号•3.分别计算正秩和 和负秩和•4.比较 和•5.给出显著性水平a,查符号秩检验表,表中数值给出了T的临界值 •6.若 ,则拒绝原假设,认为总体间有显著差异 例6.以下是某厂引入竞争机制后,生产效率的比较,试用符号秩检验()车间前后d符号秩1234567847.647.244.145.947.742.933.641.756.946.454.856.758.649.850.358.4-9.30.8-10.7-10.8-10.9-6.9-16.7-16.7-3+1-4-5-6-2-7.5-7.5 引入竞争机制后生产率有变化,生产率是增加的。

      •当n>25时,T近似服从以下正态分布 四、秩和检验四、秩和检验 符号检验和符号秩检验都只适用于配对样本当样本为独独立样本立样本时,将采用秩和检验法步骤:1.设从两个未知总体中分别独立、随机抽取一个样本样本1 ;样本2 ;2.把样本1和样本2混合起来:并按数值从小到大顺序编号,每个数据的编号就是它的秩如果混合样本中有i个秩求平均,作为i个具有相同数值的秩3.计算样本1中所有x的秩和记作T4.如果两个总体具有相同分布的话,那么混合样本中,来自总体1的秩和T,其值很大或很小的可能都是很小的根据这个原则,附表列出 一定条件下,T的上限临界值 和下限临界值 5.根据样本计算的T值,若 或 则拒绝两总体具有分布相同的假设 例7.为了比较工厂规模与信息传递之间的关系,以下是9个工厂的抽样结果当 情况下,可以利用正态分布做近似检验,可以证明T的均值与方差分别为:大厂(秩)1113 10 1612(3) (4) (2) (6)小厂(秩)1717 8 17 1418[8] [8] [1] [8] [5]不能拒绝工厂规模与信息传度无差异的假设。

      需要注意的是,非参数检验判断为无显著差异的情况并不表示总体一定不存在差异,因为非参数检验效率不高;但如果非参数检验已经能确认其存在显著性差异的话,就没有必要再用其他的检验方法了 五、游程检验五、游程检验 对于独立样本还可以使用游程检验思路:如果把两个样本混合起来,按大小排列并赋予秩,那么当样本所属的总体是同分布的话,是不大可能出现来自总体1的样本全是高秩,来自总体2的样本全是低秩的情况,反之亦然可能性最多的情况是:来自总体1和总体2的样本,其秩是交错的,根据其交错的次数来判断总体分布是否一致的方法,就是游程检验其步骤:1.设从两个未知的总体1和总体2中分别独立、随机地抽取样本; ;2.把样本1和样本2混合起来,并按数值从小到大顺序编号,每个数据的编号就是它的秩3.如果秩来自总体1,则在秩的下端写0,如果来自总体2,则在秩的下端写1. 例9:以下是两地对某职业声望的抽样调查甲地 9 22 64 34 17 4 31 28 (n1=8) 乙地 58 53 26 11 52 51 8 (n2=7)混合排序来自总体4 8 9 11 17 22 26 28 31 34 51 52 53 58 640 1 0 1 0 0 1 0 0 0 1 1 1 1 0从图中看,y=0的直线上,共有5个线段,即0游程共有5个,y=1的直线上,共有4个线段,即1游程共有4个。

      4.游程总数为r,r=4+5=9r是统计量,其最小值为2,表示来自总体1和总体2的数据都各偏一方,每个总体只有一个游程但在原假设认为总体1和总体2分布相同的情况下,出现r=2或者,虽然不等于2 但也偏小的可能性是很小的,因此根据概率 ,当 时,则拒绝总体分布相同的原假设C值见附表)例9所以不能否定甲、乙两地具有相同职业声望的假设以上讨论适用于 都小于20的情况,当 时,对于总体同分布的情况,游程数近似的服从正态分布 六、累计频次检验六、累计频次检验 以上方法对于定序变量需要等级分的较多,但对于社会学研究,等级划分太细是不实际的,例如对“满意度”的调查,一般只能分作5等因此,在样本容量较大,而等级划分又很有限的情况下,累计频次检验就显得十分有用1.设从两个未知的总体中分别独立、随机抽取一个样本分别对样本1(x)和样本2(y)的数据,根据优良中下劣5个等级进行频次统计其中 ,i表示所属样本号,j表示等级号等级X 频次累计频率y 频次累计频率1劣2下3中4良5优合计 •2.做样本1和样本2的累计频率图。

      •3.如果总体1和总体2具有相同的分布,累计频率差 不会太大根据计算,其最大绝对差值 不应大于•否则,将拒绝具有相同分布的原假设 随着不同的显著性水平做修正表14-14)•4.对于 的情况,如果做单边检验,统计量为: SPSS:两配对样本非参数检验•Analyze-Nonparametric Tests•-2 Related Samples•Test Type:•Wilcoxon:符号平均值检验(即符号秩检验)•Sign:符号检验•McNemar:适用于二分变量数据•Options:Descriptive 符号秩检验结果伴随概率小于,认为存在显著性差异 SPSS:两独立样本非参数检验•Analyze-Nonparametric Tests•-2 Independent Samples•Test Vatiable List•Grouping Variable Define Groups•Test Type:•Mann-Whitney U(秩均值检验,等同秩和检验)•Kolmogorov-smirnov Z(K—S检验)(累计频次检验)•Wald-Wolfwitz Runs游程检验•Options:Descriptive SPSS:游程检验•检验样本的随机性•对两个独立总体进行显著性检验•Analyze-Nonparametric Test-Runs•Test Variable•Cut point:设置划分两类的临界点,小于和大于临界点两类。

      •Option选项•Exact精确检验 Mann-Whitney Testn<30,用U统计量的伴随概率作为判断标准;n>30,用Z统计量的伴随概率作为判断标准W(秩和):min秩和U=W-n(n+1)/2 =95 (n为W对应的样本数),U的精确伴随概率为Z=-1.38,伴随概率 Two-Sample Kolmogorov-Smirnov Test Wald-Wolfowitz Test 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.