好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

大学课程《统计分析方法及应用》PPT课件:(第四章).ppt

44页
  • 卖家[上传人]:O****
  • 文档编号:214373323
  • 上传时间:2021-11-23
  • 文档格式:PPT
  • 文档大小:1.45MB
  • / 44 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第四章 非参数方法v4.1 拟合优度检验v4.2 独立性检验v4.3 符号检验v4.4 威尔科克森符号秩检验v4.5 威尔科克森秩和检验v4.6 图4.1 拟合优度检验v一、分类数据的2检验v二、分布拟合的2检验一、分类数据的2检验v假定一个总体可分为k个类A1,A2,Ak,并设类Ai在总体中所占的比例为P(Ai)(i=1,2,k),且 又设p1,p2,pk是一组给定的数值,满足pk0(i=1,2,k), 欲检验 H0:P(Ai)=pi,i=1,2,kH1:P(Ai)pi,至少存在一个Iv容量为n的样本中属于类Ai的频数为fi(i=1,2,k),有 皮尔逊(K.Pearson,1900)提出了一个检验统计 量并指出,当H0为真且n充分大(通常还要求npi5,i=1,2,k)时,2近似服从2 (k1)分布v该检验 称为2拟合优度检验(chisquare goodness of fit test)对给定的显著性水平,其拒绝规则为 :若 ,则拒绝H0v例4.1.1 在一正20面体的20个面上,分别标以数字09,每个数字在两个对称的面上标出为检验 其匀称性,共作800次投掷试验 ,各数字朝正上方的次数列于表4.1.1:试问该 正20面体是否匀称(=0.05)。

      表4.1.1 正20面体的800次投掷试验中,各数字朝正上方的观测频数数 字0123456789观测频 数74928379807377757691以Ai表示数字i朝正上方,i=1,2,9要检验当H0为真时, 表4.1.2正20面体匀称性的2检验统计量计算过程数字i0123456789观测频 数fi74928379807377757691期望频数80808080808080808080finpi612310735411(finpi)2361449104992516121(finpi)2/npi0.451.80.11250.012500.61250.11250.31250.21.5125故接受H0,即认为该 正20面体匀称v如果pi(i=1,2,k)含有r(k1)个未知参数(如k=3,且p1=2,p2=2(1) ,p3=(1) 2,其中含有一个未知参数),则这r个未知参数可用其极大似然估计代替用 代替上式中的pi,得v费希尔(R.A.Fisher,1924)指出,当H0为真且n充分大时,2近似服从自由度为kr1的2分布检验的拒绝规则类 似于前面的式子,只需将自由度由k1改为kr1即可二、分布拟合的2检验v欲检验假设H0:F(x)=F0(x),H1:F(x)F0(x)v1.总体x为离散型的情形v2.总体x为连续 型的情形1.总体x为离散型的情形v H0:P(x=ai)=pi,i=1,2,,H1:x不具有H0中的分布列v可将x的取值a1,a2,分成若干类。

      具体做法是,把npi5的ai各自作为一类,而把npi5的ai合并成一些类或合并到npi5的类中,以使每一类的期望频数都大于等于5v例4.1.2 为检验 工作日上午到达某商店顾客数是否服从泊松分布的假设,随机抽取了一个由工作日上午的128个10分钟时间段组成的样本试检验 工作日上午的10分钟时间 段的顾客数x是否服从泊松分布(=0.05)表4.1.3128个10分钟时间段到达某商店顾客数的观测频数到达顾客数0123456789观测频 数28101218222216126解 建立假设H0:x服从泊松分布,H1:x不服从泊松分布的极大似然估计值为 表4.1.4到达顾客数的期望频数到达顾客数x 泊松概率 期望频数00.00670.857610.03374.313620.084210.777630.140417.971240.175522.464050.175522.464060.146218.713670.104413.363280.06538.358490.03634.6464100.03184.0704xfi0或1105.17124.828823.31734.509121010.77760.77760.60470.056131217.97125.971235.65521.984041822.46404.464019.92730.887152222.46400.46400.21530.009662218.71363.286410.80040.577171613.36322.63686.95270.52038128.35843.641613.26131.5866968.71682.71687.38100.8468合计128128.000010.9766表4.1.5分类后2统计量的计算过程故不能拒绝H0。

      2.总体x为连续 型的情形v若要检验总 体x是否服从某连续型分布,则需先把x的取值范围划分为k个互不相交的区间:(a0,a1,(a1,a2,(ak2,ak1,(ak1,ak)其中=a0a1ak1ak=这k个区间相当于k个类,当H0为真时,每个类在总体中所占的比例为pi=P(ai1m0(或H0:m=m0,H1:mm0)v H0:mm0,H1:mm0(或H0:m=m0,H1:mm0) v例4.3.1 为检验 某商店日营业额 的中位数是否少于14万元,随机抽取13天的日营业额记录 如下(单位:万元):11.2,12.6,14.0,12.3,11.5,17.2,13.8, 11.5,13.2,12.4,14.8,15.4,12.5试问这组 数据是否提供了充分的证据,说明日营业额 的中位数不到14万元(=0.05)解H0:m14,H1:m=0.05,故不能拒绝H0v在n20的情形下,符号检验的p值通常可从二项分布表中查得在n20的情形下,二项分布b(n,0.5)可用正态分布N(,2)近似代替,其中 对给定的显著性水平,以上各假设的拒绝规则 分别为:若 ,则拒绝H0若 ,则拒绝H0若 ,则拒绝H0v例4.3.2 检验某种维尼纶的纤度,测得100个数据列于表4.3.1中,试问这组 数据是否提供了充分证据来否定该维尼纶纤度的中位数m为1.40的说法(=0.05)。

      解 H0:m=1.40,H1:m1.40题中,n=100,s+=43,由于故接受H0纤 度1.261.291.321.351.381.411.441.471.501.53频 数14722232510611表4.3.1 维尼纶纤度的100个数据4.4 威尔科克森符号秩检验v一、对称总体的中位数检验v二、基于成对数据的比较两个总体分布的检验一、对称总体的中位数检验v设x1,x2,xn是从总体x中抽取的一个样本,x为连续 型随机变量,且其分布对称记m为x的中位数,希望检验H0:m=m0,H1:mm0令yi=xim0,i=1,2,n将|y1|,|y2|,|yn|从小到大依次排列,|yi|在其中的排列序号称为|yi|的秩(rank),记作Ri,i=1,2,n若出现几个相同的绝对值,则使用它们的平均秩威尔科克森符号秩检验(Wilcoxon signed-rank test)使用检验统计 量T=min(T+,T)其中 ,它们分别是y1,y2,yn中正值的秩和及负值的秩和,且满足 对于给定的显著性水平,检验的拒绝规则为 :若TT0,则拒绝H0此处T0由附录二的表5给出v H0:mm0,H1:mm0(或H0:m=m0,H1:mm0)拒绝规则 为:若TT0,则拒绝H0v H0:mm0,H1:mm0(或H0:m=m0,H1:mm0)拒绝规则为 :若T+T0,则拒绝H0这里两个检验中的T0仍从附录二的表5读出。

      v当样本容量n很大,如n25时,T+的抽样分布接近于正态分布采用检验统计 量v上述各假设的拒绝规则 分别为:若|u|u/2,则拒绝H0若uu,则拒绝H0若uu,则拒绝H0v例4.4.1 在例4.3.1中,假定该商店的日营业额 分布是对称的,试用威尔科克森符号秩检验再做检验解 建立的假设是H0:m14,H1:m14令yi=xi14,从样本中剔除yi=0的天正yi值的秩和为对=0.05,查威尔科克森符号秩检验的T0值表得T0=176=T0故不能拒绝H04.5 威尔科克森秩和检验v如果来自两个总体的样本是相互独立的,则可以使用威尔科克森秩和检验(Wilcoxon rank-sum test)对两个总体进行比较检验 v设 是取自总体x的一个样本, 是取自总体y的一个样本,且两个样本相互独立又设总体x和总体y的分布函数分别为F(a)和G(a),希望检验H0:F(a)=G(a),H1:F(a)G(a)v将 和 混合在一起,并按其大小由小到大进行排秩,记xi在混合样本中的秩为Ri,i=1,2,n1威尔科克森在1945年提出,把 在混合样本中的秩的总和作为检验 上述假设的检验统计 量对于给定的,检验的拒绝规则 可制定为:若TTL或TTU,则拒绝H0其中TL的值可直接从附录二的表6读出,而TU的值可由下式算出。

      TU=n1(n1+n2+1)TLv H0:F(a)G(a),H1:F(a)G(a)(或H0:F(a)=G(a),H1:F(a)G(a)(或H0:F(a)=G(a),H1:F(a)G(a) 拒绝规则为 :若TTL,则拒绝H0TL同样可从附录二的表6读出,TU由(4.5.4)式算得v当n1和n2都大于或等于10时,T的抽样分布可作正态近似采用检验统计 量对于给定的,上述各假设的拒绝规则 分别为:若|u|u/2,则拒绝H0若uu,则拒绝H0若uu,则拒绝H0v例4.5.1 有甲、乙两台机床加工同样的产品从这两台机床加工的产品中分别随机地抽取若干件,并测得其产品直径为(单位:毫米):甲:18.2,18.3,17.0,18.4,17.5,17.2,18.5,17.5乙:19.1,18.5,18.0,19.2,16.7,18.4,17.6,18.8,17.3试问这 些数据能否表明甲、乙两台机床加工产品的直径有显著差异(=0.05)解 依题意,n1=8,n2=9,建立假设H0:两总体分布相同,H1:两总体分布不相同查TL值表得TL=51,又由(4.5.4)式算得TU=n1(n1+n2+1)TL=8(8+9+1)51=93由于TLT=60TU,故不能拒绝H0。

      表4.5.1 产品直径甲机床产品xi秩Ri乙机床产品yi秩18.2919.11618.31018.513.517.0218.0818.411.519.21717.55.516.7117.2318.411.518.513.517.6717.55.518.81517.344.6 图v图可简便地从直观上判断一组样本数据是否来自具有某种分布形式的总体v设x1,x2,xn是来自连续型总体x的一组样本观测值 ,x的分布函数为F(x),这些观测值 按大小排序后表示为x(1)x(2)x(n)由于x是连续型随机变量,于是诸x(i)出现相等的概率为零,故不妨把这些排序后的观测值 表示成x(1)x(2)x(n)v将F(x(i)=P(xx(i)估计为从而一般有正态分布图v x(i)+q(i)其中,将(q(i),x(i)(i=1,2,n)画成坐标平面上的散点图,这个图便称为正态分布的图(quantile-quantile plot)v我们可以通过观察正态分布图上的散点是否大致成一条直线散布来判断样本观测值 来自正态总体与否若大致成一条直线散布,则可认为总 体具有正态性;否则就不认为v在图中可加一条回归线来拟合这些散点,该回归线拟 合这些散点的效果越好,就越倾向认为该组数据来自正态总体。

      v图在小样本情形下的效果不甚理想,此时即使已知观测值来自正态总体,图的直线性也可能存在很大变异一般应要求样本容量n为中等或较大(如n20)v例4.6.1 从某一人群中随机抽取20名成年男性,其身高数据如下(单位:厘米):167,183,179,152,164,151,161,172,168,149179,175,167,177,166,160,169,181,156,161图4.6.1 身高的正态。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.