好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

分布函数的假设检验.ppt

21页
  • 卖家[上传人]:ni****g
  • 文档编号:588479507
  • 上传时间:2024-09-08
  • 文档格式:PPT
  • 文档大小:694.50KB
  • / 21 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第四节第四节 分布函数的拟合优度检验分布函数的拟合优度检验 前面几节中讨论了总体分布形式已知时关于前面几节中讨论了总体分布形式已知时关于总体参数的假设检验但在许多实际问题中并不总体参数的假设检验但在许多实际问题中并不能预先知道总体分布的形式这时,就需要根据能预先知道总体分布的形式这时,就需要根据样本提供的信息,对总体的分布作出假设,并对样本提供的信息,对总体的分布作出假设,并对此假设进行检验本节我们将介绍由英国统计学此假设进行检验本节我们将介绍由英国统计学家卡尔家卡尔·皮尔逊提出的皮尔逊提出的 拟合优度检验法拟合优度检验法 拟合优度检验法的基本原理和步骤:拟合优度检验法的基本原理和步骤:拟合优度检验法的基本原理和步骤:拟合优度检验法的基本原理和步骤:1. 提出原假设提出原假设 H0 :总体:总体 X 的分布函数为的分布函数为F (x)备择假设备择假设H1 ::总体总体 X 的分布函不是的分布函不是F (x)(1)备择假设可以不必写出备择假设可以不必写出.(2)若若X是离散型总体,原假设相当于:是离散型总体,原假设相当于:H0 :总体:总体 X 的分布律为:的分布律为:P{X=xi}= pi ,i=1,2, … …若若X是连续型总体,原假设相当于:是连续型总体,原假设相当于:H0 :总体:总体 X 的概率密度为的概率密度为f (x).说明说明: (3) 若在原假设若在原假设 H0下,总体分布的形式已知,但有下,总体分布的形式已知,但有r 个参数未知,这时需要用极大似然估计法先估计这个参数未知,这时需要用极大似然估计法先估计这 r 个参数个参数.2. 将将 x 轴分成轴分成K个互不重迭的小区间个互不重迭的小区间::n个观察值落入以上每个区间的个数,记为个观察值落入以上每个区间的个数,记为fi (( i=1,2, ……,K),称其为),称其为实际频数实际频数. 所有实际频数之所有实际频数之和和 f1+ f2+ …+ fk 等于样本容量等于样本容量n. 0为真时,计算总体落入每个区间的概率为真时,计算总体落入每个区间的概率Pi=F((bi))- - F((bi-1)()( i=1,2, ……,K),于是),于是npi就是落入第就是落入第i个区个区间的样本值的间的样本值的理论频数理论频数.反映了实际频数与理论频数的差异反映了实际频数与理论频数的差异. 当原假设当原假设H0为真,样本容量又充分大时,两者为真,样本容量又充分大时,两者并证明了如下定理:并证明了如下定理:的差异应不会太大,皮尔逊由此引进统计量:的差异应不会太大,皮尔逊由此引进统计量: 定理(皮尔逊)定理(皮尔逊)若若 n 充分大,充分大,H0为真时,不论为真时,不论 H0中的分布属于什么类型,统计量中的分布属于什么类型,统计量总是近似服从自由度为总是近似服从自由度为K-r-1的的 分布,即分布,即其中其中r是分布中被估计的参数的个数是分布中被估计的参数的个数. 由此得由此得5.检验统计量:检验统计量:拒绝域:拒绝域:要适当合并区间以满足这个要求。

      要适当合并区间以满足这个要求拟合优度检验法是在拟合优度检验法是在n充分大的条件下得到充分大的条件下得到的,所以在使用时必须注意的,所以在使用时必须注意 n要足够大及要足够大及 npi不能太小,不能太小,根据实际经验,要求根据实际经验,要求 n ≥50,理论频数,理论频数npi ≥4 ,否则,否则注注注注: : : : 例例1.某个城市在某一时期内共发生交通事故某个城市在某一时期内共发生交通事故600次,次,按不同颜色小汽车分类如下按不同颜色小汽车分类如下汽车颜色汽车颜色红红 棕棕 黄黄 白白 灰灰 蓝蓝事故次数事故次数75 125 70 80 135 115 如果交通事故的发生与汽车的颜色无关,则每种如果交通事故的发生与汽车的颜色无关,则每种颜色的小汽车发生交通事故的可能性是一样的颜色的小汽车发生交通事故的可能性是一样的. .问:交通事故是否与汽车的颜色有关?问:交通事故是否与汽车的颜色有关?分析:分析: 解:解:原假设原假设检验统计量:检验统计量:拒绝域:拒绝域: 列表计算列表计算汽车汽车颜色颜色f iP inP if i - nP i红红棕棕黄黄白白灰灰蓝蓝n=600-252530-2035157512570801351151/61/6 1/61/61/61/61001001001001001009440∑ 所以拒绝所以拒绝H0,,认为交通事故与汽车的颜色有关认为交通事故与汽车的颜色有关.因为因为例例2.某交换台,在某交换台,在100分钟内记录了每分钟被呼分钟内记录了每分钟被呼唤的次数唤的次数X,设,设f i为出现该为出现该 X值的频数,结果如下:值的频数,结果如下:X0 1 2 3 4 5 6 7 8 9f i 0 7 12 18 17 20 13 6 3 4 问总体问总体X(交换台每分钟呼唤次数)服从泊松(交换台每分钟呼唤次数)服从泊松分布吗?分布吗? 解:解:按题意,原假设按题意,原假设 由于由于λ未知,首先须用极大似然估计法,求得未知,首先须用极大似然估计法,求得λ的估计值(看七章二节例的估计值(看七章二节例5):):检验统计量:检验统计量:拒绝域:拒绝域:列表计算:列表计算: Xf iP inP if i - nP i≤1234567≥8n=1007121817201367∑ 0.2857 19.29 7.462946 因为因为所以接受所以接受H0,,认为交换台每分钟呼唤次数认为交换台每分钟呼唤次数X 服从泊松分布服从泊松分布.说明说明:将将n=0和和n=1合并,合并,n=8与与n≥9合并是为了合并是为了保证理论频数保证理论频数npi ≥4. 例例3.为了研究患某种疾病的为了研究患某种疾病的21~59岁男子的血压(收岁男子的血压(收缩压,单位:缩压,单位:mm-Hg )这一总体)这一总体X,抽查了,抽查了100个个男子,得男子,得 ,, ,样本值分,样本值分组如下:组如下: 序序号号分组分组fi序序号号分组分组fi12345(-(-∞,,99.5)[99.5,109.5)[109.5,,119.5)[119.5,,129.5)[129.5,,139.5)582227176789[139.5,,149.5)[149.5,,159.5)[159.5,,169.5)[169.5,+,+∞)9552取取α,检验,检验21~59岁男子的血压(收缩压)总体岁男子的血压(收缩压)总体X是是否服从正态分布。

      否服从正态分布 解:解:按题意,原假设按题意,原假设 由于由于μ,σ2未知,首先须用极大似然估计法,求得未知,首先须用极大似然估计法,求得其估计值(看教科书七章二节例其估计值(看教科书七章二节例2):):检验统计量:检验统计量:拒绝域:拒绝域:列表计算:列表计算: H0为真时,为真时, 列表计算:列表计算: 12345678n=10058222717957∑XfiPinPifi - nPi分组分组(--∞,,99.5)[99.5,109.5)[109.5,119.5)[119.5,129.5)[129.5,139.5)[139.5,149.5)[149.5,159.5)[159.5, ++∞) 因为因为所以接受所以接受H0,,即即21~59岁男子的血压(收缩压)总体岁男子的血压(收缩压)总体X服从正态分布服从正态分布。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.