
分布函数的假设检验ppt课件.ppt
21页第四第四节 分布函数的分布函数的拟合合优度度检验 前面几前面几节中中讨论了了总体分布方式知体分布方式知时关于关于总体参数的假体参数的假设检验但在许多多实践践问题中并不能中并不能预先知道先知道总体分布的方式体分布的方式这时,就需求根据,就需求根据样本提供的信息,本提供的信息,对总体的分布作出假体的分布作出假设,并,并对此此假假设进展展检验本节我我们将引将引见由英国由英国统计学家学家卡卡尔·皮皮尔逊提出的提出的 拟合合优度度检验法拟拟合合合合优优度度度度检验检验法的根本原理和步法的根本原理和步法的根本原理和步法的根本原理和步骤骤::::1. 提出原假提出原假设 H0 ::总体体 X 的分布函数的分布函数为F (x)备择假假设H1 :: 总体体 X 的分布函不是的分布函不是F (x)(1)备择假假设可以不用写出可以不用写出.(2)假假设X是离散型是离散型总体,原假体,原假设相当于:相当于:H0 ::总体体 X 的分布律的分布律为::P{X=xi}= pi ,i=1,2, … …假假设X是延是延续型型总体,原假体,原假设相当于:相当于:H0 ::总体体 X 的概率密度的概率密度为f (x).阐明明:(3) 假假设在原假在原假设 H0下,下,总体分布的方式知,但有体分布的方式知,但有r 个参数未知,个参数未知,这时需求用极大似然估需求用极大似然估计法先估法先估计这 r 个参数个参数.2. 将将 x 轴分成分成K个互不重迭的小区个互不重迭的小区间::3.计算算样本的本的n个察看个察看值落入以上每个区落入以上每个区间的个数,的个数,记为fi 〔〔 i=1,2, ……,K〕,称其〕,称其为实践践频数数. 一切一切实践践频数之和数之和 f1+ f2+ …+ fk 等于等于样本容量本容量n.4.在原假在原假设H0为真真时,,计算算总体落入每个区体落入每个区间的概的概率率Pi=F〔〔bi〕〕- F〔〔bi-1〕〔〕〔 i=1,2, ……,K〕,于是〕,于是npi就是落入第就是落入第i个区个区间的的样本本值的的实际频数数.反映了实践频数与实际频数的差别反映了实践频数与实际频数的差别. 当原假当原假设H0为真,真,样本容量又充分大本容量又充分大时,两者,两者并并证明了如下定理:明了如下定理:的差的差别应不会太大,皮不会太大,皮尔逊由此引由此引进统计量:量:定理〔皮定理〔皮尔逊〕假〕假设 n 充分大,充分大,H0为真真时,,不不论 H0中的分布属于什么中的分布属于什么类型,型,统计量量总是近似服从自在度为总是近似服从自在度为K-r-1的的 分布,即分布,即其中其中r是分布中被估是分布中被估计的参数的个数的参数的个数.由此得由此得5.检验统计量:量:回回绝域:域:要适当合并区要适当合并区间以以满足足这个要求。
个要求拟合优度检验法是在拟合优度检验法是在n充分大的条件下得到充分大的条件下得到的,所以在运用的,所以在运用时必需留意必需留意 n要足要足够大及大及 npi不能太小,不能太小,根据根据实践践阅历,要求,要求 n ≥50,,实际频数数npi ≥4 ,否那么,否那么注注注注: : : :例例1.某个城市在某一某个城市在某一时期内共期内共发生交通事故生交通事故600次,按不同次,按不同颜色小汽色小汽车分分类如下如下汽车颜色汽车颜色红红 棕棕 黄黄 白白 灰灰 蓝蓝事故次数事故次数75 125 70 80 135 115 假假设交通事故的交通事故的发生与汽生与汽车的的颜色无关,那么每色无关,那么每种种颜色的小汽色的小汽车发生交通事故的能生交通事故的能够性是一性是一样的的. .问:交通事故能否与汽车的颜色有关?问:交通事故能否与汽车的颜色有关?分析:分析:解:解:原假设原假设检验统计量:量:回回绝域:域:列表列表计算算汽车汽车颜色颜色f iP inP if i - nP i红棕棕黄黄白白灰灰蓝n=600-252530-2035157512570801151/61/6 1/61/61/61/61001001001001001006.256.259412.252.2540∑所以回所以回绝H0,以,以为交通事故与汽交通事故与汽车的的颜色有关色有关.由于由于例例2.某交某交换台,在台,在100分分钟内内记录了每分了每分钟被呼被呼唤的的次数次数X,,设f i为出出现该 X值的的频数,数,结果如下:果如下:X0 1 2 3 4 5 6 7 8 9f i 0 7 12 18 17 20 13 6 3 4 问总体问总体X〔交换台每分钟呼唤次数〕服从泊松分布〔交换台每分钟呼唤次数〕服从泊松分布吗?吗?解:解:按题意,原假设按题意,原假设 由于由于λ未知,首先未知,首先须用极大似然估用极大似然估计法,求得法,求得λ的估的估计值〔看七章二〔看七章二节例例5〕:〕:检验统计量:量:回回绝域:域:列表列表计算:算:Xf iP inP if i - nP i≤1234567≥8n=10071218172013671.3099∑-0.02-0.340.18 -2.293.300.95 -1.46-0.320.00006 0.0094 0.0018 0.27190.65210.0749 0.2857 0.0140 7.0212.3417.82 19.2916.7012.05 7.467.320.07020.12340.1782 0.19290.16700.1205 0.07460.0732由于由于所以接受所以接受H0,,以以为交交换台每分台每分钟呼呼唤次数次数X 服从泊松分布服从泊松分布.阐明明:将将n=0和和n=1合并,合并,n=8与与n≥9合并是合并是为了了保保证实际频数数npi ≥4.例例3.为了研讨患某种疾病的为了研讨患某种疾病的21~59岁男子的血岁男子的血压〔收缩压,单位:压〔收缩压,单位:mm-Hg 〕这一总体〕这一总体X,,抽查了抽查了100个男子,得个男子,得 ,, ,样本值分组如下:,样本值分组如下:序序号号分组分组fi序序号号分组分组fi12345(-(-∞,,99.5)[99.5,109.5)[109.5,,119.5)[119.5,,129.5)[129.5,,139.5)582227176789[139.5,,149.5)[149.5,,159.5)[159.5,,169.5)[169.5,+,+∞)9552取取α=0.10,,检验21~59岁男子的血男子的血压〔收〔收缩压〕〕总体体X能否服从正能否服从正态分布。
分布解:解:按题意,原假设按题意,原假设 由于由于μ,σ2未知,首先未知,首先须用极大似然估用极大似然估计法,求得法,求得其估其估计值〔看教科〔看教科书七章二七章二节例例2〕:〕:检验统计量:量:回回绝域:域:列表列表计算:算:H0为真真时,,列表列表计算:算:12345678n=10058222717957∑XfiPinPifi - nPi分组分组(--∞,,99.5)[99.5,109.5)[109.5,119.5)[119.5,129.5)[129.5,.5)[.5,149.5)[149.5,159.5)[159.5, ++∞)0.06550.10560.17720.22310.19890.13290.06610.03076.5510.5617.7222.3119.8913.296.613.07-1.55-2.564.284.69-2.89-4.292.320.36680.62061.03380.98590.41991.38480.55605.3678由于由于所以接受所以接受H0,,即即21~59岁男子的血男子的血压〔收〔收缩压〕〕总体体X服从正服从正态分布。
