
卡方分布概念及表和查表方法.doc
6页卡方分布概念及表和查表方法若n个相互独立的随机变量 E ? ?,…,E n,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布( chi-square distribution )中文名卡方分布外文名chi-square distributi on另U 称西格玛分布提出者Friedrich Robert Helmert提出时间1863应用学科统计学目录1简介2定义3性质 4概率表简介2 2X 分布在数理统计中具有重要意义 兀 分布是由阿贝(Abbe)于1863年首先提出的,后来由海尔墨特 (Hermert)和现代统计学的奠基人之一的卡•皮尔逊 (C K • Pears on) 分别于1875年和1900年推导出来,是统计学中的一个非常有用的著名分布定义若n个相互独立的随机变量 E ?、E ?、……、E n,均服从标准正态分布(也称独立同分布于标准正态分布),则这 n个服从标准正态分布的随机变量的平方和i=l构成一新的随机变量,其分布规律称为 * 分布(chi-squaredistributi on),Q二加 壮其中参数 ;■称为自由度,正如正态分布中均数或方差不同就是另一个正态分布一样,自 由度不同就是另一个 i 分布。
记为」'; 或者 :瘠 (其中■: ■- - ■-: -5' ,比 为限制条件数)卡方分布是由正态分布构造而成的一个新的分布, 当自由度卩 很大时, *2 分布近似为正态分布对于任意正整数X, 自由度为 TT的卡方分布是一个随机变量 X的机率分布性质1) X2分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数 V的增大,上2分布趋近于正态分布;卡方分布密度曲线下的面积都是 12) 1 分布的均值与方差可以看出,随着自由度 :'的增大,i分布向正无穷方向延伸(因为均值 v 越来越大),分布曲线也越来越低阔 (因为方差 2护 越来越大)3) 不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜4) 若 汽讥疔讷 互相独立」' •「服从’•分布,自由度为刃+巾5) *分布的均数为自由度 r ,记为e( X1 )= I,6) *分布的方差为2倍的自由度(2V ),记为D( X1 ) = 2卩概率表z2分布不象正态分布那样将所有正态分布的查表都转化为 标准正态分布 去查,在X1分布中得对每个分布编 制相应的概率值,这通过’ 分布表中列出不同的自由度来表示,在 i 分布表中还需要如标准正态分布表中给出不同 P值一样,列出概率值,只不过这里的概率值是 i 值以上 i 分布曲线以下的概率。
由于’ 分布概率表中要列出很2 1多i 分布的概率值,所以 i 分布中所给出的P值就不象标准正态分布中那样给出了 400个不同的P值,而只给出了有代表性的 13个值,因此’ 分布概率表的精度就更差,不过给出了常用的几个值,足够在实际中使用了查尤'分布概率表时,按自由度及相应的概率去找到对应的 X2 值如上图所示的单侧概率 X3(7)=的查表方法就是,在第一列找到自由度 7这一行,在第一行中找到概率这一列,行列的交叉处即是表中所给值直接只能查单侧概率值, 可以变化一下来查双侧概率值 例如,要在自由度 为7的卡方分布中,得到双侧概率为所对应的上下端点可以这样来考虑: 双侧概率指的是在上端和下端各划出概率相等的一部分, 两概率之和为给定的概率值, 这里是,因此实际上上 端点以上的概率为 2=,用概率查表得上端点的值为 16,记为疋 2(7)=16下端点以下 的概率也为,因此可以用查得下端点为,记为 2(7)=当然也可以按自由度及 值去查对应的概率值,不过这往往只能得到一个大概的结果,因为尤'分布概率表的精度有限,只给了 13个不同的概率值进行查表例如,要在自由度为18的上2分布查找 *2 =30对应的概率,则先在第一列找到自由度 18,然后看这一行可以发现与 30接近的有与,它们所在的列是与,所以要查的概率值应于介于 与之间,当然这是单侧概率值,它们的双侧概率值界于与之间。
如果要更精确一些可以采用插值的方法得到,这在正态分布的查表中有介绍为什么从正态总体中抽取出的样本的方差服从 X 分布在抽样分布理论一节里讲到,从正态总体进行一次抽样就相当于独立同分布的 n个正态随机变量E 1, E 2,…,En的一次取值,将n个随机变量针对总体均值与方差进行标准化 得(i=1,…,n),显然每个都是服从标准正态分布的,因此按照 X1 分布的定义,应该服从参数为 F的*分布如果将总体中的方差 b 2用样本方差 S2代替,它是否也服从 上2 分布呢理论上可以证明,它是服从 JT'分布的,但是参数U 不是n而是n-1 了,究其原因在于它是n-1个独立同分布于标准正态分布的随机变量的平方和我们常常把一个式子中独立变量的个数称为这个式子的“自由度”, 确定一个式子自由度的方法是:若式子包含有n个变量,其中k个被限制的样本统计量, 则这个表达式的自由度为n-k比如中包含 E 1,E 2,…,En这n个变量,其中 E1- En-1相互独立,En为 其余变量的平均值,因此自由度为 n-1附卡方表n/P123456789101112131415161718192021222324252627282930405060708090100注:1. 当n充分大时,x 2 (n)的值近似等于【Za + SQRT(2n-1)】的平方122.。












