
第三章 概率和概率分布.ppt
96页样本样本总体总体统计推断随机抽样统计推断第三章 概率、概率分布第一节:概率基础知识一、概率的概念二、概率的计算三、概率的分布三、概率的分布四、大数定律四、大数定律一、概率基本概念((一)事件一)事件 必然事件(U):一定条件下必然出现 不可能事件(V):一定条件下必然不出现 随机事件(A):一定条件下可能出现 生物统计学只讨论随机事件一、概率基本概念((二)频率二)频率 设事件设事件A在在n次重复试验中发生了次重复试验中发生了m次次,其比值其比值m/n称为事件称为事件A发生的频率发生的频率(frequency),记为,记为W(A)=m/n三)概率(三)概率(probability, P)事件事件A在在n次重复试验中,发生了次重复试验中,发生了m次,当试验次次,当试验次数数n不断增大时,事件不断增大时,事件A发生的频率发生的频率W(A)就越来越就越来越接近某一确定值接近某一确定值p,于是定义,于是定义p为事件A发生的概为事件A发生的概率(率(probability)),记为记为P(A) = p0≤P(A)≤10≤P(A)≤1 P(U)=1P(U)=1 P(V)P(V)==0 0 二、概率的计算((一)事件的相互关系一)事件的相互关系和和事件事件积积事件事件互斥事件互斥事件对立事件对立事件独立事件独立事件完全事件系完全事件系二、概率的计算((一)事件的相互关系一)事件的相互关系事件事件A和事件和事件B中至少有一个发生而构成的新事中至少有一个发生而构成的新事件称为事件件称为事件A和事件和事件B的和事件,记作的和事件,记作A+B。
n个事件的和,可表示为个事件的和,可表示为A1+A2+…+An和和事件事件ABAB二、概率的计算((一)事件的相互关系一)事件的相互关系事件事件A和事件和事件B中同时发生而构成的新事件称中同时发生而构成的新事件称为事件为事件A和事件和事件B的积事件,记作的积事件,记作ABn个事件的积,可表示为个事件的积,可表示为A1A2…An积积事件事件AB二、概率的计算((一)事件的相互关系一)事件的相互关系事件事件A和事件和事件B不能同时发生,则称这两个事不能同时发生,则称这两个事件件A和和B互不相容或互斥互不相容或互斥n个事件两两互不相容,则称这个事件两两互不相容,则称这n个事件互斥个事件互斥互斥事件互斥事件二、概率的计算((一)事件的相互关系一)事件的相互关系事件事件A和事件和事件B必有一个发生,但二者不能同必有一个发生,但二者不能同时发生,且时发生,且A和和B的和事件组成整个样本空间的和事件组成整个样本空间即即A+B=U,,AB=V我们称事件我们称事件B为事件为事件A的的对立事件对立事件B= A对立事件对立事件互斥事件互斥事件对立对立事件事件二、概率的计算((一)事件的相互关系一)事件的相互关系事件事件A和事件和事件B的发生无关,事件的发生无关,事件B的发生的发生与事件与事件A的发生无关,则事件的发生无关,则事件A和事件和事件B为为独立事件。
独立事件独立事件独立事件二、概率的计算((一)事件的相互关系一)事件的相互关系如果多个事件如果多个事件A1、、A2、、A3、、…、、An两两互斥,两两互斥,且每次试验结果必然发生其一,则称事件且每次试验结果必然发生其一,则称事件A1、、A2、、A3、、…、、An为完全事件系为完全事件系完全事件系完全事件系二、概率的计算((二)概率的计算法则二)概率的计算法则1 互斥事件加法定理若事件A与B互斥互斥,则 P(A+B)=P(A)+P(B)推理推理1 P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)推理推理2 P(A)=1-P(A)推理推理3 完全事件系的和事件的概率为完全事件系的和事件的概率为1二、概率的计算((二)概率的计算法则二)概率的计算法则2 独立事件乘法定理事件事件A和事件和事件B为为独立事件独立事件,则事件,则事件A与事与事件件B同时发生的概率为各自概率的积同时发生的概率为各自概率的积P(AB)=P(A)P(B)推理:推理:A1、、A2、、…An彼此独立,则彼此独立,则P(A1A2A3…An)=P(A1)P(A2)P(A3)…P(An)播种玉米,两粒种子,种子的发芽率为播种玉米,两粒种子,种子的发芽率为90%A:第一粒种子发芽第一粒种子发芽B:第二粒种子发芽第二粒种子发芽C:两粒种子均发芽两粒种子均发芽D:一粒种子发芽一粒种子发芽E:两粒种子均不发芽两粒种子均不发芽三、概率分布((一)离散型变量的概率分布一)离散型变量的概率分布要要了解离散型随机变量了解离散型随机变量x的统计规律,必须知道的统计规律,必须知道它的一切可能值它的一切可能值xi及取每种及取每种可能值的概率可能值的概率pi。
对对离散型变量离散型变量x的一切可能值的一切可能值xi(i=1,2,3…) 及及其对应的概率其对应的概率pi三、概率分布((一)离散型变量的概率分布一)离散型变量的概率分布 表3-2 某鱼群的年龄组成年龄(x) 1 2 3 4 5 6 7频率(W) 0.4597 0.3335 0.1254 0.0507 0.0215 0.0080 0.0012此表列出了该鱼群年龄构成的全部,称为该鱼群年龄的概率分布三、概率分布((一)离散型变量的概率分布一)离散型变量的概率分布 表3-3 离散型变量的概率分布变量(x) x1 x2 x3 x4 …….. xn概率(P) p1 p2 p3 p4 ……. pn设离散型变量x的所有一切可能值xi(i=1,2,3…),取相应值的概率为pi,则pi称为离散型随机变量x的概率函数。
定义三、概率分布((二)连续型变量的概率分布二)连续型变量的概率分布 n 增加增加组距组距减少减少分组多分组多直方条直方条增加增加阶梯形曲线趋于光滑阶梯形曲线趋于光滑((二)连续型变量的概率分布二)连续型变量的概率分布当当n n无限大时,无限大时,频率转化为概率频率转化为概率,,频率密度频率密度也也转化为转化为概率密度,概率密度,阶梯形曲线也就转化为一条阶梯形曲线也就转化为一条光滑的光滑的连续曲线连续曲线,这时频率分布也就转化,这时频率分布也就转化为概为概率分布了,此曲线为率分布了,此曲线为总体的概率密度曲线总体的概率密度曲线曲线函数用曲线函数用f(x)f(x)表示三、概率分布((二)连续型变量的概率分布二)连续型变量的概率分布ab连续型随机变量的概率由概率分布密度函数所确定连续型随机变量的概率由概率分布密度函数所确定三、概率分布((二)连续型变量的概率分布二)连续型变量的概率分布对于随机变量在区间 ,则该事件为必然事件概率密度函数概率密度函数f(x)与与x轴所围成的面积为轴所围成的面积为1频率频率W(A)概率概率P(A)n 值大值大统计数统计数参参 数数四、大数定律大数大数定律定律:概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。
样本容量越大,样本统计数与总体参数之差越小四、大数定律贝贝努努里里大大数数定定律律辛辛钦钦大大数数定定律律设设m m是是n n次独立试验中事件次独立试验中事件A A出现的次数,出现的次数,而而p p是事件是事件A A在每次试验中出现的概率,在每次试验中出现的概率,则对于任意小的正数则对于任意小的正数εε设设x x1 1,x,x2 2,x,x3 3,…,,…,x xn n是来自同一总体的是来自同一总体的变量,对于任意小的正数变量,对于任意小的正数εε四、大数定律只要从总体中抽取的随机变量相当多,就可以用样本的统计数来估计总体的参数参数参数统计数统计数随机变量的分布可用分布函数来表述概率 离散型变量(discrete random variable) 连续型变量(continuous random variable)二项二项分布分布泊松分布泊松分布正态分布正态分布变量第二节:几种常见的理论分布离散型离散型随机变量的分布哺乳动物种子穗子生物个体雄性雌性发芽不发芽有芒无芒成活死亡对立事件一、二项分布二项总体二项分布“非此即彼”事件所构成的总体概率分布二项总体试验只有两个对立两个对立结果重复性重复性独立性独立性一、二项分布(一)二项分布的概率函数(一)二项分布的概率函数试验的条件不变,即在每次试验中事试验的条件不变,即在每次试验中事件件A出现的概率皆为出现的概率皆为p。
任何一次试验中,事件任何一次试验中,事件A的出现与其的出现与其余各次试验中出现何种结果无关余各次试验中出现何种结果无关从雌雄各半的100只动物中,做一抽样试验第一次从这100只动物中随机抽取1只,记下性别后放回,再做第二次抽样不论第一次抽样结果,第二次抽样中,得到雌性或雄性的概率仍是50/100这两次试验是独立独立的第一次抽样后第一次抽样后不不放回,再做第二次抽样放回,再做第二次抽样这两次试验是非独立的雄性动物抽到雄性的概率是49/99抽到雌性的概率是50/99雌性动物抽到雄性的概率是50/99抽到雌性的概率是49/99放回式抽样非放回式抽样二项分布超几何分布在放回式抽样中,若抽样试验共进行在放回式抽样中,若抽样试验共进行10次次,,其中包括其中包括3只雄性动物的概率是多少?只雄性动物的概率是多少?包括包括3只及只及3只以下的概率是多少?只以下的概率是多少?在在10次试验中,抽到雄性动物的只数是一随机变次试验中,抽到雄性动物的只数是一随机变量,记为量,记为X,,X的可能值是的可能值是0,,1,,2,, …,,10现在要求出现在要求出X X==3 3和和X≤ 3X≤ 3的概率一、二项分布一、二项分布n=试验次数(或样本含量)试验次数(或样本含量) n=10x=在在n次次试验中事件试验中事件A出现的次数出现的次数 x=3p=事件事件A发生的概率(每次试验是恒定的)发生的概率(每次试验是恒定的) p=0.51-p=事件事件A不发生的概率不发生的概率 1-p=0.5p(x)=X的概率函数的概率函数=P(X=x) p(3)F(x)=P(X ≤3) ≤3) F(3)F(3)m表示雄性动物表示雄性动物 f表示雌性动物表示雌性动物mmmfffffff 表示在表示在10次抽样中,前次抽样中,前3次抽中的都是雄次抽中的都是雄性动物。
性动物抽样间相互独立,每次抽到雄性动物的概率是抽样间相互独立,每次抽到雄性动物的概率是p,,抽到雌性动物的概率是抽到雌性动物的概率是1-pP(mmmfffffff)=p3(1-p)7一、二项分布一、二项分布在在10次抽样中,抽到次抽样中,抽到3只雄性动物的所有方式数,只雄性动物的所有方式数,相当于从相当于从10个元素中,取个元素中,取3个元素的组合数个元素的组合数C103一、二项分布一、二项分布P(mmmfffffff)=p3(1-p)7mmfmffffff, mfmmffffff, fmmmffffff, ffmmmfffff, ……p(3)== C103p3(1-p)7抽到抽到3只只雄性动物的概率雄性动物的概率p(3)== C103p3(1-p)7p(x)== Cnxpx(1-p)n-x二项式二项式[p+(1-p)]n展开式的第展开式的第x+1项,因此称为项,因此称为“二项分布二项分布”[p+(1-p)]n=1p(0) +p(1) +p(2) + … + p(x) + … + p(n) =1Σ p(x) =1一、二项分布p(0) =0.0009766p(1) =0.0097656p(2) =0.0439453p(3) =0.1171876F(3)= p(0) +p(1) +p(2) + p(3) =0.1718751 x表示在n次试验中事件A出现的次数概率分布函数为 P(x)=Cxnpxqn-xP(x)为随机变量x的二项分布,记作 B(n,p)一、二项分布(一)二项分布的概率函数(一)二项分布的概率函数(二)二项分布的形状和参数(二)二项分布的形状和参数二项分布的形状由二项分布的形状由n n和和p p两个参数决定。
两个参数决定(1)(1)当当p p值值较小且较小且n n不大时,分不大时,分布是偏倚的随布是偏倚的随n n的增大,分的增大,分布趋于对称;布趋于对称;((2 2)对于固定的)对于固定的n n和和p p,当,当x x增增加时,加时,P(xP(x) )先随之增加并达到先随之增加并达到极大值,以后又下降极大值,以后又下降3 3)当)当p p值趋于值趋于0.50.5时,分布时,分布趋于对称趋于对称服从二项分布B(n,p)的随机变量所构成的总体的平均数μ 、标准差σ与n、p这两个参数有关一、二项分布(二)二项分布的形状和参数(二)二项分布的形状和参数显微镜视野内染色体有变异的细胞计数抽检大量产品中出现次品的件数田间小区内出现变异植株的计数 n 很大,很大,p值很小二、泊松分布泊松分布(Poisson distribution)是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件稀有事件的概率分布泊松分布是二项分布的一种特殊类型二、泊松分布概率函数可由二项分布概率函数推导出来λλ为参数,为参数,λλ==n pn p 二、泊松分布P(λ )的形状由λ确定λ 较小时,泊松分布偏倚。
λ 增大时,泊松分布趋于对称λ 无限增大时,泊松分布接近正态分布二、泊松分布对于小概率事件,可用泊松分布描述对于小概率事件,可用泊松分布描述其概率分布其概率分布二项二项分布当分布当p<0.1和和np<5时,可用泊松时,可用泊松分布来近似分布来近似21n大大p与与1-p接近接近λλ大大二项二项分布分布泊松分布泊松分布正态分布正态分布正态分布正态分布是生物统计学的重要基础是生物统计学的重要基础围绕在平均值左右,由平均值到围绕在平均值左右,由平均值到分布的两侧,变量数减少,即分布的两侧,变量数减少,即两两头少,中间多,两侧对称头少,中间多,两侧对称正态分布(normal distribution)特点特点正态分布正态分布也称为也称为高斯分布高斯分布三、正态分布三、正态分布(一)正态分布的概率函数f(x) 为正态分布的概率密度函数,表示某一定为正态分布的概率密度函数,表示某一定x值值出现的概率密度函数值出现的概率密度函数值μμ总体平均数总体平均数σσ总体标准差总体标准差ππ圆周率,圆周率,3.14159e为自然对数底,为自然对数底,2.71828N (μ,,σ2)x=μx=μ时,时,f(x)f(x)值最大,正态分布曲线以平均值最大,正态分布曲线以平均数数μμ为中心的分布。
为中心的分布三、正态分布(二)正态分布的特征1x-μx-μ的绝对值相等时,的绝对值相等时,f(x)f(x)也相等,正态分也相等,正态分布密度曲线以布密度曲线以μμ为中心向左右两侧对称为中心向左右两侧对称2f(x)是非负函数,以是非负函数,以x轴为渐近线,轴为渐近线,x的取的取值区间为值区间为(-∞,+∞)(-∞,+∞) 三、正态分布(二)正态分布的特征3正态分布曲线由参数正态分布曲线由参数μμ,,σσ决定,决定, μμ确定确定正态分布曲线在正态分布曲线在x x轴上的中心位置,轴上的中心位置,σσ确定确定正态分布的变异度正态分布的变异度三、正态分布(二)正态分布的特征4σσ大,曲线展开度越大,数据分散大,曲线展开度越大,数据分散; ; σσ小,曲线展开度小,数据集中小,曲线展开度小,数据集中正态分布曲线在正态分布曲线在x=μx=μ±±σσ处各有一个处各有一个拐点,曲线通过拐点时改变弯曲度拐点,曲线通过拐点时改变弯曲度三、正态分布(二)正态分布的特征5分布曲线与分布曲线与x x轴围成的全部面积为轴围成的全部面积为1 16三、正态分布若若一个连续型随机变量一个连续型随机变量x取值取值于区间于区间(a,b),其概率为,其概率为ab三、正态分布(三)标准正态分布N (μ,,σ2)正态分布是依赖于参数正态分布是依赖于参数(μ(μ,,σσ2 2) )的一个曲线系,的一个曲线系,正态曲线的位置及形态随正态曲线的位置及形态随(μ(μ,,σσ2 2) )的的不同而不不同而不同,需将其同,需将其标准化标准化。
N(0,,1)三、正态分布f(u)称为标准正态分布称为标准正态分布(standard normal distribution)或或u分布方程分布方程u u表示标准正态离表示标准正态离差,它表示离开差,它表示离开平均数平均数μμ有几个有几个标准差标准差σσ三、正态分布正态分布标准化实质上做出了座标轴的平移正态分布标准化实质上做出了座标轴的平移和尺度转换,使正态分布具有平均数为和尺度转换,使正态分布具有平均数为0,,标准差为标准差为1记作N(0,1)三、正态分布标准正态分布标准正态分布u落在区间落在区间(a,b]的概率的概率a b三、正态分布(四)正态分布的概率计算a b-a三、正态分布P(-1≤u≤1)=0.6826≤u≤1)=0.6826P(-2≤u≤2)=0.9545≤u≤2)=0.9545P(-3≤u≤3)=0.9973≤u≤3)=0.9973P(-1.96≤u≤1.96)=0.95≤u≤1.96)=0.95P(-2.58≤u≤2.58)=0.99≤u≤2.58)=0.991 标准正态分布的概率计算三、正态分布(四)正态分布的概率计算2 一般正态分布的概率计算服从正态分布服从正态分布N(μ,σN(μ,σ2 2) )的随机变量的随机变量,,x x的取值落的取值落在区间在区间[x[x1 1,x,x2 2] ] 的的概率,记作概率,记作P(xP(x1 1≤x 三、正态分布(四)正态分布的概率计算2 一般正态分布的概率计算计算一般正态分布的概率时,只要将区间的上下限作适当变换(标准化),就可用查标准正态分布的概率表的方法求得概率了三、正态分布(四)正态分布的概率计算2 一般正态分布的概率计算P(μ-σ 求:小麦株高95%的正常范围值小麦株高服从正态分布总体平均数μ和标准差σ未知,我们可以用样本平均数 x 和标准差 s 来估计μ和σ [ 78.57, 85.73 ]三、正态分布(五)正态分布的应用1估计参考值范围x≥85(cm) 的概率?P(x≥85)x≥85)==P(uP(u≥≥1.541.54) ) ==1-F(u=1.54)1-F(u=1.54) =1-0.9328=0.0618 =1-0.9328=0.0618 三、正态分布(五)正态分布的应用2质量控制服从正态分布的变量落在μ±2σ 及μ±3σ的概率为95%和99%,在试验中,为了控制检测误差,常以x±2s作为上下警戒线,以x±3s作为上下控制线 三、正态分布(五)正态分布的应用3正态分布是很多统计方法的理论基础二项分布,泊松分布的极限均为正态分布,在一定条件下,均可按正态分布的原理来处理后面的t检验,方差分析,相关回归分析等多种统计方法均要求分析的指标服从正态分布对于非正态分布资料,实施统计处理的一个重要途径是先作变量的转换,使转换后的资料近似正态分布,然后按正态分布的方法作统计处理。 根据样本对总体做出估计和推断,并不是直接用样本本身,而是用样本的统计量来对总体做出估计和判断但由于从总体中抽取的样本提供的信息仅是总体的一部分,因此它不能提供完全准确的信息,必然存在着一定的误差即,对于样本容量相同的多次随机抽样,得到样本函数的观察值也是不同的,且其取值有一定的概率,即统计量也是一个随机变量,因而也有它的分布,称为抽样分布(sampling distribution)总体样本1x1样本2x2样本3x3样本nxn第三节:统计数的分布如果所有可能样本的某一统计数的平均数等于总体的相应如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估计值参数,则称该统计数为总体相应参数的无偏估计值样本平均数是总体平均数样本平均数是总体平均数μμ的无偏估计值的无偏估计值样本方差是总体方差的无偏估计值样本方差是总体方差的无偏估计值样本标准差样本标准差s不是总体标准差不是总体标准差σσ的无偏估计值的无偏估计值一、抽样试验与无偏估计二、样本平均数的分布((1)样本平均数分布的平均数=总体平均数样本平均数分布的平均数=总体平均数2)样本平均数分布的方差=总体方差除以样本容量。 样本平均数分布的方差=总体方差除以样本容量样本平均数的标准误差(标准误)样本平均数的标准误差(标准误)((standard error of mean)二、样本平均数的分布(3)如果从正态分布总体N(μ,σ2)进行抽样,其样本平均数x是一具有平均数 μ,方差σ2/n的正态分布,记作N(μ,σ2/n)中心极限定理(central limit theorem)连续型变量离散型变量((4)如果被抽总体不是正态分布总体,但具有平均数)如果被抽总体不是正态分布总体,但具有平均数μμ和方差和方差σσ2 2 ,,当随样本容量当随样本容量n的不断增大,样本平均的不断增大,样本平均数数 x 的分布也越来越接近正态分布,且具有平均数的分布也越来越接近正态分布,且具有平均数μμ,,方差方差σσ2 2 /n 偏态分布正态分布不论总体为何种分布,只要是大样本,就可运用中心极限定理,认为样本平均数的分布是正态分布,在计算样本平均数出现的概率时,样本平均数可按下式进行标准化样本平均数差数的分布 从两个相互独立的正态总体中抽取样本,得到样本平均数差数的分布也是正态分布样样样样本本本本平平平平均均均均数数数数差差差差数数数数的的的的平平平平均均均均数数数数等等等等于于于于总总总总体体体体平平平平均均均均数数数数的的的的差差差差数数数数,,,,样样样样本本本本平平平平均均均均数数数数差差差差数数数数的的的的方方方方差差差差等等等等于于于于两两两两样样样样本本本本平平平平均均均均数数数数方方方方差差差差除除除除以以以以各自样本容量之和各自样本容量之和各自样本容量之和各自样本容量之和。 如,从N(5,25)的总体中抽取n1=35的样本,从N(10,5)的总体中抽取n2=40的样本,则两样本平均数差数的平均数为-5方差为25/35+5/40=47/56三、样本平均数差数分布四、t 分布在在实际研究中,经常遇到实际研究中,经常遇到σσ 未知未知,且样本容量,且样本容量n不大的情不大的情况,这时若用况,这时若用s来代替来代替σσ其并不服从正态分布,而是服并不服从正态分布,而是服从具从具n-1自由度的自由度的t分布t分布标准差已知的样本平均数分布标准差已知的样本平均数分布u=t=总体方差未知或样本容量总体方差未知或样本容量n n小于小于3030时,标准离差的分布呈时,标准离差的分布呈t t分布四、t 分布对于不同的自由度,对于不同的自由度,t分布有不同的曲线分布有不同的曲线四、四、t 分布分布(1)(1)t分布曲线左右对称,围绕平均数分布曲线左右对称,围绕平均数μt =0 向向两侧递降两侧递降2))t分布受自由度分布受自由度df=n-1制约,每个制约,每个df都有一条都有一条t分布曲线分布曲线4))和和正态分布相比,正态分布相比,t分布的顶端偏低,尾部偏高,自由度分布的顶端偏低,尾部偏高,自由度df>30时,其曲线接近正态分布曲线,时,其曲线接近正态分布曲线,df→∝∝时则和正态分布曲时则和正态分布曲线重合。 线重合3))df小,小,t值离散程度大值离散程度大四、t 分布t分布曲线与横轴所围成的面积为分布曲线与横轴所围成的面积为1同同标准正态分布曲线一样,统计应用中最为关心的是标准正态分布曲线一样,统计应用中最为关心的是t分分布曲线下的面积(即概率P)与横轴布曲线下的面积(即概率P)与横轴t值间的关系值间的关系为为使用方便,统计学家编制了不同自由度使用方便,统计学家编制了不同自由度df下的下的t界值界值表在在相同的自由度相同的自由度dfdf时,时,t t值越大,概率值越大,概率P P越小在在相同相同t t值时,双尾概率值时,双尾概率P P为单尾为单尾概率概率P P的两倍dfdf增大,增大,t t分布接近正态分布,即分布接近正态分布,即t t值接近值接近u u值在在相同的相同的P P值下,随值下,随dfdf的增加,临界的增加,临界t t值减小四、t 分布t落于落于[- t0.05, + t0.05 ] 内的内的概率为概率为0.95t落于落于[- t0.01, + t0.01 ] 内的内的概率为概率为0.99置信度为5%和1%的置信度为5%和1%的t临界值t0.05((4))==2.776 t0.01((4))==4.604-2.776 +2.776五、 χ2分布df = n-1样本方差的分布五、 χ2分布概率密度函数概率密度函数概率累积函数概率累积函数五、 χ2分布χχ2 2分布是连续型变量的分布,每个不同的自由度都有分布是连续型变量的分布,每个不同的自由度都有一个相应的卡方分布曲线,所以其分布是一组曲线。 一个相应的卡方分布曲线,所以其分布是一组曲线五、 χ2分布特征χ2分布于区间[0,+∝ ),并且呈反J型的偏斜分布χ2分布的偏斜度随自由度降低而增大,当自由度df=1时,曲线以纵轴为渐近线随自由度df的增大, χ2分布曲线渐趋左右对称,当df>30时,卡方分布已接近正态分布123五、 χ2分布对于给定的对于给定的α(0<α<1)α(0<α<1),,称满足条件称满足条件 P{χP{χ2 2 >χ>χαα2 2(n)}=α(n)}=α的点的点 χχαα2 2(n)(n)为为χχ2 2分布的上分布的上αα分位点(右尾概率)分位点(右尾概率)χχ2 2分布是不对称的分布是不对称的表中表头的概率表中表头的概率αα是是χχ2 2大于表内所列大于表内所列χχ2 2值的概率值的概率df = 2P P((χχ2 2 ≧≧ 5.99 5.99)=)=0.050.05P P((χχ2 2 ≧≧ 9.21 9.21)=)=0.010.01P P((χχ2 2 ≧≧ 0.10 0.10)=)=0.950.95六、F 分布设从一正态设从一正态总体总体N(μ,σN(μ,σ2 2) ) 中中随机抽取样本容量随机抽取样本容量为为n1、、n2的两个独立样本,其样本方差为的两个独立样本,其样本方差为s12、、 s22,,则定义其比值:则定义其比值:此F值具有此F值具有s12的自由度的自由度df1=n1-1和和s22的自由度的自由度df2=n2-1。 样本方差比的分布六、F 分布FF分布是随自由度分布是随自由度dfdf1 1和和dfdf2 2进行变化的一组曲线进行变化的一组曲线FF分布的概率累积函数分布的概率累积函数六、F 分布FF分布的平均数分布的平均数μμF F=1 =1 ,F的取值,F的取值区间为区间为[0,+∝ [0,+∝ ))FF分布曲线的形状仅决定于分布曲线的形状仅决定于dfdf1 1和和dfdf2 2在dfdf1 1==1 1或或2 2时,时,F分布曲线呈严重倾斜的反向J型,当F分布曲线呈严重倾斜的反向J型,当dfdf1 1≧ 3≧ 3时,时,转为左偏曲线转为左偏曲线12六、F 分布对于给定的对于给定的α(0<α<1)α(0<α<1),,称满足条件称满足条件 P{P{FF> >FFαα(n(n11,,nn22)}=α)}=α的点的点 FFαα(n(n11,,nn22) )为F分布的上为F分布的上αα分位点(或临界值点)分位点(或临界值点)P P((FF ≧≧ 3.483.48))==0.050.05P P((FF ≧≧5.995.99))==0.010.01概率和概率分布概率和概率分布概率的基础知识概率的基础知识常见的理论分布常见的理论分布统计数的分布统计数的分布二项分布二项分布泊松分布泊松分布正态分布正态分布概率的概念概率的概念概率的计算概率的计算概率的分布概率的分布大数定律大数定律离散型变量离散型变量连续型变量连续型变量抽样与无偏估计抽样与无偏估计畅所欲言q u、t、F的计算公式?q 抽样分布有哪些主要类型,特点是什么?。












