统计学课件之计数资料常见分布
计数资料常见分布,所有统计方法的正确选择均取决于数据分布,正态分布(normal distribution) 二项分布(binomial distribution) 泊松分布(poisson distribution) 抽样研究及常见统计量分布 t分布(student t distribution) 卡方分布(chi-square distribution) F分布(F distribution),n重贝努利试验,在同一条件下独立重复n次试验,每次试验只有两个可能的对立结果,A与非A , 如成功与失败 , 其概率P(A)= , (0< <1) , 则称这一系列独立重复试验为n重贝努利试验(贝努利试验序列)。,n重贝努利试验的三个条件,(1)每次试验只有两个可能的对立结果,A与非A (2)每次试验的条件不变,即每次试验中,结果A发生的概率P(A)= (3)各次试验独立,即任一次试验结果与其它次试验结果无关。,二项分布(binomial distribution) 贝努利试验列中成功次数k的概率为: P(X=k)=Cnk k (1-)n-k (0<<1) , k=0 , 1 , ,n, 而Cnk k (1-)n-k二项式恰好是牛顿展开式(+(1-) n的项,故又称为二项分布。 二项分布是一种重要的离散型分布,由瑞士数学家J.Beknoulli 1713年提出,故亦称Beknoulli分布,记作XB( n , ),( n , )为参数。,当=0.5时,二项分布呈对称状态 ; 0.5时,图形右偏;对同一n, 越远离0.5,对称性越差; 当n足够大,且不太靠近0或1时,二项分布逼近正态分布;; 当n足够大,但很小时,如n100而0.9时,二项分布近似于泊松分布。,二项分布的性质 若XB( n , ) 则 X的总体均数 X的总体方差 X的总体标准差,样本率p的总体均数 样本率p的总体标准差,样本率p的总体标准差 但常未知,而用p作为的估计值,因此反映样本率抽样误差的统计量为,正态近似 当n足够大,与1-均不太小, 如:n 5 且n(1- ) 5,二项分布的应用,泊松分布(poisson distribution),一种重要的离散型分布,由法国数学家S.D.Poisson 1837年提出,故称为Poisson分布。 乃二项分布的另一种极限分布形式,即n趋于无穷,而趋于0时的分布。 常用于描述单位时间(或单位空间、容积)内某事件发生次数的分布。 一般应满足三条件:无重叠、无聚集、独立性,其概率函数P(X=k)= k=0, 1, 2, P(X=k)0,且,poisson分布的性质,1、数学期望E(X)=方差D(X)=; 2、当足够大(如20)时,Poisson分布逼近于正态分布; 3、如果相互独立的m个随机变量都服从Poisson分布,则它们之和仍服从Poisson分布,且其均数为k个随机变量的均数之和,这一性质称为Poisson分布的可加性。,生物医学领域中,不具有传染性、无终身免疫、无遗传性且发病率低的疾病,或者单位时间、空间、面积、容积等呈均匀分布的罕见事件发生次数等的概率分布符合Poisson 分布。例如, 每毫升水中的大肠杆菌数、每个立升气体中粉尘的计数、单位时间(如1 分钟)内放射性脉冲数、遗传缺陷、染色体畸变、一定人群中某患病极低的非传染性疾病的患病死亡人数等,均可视为Poisson 分布。,Poisson 分布的一个必要前提是各个独立事件发生的概率 不变。若n次观察互不独立、发生概率不等,则不能看成Poisson 分布。例如:SARS、禽流感、手足口病等传染性疾病首例出现后便成为传染源,会增加后续病例出现的概率;又如,污染的牛奶中细菌成集落存在、钉螺在繁殖期成窝状散布;等等,由于观察结果互不独立,也不服从Poisson 分布。,泊松分布的应用,