
分布与总体均数的估计.ppt
21页单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,t,分布与总体均数的估计,t,分布与总体均数的估计,哥塞特,(,W.S.Gosset,,,1876,1937),1908,年,哥塞特首次以“学生”,(,Student,),为笔名,在,生物计量学,杂志上发表了“平均数的概率误差”由于这篇文章提供了“学生,t,检验”的基础,为此,许多统计学家把,1908,年看作是统计推断理论发展史上的里程碑t,分布,戈塞特:,t,分布与小样本,由于“有些实验不能多次地进行”,从而“必须根据少数的事例(小样本)来判断实验结果的正确性”,小样本思想,:,t,分布与总体均数的估计,t,分布,t,分布与总体均数的估计,t,分布,t,分布与总体均数的估计,t,分布,t,分布与总体均数的估计,t,分布曲线是单峰分布,以,0,为中心,左右两侧对称,,曲线的中间比标准正态曲线(,u,分布曲线)低,两侧翘得比标准正态曲线略高t,分布曲线随自由度,而变化,当样本含量越小(严格地说是自由度,=n-1,越小),,t,分布与,u,分布差别越大;当逐渐增大时,,t,分布逐渐逼近于,u,分布,当,=,时,,t,分布就完全成正态分布。
t,分布曲线是一簇曲线,而不是一条曲线t,分布下面积分布规律:查,t,分布表t,分布曲线的特征,t,分布,t,分布与总体均数的估计,t,分布,t,分布与总体均数的估计,t,分布,t,分布与总体均数的估计,t,分布,t,分布与总体均数的估计,t,分布,t,分布与总体均数的估计,总体均数的估计,统计学中的统计推断包括两个重要的方面:一是利用样本统计量的信息对相应总体参数值做出推断,如用样本均数估计总体均数,用样本标准差,S,估计总体标准差等,称之为估计另一个是利用样本统计量来推断我们是否接受一个事先的假设,称之为假设检验本章只讨论参数估计,假设检验将在下一章中讨论而参数估计又分为,点估计与区间估计t,分布与总体均数的估计,总体均数的估计,t,分布与总体均数的估计,点估计,总体均数的点估计,(point estimation),就是用样本均数来直接地估计总体均数,即这种方法比较简单,由于没有考虑到抽样误差,只适合大样本资料的统计推断区间估计,总体均数的区间估计,(interval estimation),是利用样本信息给出一个区间,并同时给出重复试验时该区间包含总体均数的概率即按预先给定的概率(1-,),估计包含未知总体参数的范围。
该范围通常称为参数的可信区间(,confidence internal,CI)可信区间的确切含义是指:有1-,(,如95%)的可能可信区间包含总体参数可信区间通常由两个数值即可信限(,confidence limit),构成其中较小值称为下限(,lower limit),,较大的值称为上限(,upper limit)总体均数的估计,t,分布与总体均数的估计,总体标准差未知时 用样本标准差,S,作为的估计值计算标准误,按,t,分布原理,总体均数的估计,t,分布与总体均数的估计,总体标准差未知但,n,足够大时,用正态分布原理估计:,总体均数的估计,t,分布与总体均数的估计,总体标准差已知时,用正态分布原理估计:,标准误愈小,,估计总体均数可信区间的范围也愈窄,说明样本均数与总体均数愈接近,对总体均数的估计也愈精确;,反之,标准误愈大,,估计总体均数可信区间的范围也愈宽,说明样本均数距总体均数愈远,对总体均数的估计也愈差总体均数的估计,t,分布与总体均数的估计,(,1,),统计意义:从总体中作大数次随机抽样,有,95%,求得的可信区间包含总体均数并不是做一次抽样求得可信区间包括,的概率是,0.95,,对一次抽样而言只有两种可能,要么可信区间包含,,要么不包含,,即可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概率可言。
所谓,95,的可信度是针对可信区间的构建方法而言的其涵义是:如果重复,100,次抽样,每次样本含量均为,n,,每个样本均构建可信区间,则在此,100,个可信区间内,理论上有,95,个包含总体均数,而有,5,个不包含总体均数2,)两个要素:准确度(,accuracy,)即,1-,,,即可信区间包含的概率的大小,一般而言概率越大越好,精密度(,precision,),,反映区间的长度,区间的长度越窄,估计的精密度越好,反之越差即区间的长度3,)与医学正常值范围不同,总体均数的估计,t,分布与总体均数的估计,在样本含量一定的情况下,二者是相互矛盾的,若考虑提高准确度(即减小,,增大或),则区间变宽,精密度下降因而在实际中不能笼统地认为,99%,的可信区间好于,95%,的可信区间,而是需要兼顾二个要素在通常情况中,以,95%,的可信区间较为常用在可信度固定的前提下,要提高精密度的唯一方法是扩大样本含量准确度与精密度的矛盾关系:,总体均数的估计,t,分布与总体均数的估计,(,3,)可信度与可信区间,:,总体均数的估计,t,分布与总体均数的估计,(,3,)可信度与可信区间,:,总体均数的估计,t,分布与总体均数的估计,(,4,)可信区间与医学参考值的区别,:,总体均数的估计,。
