好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

概率与概率分布3课件.ppt

97页
  • 卖家[上传人]:枫**
  • 文档编号:570430222
  • 上传时间:2024-08-04
  • 文档格式:PPT
  • 文档大小:848KB
  • / 97 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第三章第三章 概率与概率分布概率与概率分布总体与样本的关系包括两个方面:一、由已知总体研究样本的分布规 律,即变量的概率分布;二、由所得到的样本去推断未知总 体,即统计推断概率与概率分布(3)课件 •通过研究样本去推断其所属的总体特征• 从同一总体中随机抽取样本,由于抽样的方式等影响,每次抽样的结果不完全相同因此,用不同的样本区推断同一总体将得出不同的结论这些结论有些可能是正确的,也有些可能是错误的• 因此,由某一个样本去推断总体,必须了解推断错误的可能性有多大?置信度有多高?这就有必要了解总体的分布,即从总体中进行抽样,各样本特征数与总体的特征数之间的关系即必须了解从总体到样本的关系概率与概率分布(3)课件 概率的基础知识概率的基础知识•事件、频率、概率• 自然界的各种现象按其因果关系分为确定性现象和非确定性现象两类•事件:统计学上事件是指研究对象发生或即将发生的现象,根据事件发生的可能性大小可分为三类:•1、必然事件:在一定条件下必定出现的现象, 通常以U表示如:小白鼠放置在充满co的容器中必然死亡•2、不可能事件:在一定条件下必定不出现的现象, 通常以V表示。

      如:正常的胎儿既是雄性又是雌性的事件• 必然事件和不可能事件都属于确定性现象•3、随机事件:也叫非确定性事件,在一定条件下可能出现也可能不出现的现象, 简称事件如:种子播种后发芽是可能事件• 随机事件属于非确定性现象概率与概率分布(3)课件 事件的相互关系事件的相互关系•一个事件与其他一个或多个事件之间发生的情况可分为:和事件、积事件、互斥事件、对立事件、独立事件、完全事件系等类型•和事件:事件A与事件B至少有一件发生而构成的新事件,记为A+B;(也叫并事件)•积事件:事件A与事件B同时发生而构成的新事件,记为A.B;(也叫交事件)•互斥事件:事件A与事件B不能同时发生,即A.B=V,称事件A与事件B互斥;(也叫互不相容事件)•对立事件:事件A与事件B必有一件发生,但不能同时发生,即:A+B=U, A.B=V,称事件A与事件B对立;•独立事件:事件A与事件B的发生没有关系,即事件A的发生不影响事件B的发生,反之依然,称事件A与事件B为独立事件;•完全事件系:在有多个事件中,事件之间两两互斥,而且每次试验中又必定发生其中之一,该多事件为完全事件系概率与概率分布(3)课件 概率的基础知识概率的基础知识•频率的概念及特征•概念:设事件A在n次重复试验中发生了m次,其比值n/m称为事件A发生的频率,记为: W(A) = m/n•根据频率的定义,可以发现:• 0 ≤ W(A) ≤ 1•特征:在试验条件相同的情况下,当重复试验的次数n无限增大时,A事件出现的频率逐步趋向稳定。

      概率与概率分布(3)课件 概率的基础知识概率的基础知识•概率及特征•概念:某事件A在n次重复试验中发生了m次,当重复试验的次数n不断增大时,事件A发生的频率W(A) 越来越接近某一确定值p,定义p为事件A发生的概率,记为: P(A)= p•一般情况下,某事件发生的概率p是很难得到的,通常以n充分大时事件A的频率作为该事件发生概率的近似值概率与概率分布(3)课件 概率的基本性质•必然事件的概率等于1;•不可能事件的概率等于0;•随机事件的概率介于0和1之间,即: 0≤p(A)≤1概率与概率分布(3)课件 概率论与统计学• 随机现象并非不可认识虽然个别的随机现象似乎是无规律的,但在研究大量的随机现象后能从中发现隐藏于其中的内在规律•概率论:研究偶然现象(随机现象)本身规律性的科学•统计学:基于实际观测结果,利用概率论得出的规律,揭示偶然性中所寄予(隐藏)的必然性的科学•两者的关系:概率论和统计学都是研究随机现象规律性的科学,概率论是统计学的基础,统计学是所得出的规律在各领域中的实际应用概率与概率分布(3)课件 概率计算法则概率计算法则•加法定理:•互斥事件的和事件的概率等于互斥事件的概率之和,P(A+B)=P(A)+P(B)•对立事件的概率之和等于1,• 即P(A)=1-P(B)•完全事件系的概率和等于1•乘法定理:•独立事件的积事件等于独立事件概率之积概率与概率分布(3)课件 条件概率•概念:在事件B已经发生的条件下,事件A发生的概率,记为P(A I B)• P(A I B)=P(AB)/P(B)概率与概率分布(3)课件 概率与概率分布(3)课件 贝叶斯公式•设事件B能且只能与A1,A2,A3…Ai…AK之一同时发生,那么在事件B发生的条件下,Ai发生的概率为:概率与概率分布(3)课件 实 例• 假定在中年男性人群中,肥胖者占20%,标准体重者占50%,低体重者占30%,这三类人群出现动脉硬化的概率分别为30%、10%和1%。

      现在从这个假设的男性人群中随机抽样,抽取的1人是动脉硬化患者,请问:这个被抽取的男性属于肥胖、标准体重和低体重组的概率是多少?概率与概率分布(3)课件 •解: 用B表示抽到动脉硬化患者的事件, 用A1表示抽到肥胖患者的事件, 用A2表示抽到肥胖患者的事件, 用A3表示抽到肥胖患者的事件,•根据贝叶斯公式:概率与概率分布(3)课件 随机变量的类型•描述可能事件通常用随机变量•直观地讲,随机变量就是试验中被测定的量可分为: 间断性随机变量间断性随机变量 和 连续性随机变连续性随机变量量•连续性随机变量:• 具有可量性的随机变量,其取值是连续的、无限的如植物的株高、叶面积等•间断性随机变量:• 具有可数性的随机变量,其取值是固定的、而且必须是以整数来表示如菌落的数、动物每胎的产仔数等概率与概率分布(3)课件 概率及概率分布概率及概率分布• 一个随机变量的所有可能取值就构成一个总体,总体中随机变量的取值不是杂乱无章,其取值遵循一定的规律,即取值有一定的概率性,是服从某一概率分布的•描述随机变量的概率分布有三种函数:•概率函数概率函数、概率密度函数概率密度函数、概率分布函数概率分布函数。

      通常•概率函数概率函数描述间断性随机变量间断性随机变量取值的规律,•概率密度函数概率密度函数描述连续性随机变量连续性随机变量取值的规律,•概率分布函数概率分布函数描述随机变量取值少于等于某值随机变量取值少于等于某值的规律,也叫累积分布函数累积分布函数概率与概率分布(3)课件 间断性随机变量的概率分布间断性随机变量的概率分布•概率函数的概念概率函数的概念:•设Y为某个间断性随机变量,其概率函数表述为: f(y)=P(Y=y)•式中: y为Y的某个可能取值, • P(Y=y)表示Y取值为y的概率•概率函数有以下性质:• f(y)≥0 ∑ f(y)=1概率与概率分布(3)课件 概率函数概率函数•例: 从盛有50粒黑豆和50粒黄豆的布袋中,每次随机抽取2粒豆子,观察后又放回布袋,规定取出的豆子为黄豆的次数为随机变量Y,试确定Y的概律函数•解题:这一随机抽样有三种可能结果:•1、抽出的两粒豆子都为黑豆,即Y=0;•2、抽出的两粒豆子都为黄豆,即Y=2;•3、抽出的两粒豆子一粒为黄豆,另一粒为 黄豆,即Y=1概率与概率分布(3)课件 概率函数概率函数•Y=0时,其概率•f(0)=第一粒为黑豆的概率第一粒为黑豆的概率××第二粒为黑豆的概率第二粒为黑豆的概率• =50%×50%=0.25•Y=2时,其概率•f(2)=第一粒为黄豆的概率第一粒为黄豆的概率××第二粒为黄豆的概率第二粒为黄豆的概率• =50%×50%=0.25•Y=1时,其概率•f(1)= 第一粒为黄豆的概率第一粒为黄豆的概率××第二粒为黑豆的概率第二粒为黑豆的概率• + + 第一粒为黑豆的概率第一粒为黑豆的概率××第二粒为黄豆的概率第二粒为黄豆的概率• = 50%×50%+ 50%×50%• = 0.25+0.25• = 0.5概率与概率分布(3)课件 连续性随机变量的概率分布连续性随机变量的概率分布•概率密度的概念概率密度的概念:设连续性随机变数为Y,• 由于连续性随机变数在任一点的取值的概率为零,因此只能考虑随机变数在某一区间的概率,设区间长度为△y 则•Y 在(y,y+△y)内的概率为P( y<Y<y+△y ),•当△y→0时,•称为连续性随机变数Y的概率密度函数。

      概率与概率分布(3)课件 随机变量的期望与方差随机变量的期望与方差•描述概率分布特征的数字称为总体特征数包括: 随机变量的数学期望、方差 和 各阶矩•随机变量的期望(也叫数学期望):是指试验中期望的随机变量的取值,即理论平均值•随机变量的方差Var:是度量随机变量取值的变异程度的指标,就是总体方差•间断性随机变数X的期望•间断性随机变数X的方差概率与概率分布(3)课件 总体原点矩和总体中心矩•记随机变量的k阶原点矩为:•记随机变量的k阶中心矩为:•从中不难看出:随机变量的一阶原点矩就是数学期望,即平均数,一阶中心矩为零•二阶中心矩为方差概率与概率分布(3)课件 大数定律大数定律•事件A发生的频率与其概率的关系:•当重复试验的次数n逐步增大,增大到充分大时,事件A发生的频率W(A)可以代替概率P(A),W(A)与P(A)的关系实际上就是样本统计数与总体参数的关系频率W(A)是统计数,概率P(A)是参数•为何可以用W(A)代替P(A),这是大数定律起作用的缘故概率与概率分布(3)课件 大数定律的类型•概念:指概率论中用来描述大量随机现象平均结果稳定性的一系列定律的总称常见的有贝努力大数定律和辛钦大数定律。

      •贝努力大数定律:设m 是 n次独立试验中事件A出现的次数,p是事件A在每次试验中出现的概率,对于一个任意小的正数ε,有如下关系:概率与概率分布(3)课件 解读贝努力大数定律• 当试验条件不变时,重复次数n接近无限大时事件A发生的频率W(A)与其理论概率P(A)的差值必定小于一个任意小的正数ε,即W(A)与P(A)可以基本相等,这几乎是一个必然发生的事件,即P=1概率与概率分布(3)课件 几种常见的理论分布•间断性随机变量:• 二项分布、泊松分布;•连续性随机变量:• 正态分布概率与概率分布(3)课件 二项总体二项总体•二项总体:生物学试验中常出现一些由“非此即彼”事件个体,如:种子要么能发芽、要么不能发芽;打农药后虫子要么死亡、要么不死亡;动物产仔要么是雄性、要么是雌性,饲养的动物要么是健康的、要么是不健康的等等这类事件构成的总体叫二项总体•为便于观测研究,常给“此事件”以观测值为1,其发生概率记为p,常给“彼事件”以观测值为0,其发生概率记为q•因此,二项总体也叫0-1总体其中,p+q=1概率与概率分布(3)课件 二项分布二项分布•从二项总体中随机抽取一个容量为n的样本,观测每次抽取的结果会发现:•1、每次抽取只有两个对立的结果,记作A和 A 发生的概率为p, 发生的概率为q; 2、每次抽取都具有重复性和独立性,即每次试 验条件不变,且在每次试验中A发生的概率都是p。

      设Y表示在n次试验中A发生的次数,则Y是一个间断性随机变数,其可能取值为0、1、2、...、n, 其概率函数为:概率与概率分布(3)课件 二项分布的概率函数二项分布的概率函数• 称f(y)为随机变量Y的二项分布,记为:• x~B(n,p) • 二项分布是间断性变量的一种重要理论分布概率与概率分布(3)课件 二项分布的概率计算二项分布的概率计算•例:有雌雄各半的100只动物,从该总体中进行抽样试验,每次抽样记录抽取动物的性别后放回,共做了10次抽样,试问:这10次抽样中,雄性动物出现3次的概率及不多于3次的概率?•首先,我们看看这种抽样是否符合二项分布,第一,每次抽样是否独立,第二,每次抽样出现同样结果的概率是否恒定•这次抽样是放回式抽样,每次抽样是独立的,互不影响抽样结果;同时,每次抽样抽到雄性动物的概率都是50%,因此,这次抽样是符合二项分布的,可以用二项分布的概率函数来计算概率与概率分布(3)课件 概率与概率分布(3)课件 概率与概率分布(3)课件 •10次抽样中出现3只是雄性的概率是:0.1171876•10次抽样中抽取的雄性动物不多于3只的概率是•(0.0009766+0.0097656+0.0439453+0.1171876)• = 0.1718751概率与概率分布(3)课件 例 二•某家兔品种杂交试验:• 棕色正常毛 X 黑色短毛• (bbRR) (BBrr)• ↓ •F1: BbRr X BbRr• ↓ 9/16 B_R_ : 3/16 B_rr : 3/16 bbR_ : 1/16 bbrr•问:最少需要多少F2代家兔,才能以99%的概率得到1只棕色短毛兔?概率与概率分布(3)课件 •设至少n只F2代家兔中才能以99%的概率得到1只棕色短毛家兔。

      •F2为非棕色短毛家兔出现的概率为: φ=15/16,•F2为棕色短毛家兔出现的概率为:1-φ=1/16 •根据二项分布: n 只F2代群体家兔中,出现y只bbrr的概率可由二项分布[φ+(1-φ)]的n次幂求出,即:概率与概率分布(3)课件 •在上式的展开式中,只有φ的n次幂项不含bbrr,其余项都相应地含有一只或多只bbrr的家兔,因此,n值可由下式计算出:• •计算得出: n =71.4, 即至少需要72只F2代才能以99%的概率得到1只bbrrbbrr概率与概率分布(3)课件 二项分布的特征二项分布的特征•由二项分布的概率函数我们发现其概率是由n和p两个参数决定(因为q=1-p),所以:• 1、当p值较小且n不大时,分布是偏倚的但随着n的增大 ,分布逐渐趋于对称;• 2、当p值趋于0.5时,分布趋于对称;• 3、在n较大,np、nq较接近时,二项分布接近于正态分布;当n→∞时,二项分布的极限分布是正态分布 概率与概率分布(3)课件 n值不同的二项分布比较值不同的二项分布比较p值不同的二项分布比较值不同的二项分布比较二项分布的形状二项分布的形状横轴为横轴为x,纵轴为纵轴为f(x)概率与概率分布(3)课件 二项分布曲线概率与概率分布(3)课件 二项分布曲线概率与概率分布(3)课件 二项分布的参数•若随机变量x服从二项分布,则有二项分布的总体平均数(次数)为:概率与概率分布(3)课件 泊松分布•在生物学研究中,通常遇到这种二项事件,即某种事件出现的概率很小( φ→0 ),而样本容量或试验次数却很大(n →∞)。

      •如:田间小区内变异植株的计数,作物种子的杂草种子的计数,由突变导致的遗传患者的分布等•这时的二项分布就变成一种特殊的分布,即泊松分布概率与概率分布(3)课件 泊松分布的概率函数概率与概率分布(3)课件 泊松分布的特征•泊松分布的性状由参数λ所确定,当λ较小时,泊松分布时偏倚的;随着λ增大,分布逐渐对称当λ无限增大时,泊松分布逼近正态分布N(λ, λ),当λ=20时,泊松分布已和正态分布非常接近当λ=50时,泊松分布已和正态分布没有区别概率与概率分布(3)课件 泊松分布曲线概率与概率分布(3)课件 •泊松分布举例•某小麦品种在田间出现自然变异植株的概率为0.0045,试计算:•(1)调查100株小麦植株,获得2株或2株以上的变异株的概率有多大?•(2)期望以99%的概率获得1株或1株以上的变异植株,在田间至少应调查多少株小麦植株?概率与概率分布(3)课件 •解:因为田间出现自然变异植株的概率为0.0045,而且调查变异植株的样本量很大,调查的小麦植株是正常株和自然变异株是二项事件,因此符合泊松分布•计算:n=100, p=0.0045•先求λ: λ=np=0.45•代入泊松分布的概率函数公式:概率与概率分布(3)课件 概率与概率分布(3)课件 其它离散型变量的概率分布•生物学研究,特别是生态学研究中,还会经常遇到的二项分布有:•几何分布、超几何分布、矩形分布和负二项分布。

      •超几何分布• 从一个包含两种不同类型个体的有限总体中做非放回式抽样,在n次抽样中,抽中某种类型的个体数服从超几何分布,其概率函数为:概率与概率分布(3)课件 概率与概率分布(3)课件 举例•如:在野生动物资源考察时,通常需要了解野生动物群体的大小常用的办法是:•先捕捉一定数目的动物,做上标志,把它们放回群体中,然后再捕捉第二次,计数其中有标志的动物数,根据以上资料估计群体大小第二次捕捉到的有标志的动物数服从超级几何分布的随机变量其计算公式为:概率与概率分布(3)课件 概率与概率分布(3)课件 正态分布正态分布•也叫常态分布常态分布或高斯分布高斯分布,是由法国数学家拉普拉斯(Laplace)和德国数学家高斯(Gauss)研究出来的一种理论分布概率与概率分布(3)课件 正态分布的定义正态分布的定义 若连续型随机变量x的概率分布密度函数为•其中μ为平均数, 为方差,则称随机变量x服从正态分布(normal distribution)(normal distribution), •记为x~N(μ, ) 概率与概率分布(3)课件 •服从正态分布的随机变量的分布密度曲线 正态分布的密度曲线正态分布的密度曲线概率与概率分布(3)课件 正态分布的特征正态分布的特征•总体特征总体特征:两头少,中间多,两侧对称两头少,中间多,两侧对称。

      •1 1、正态分布密度曲线是单峰、对称的悬钟、正态分布密度曲线是单峰、对称的悬钟 形曲线,对称轴为形曲线,对称轴为x x =μ=μ;;•2 2、、f(x)f(x)在在x x=μ=μ处达到极大,极大值;处达到极大,极大值; •3 3、、f(x)f(x)是非负函数,以是非负函数,以x x轴为渐近线,分布轴为渐近线,分布 从从-∞-∞至至+∞+∞;;•4 4、曲线在、曲线在x x=μ±σ=μ±σ处各有一个拐点,即曲线处各有一个拐点,即曲线在在(-∞,μ-σ)(-∞,μ-σ)和和(μ+σ,+∞) (μ+σ,+∞) 区间上是下凸区间上是下凸的,在的,在[μ-σ,μ+σ][μ-σ,μ+σ]区间内是上凸的;区间内是上凸的; 概率与概率分布(3)课件 •5、正态分布有两个参数,即平均数μ和标准差σ• μ是位置参数,当σ恒定时,μ愈大,则曲线沿x轴愈向右移动;反之,μ愈小,曲线沿x轴愈向左移动概率与概率分布(3)课件 •σ是变异度参数,当μ恒定时,σ愈大,表示x的取值愈分散, 曲线愈“胖”;σ愈小,x的取值愈集中在μ附近,曲线愈“瘦”。

      概率与概率分布(3)课件 •6、分布密度曲线与横轴所夹的面积为1,即:概率与概率分布(3)课件 标准正态分布标准正态分布 当μ=0, σ=1时的正态分布叫做标准正态分布, 随机变量u服从标准正态分布,记作u~N(0,1) 分布密度曲线如下图标准正态分布密度曲线概率与概率分布(3)课件 正态分布的标准化转化正态分布的标准化转化•对于任何一个服从正态分布N(μ, )的随机变量x都可以通过标准化变换:• u=(x-μ)/σ •将其变换为服从标准正态分布的随机变量u•u称为标准正态变量或标准正态离差概率与概率分布(3)课件 正态分布表正态分布表 •根据标准正态分布的分布函数 ,•对不同的u值编成函数表,称为正态分布表(每本统计学教材上都有),从中可查到u在意一个区间内取值的概率 概率与概率分布(3)课件 其它几种连续型变量的概率分布•生物学研究中还会遇到以下几种连续型变量的概率分布:•指数分布、γ(gama)分布、β分布、威布尔分布 和 均匀分布等概率与概率分布(3)课件 指数分布•生物学研究常用指数分布描述生物的生长过程,指数分布的密度函数为:λ为参数•分布函数为:λ=1/μ•指数分布(Exponential distribution)是一种连续概率分布。

      其特征数为:E(Y)=μ,σ=μ,偏度为2,峭度为6分布图形极不对称,在Y较高的一端拖了一个长尾巴概率与概率分布(3)课件 指数分布图概率与概率分布(3)课件 指数分布图概率与概率分布(3)课件 正态分布的概率计算•正态分布的概率累积函数记作F(μ):它是变量u小于某一定值Ui的概率,概率与概率分布(3)课件 由于正态分布应用具有广泛性,因此统计学上计算好实际需要的各个标准正态分布的F(u)值,列成一个表,即正态分布的累积函数F(u)值表见附录表1U是各个正态分布标准化后的标准离差 任意一个服从正态分布的随机变量x,其取值在某个区间的概率,均可根据其取值的上下限进行标准化转换,即计算出随机变量x的上下限的标准离差,就可利用附表计算出它在该取值区间的概率值概率与概率分布(3)课件 几个特殊的标准离差及其概率•由于标准正态分布是一个对称性分布曲线,因此,在离对称轴两侧等距的标准离差下,即随机变量的取值上下限-a=b时,其累积概率为:• 1-2P(x≤(a-μ)/σ)•根据附表1:概率与概率分布(3)课件 •虽然理论上讲,标准正态离差的取值为 (-∞,+∞),但│u│>2.58的概率只有1%,│u│>1.96的概率只有5%,即随机变量的取值在(μ±1.96σ)和(μ±2.58σ)范围内时包含了95%和99%的变量。

      双尾概率: 计算│x- u│>1.96σ和 │x- u│>2.58σ的概率为双尾概率 即左尾概率与右尾概率之和单尾概率:计算(x- u)<-1.96σ和(x- u)>1.96σ的概率为单尾概率 (x- u)<-1.96σ的概率为左尾概率, (x- u)> 1.96σ的概率为右尾概率概率与概率分布(3)课件 正态分布的双侧与单侧临界值•附表一给出了标准正态分布累积分布函数的值,即对于给定的u值,列出了U

      现从这个总体中随机抽取含量为n的样本,样本平均数记为 可以设想,从原总体中可抽出很多甚至无穷多个含量为n的样本由这些样本算得的平均数有大有小,不尽相同, 与原总体平均数μ相比往往表现出不同程度的差异这种差异是由随机抽样造成的,称为抽样误差•显然,样本平均数也是一个随机变量,其概率分布叫做样本平均数的抽样分布 概率与概率分布(3)课件 样本平均数特征数样本平均数特征数•由样本平均数构成的总体称为样本平均数的抽样本平均数的抽•样总体样总体,也有其平均数和标准差,分别记为: 和 是样本平均数抽样总 体的标准差,简称标准误,,它表示平均数抽样误差的大小 概率与概率分布(3)课件 • 若随机变量x服从正态分布N(μ, );• 是由X总体得来的随机样本,则•统计量 =Σx/n 的概率分布也是正态分布, •且有 =μ, , 即服•从正态分布N(μ, /n) 样本平均数分布的特征样本平均数分布的特征概率与概率分布(3)课件 中心极限定理中心极限定理 •若被抽样总体不是正态总体(该总体平均数是•μ,方差是 ),当样本容量n 不断增大•时,从该总体抽样其样本平均数的分布也越来•越接近正态分布,且具有平均数为μ,方差为 • /n 。

      这称为中心极限定理 概率与概率分布(3)课件 样本平均数的标准化样本平均数的标准化•在计算样本平均数出现的概率时,为便于利用标准正态分布表,样本平均数要进行标准化:标准化计算公式为:•如果变量是正态的或近似正态的,则标准化变量u服从或近似服从标准正态分布N(0,1),可在正态分布表上查u值相应的概率概率与概率分布(3)课件 Example•已知50~60岁成年男性人群的血液胆固醇含量的平均值为200mg/dl,标准差为20mg/dl.试问:•①这一人群血液胆固醇含量低于250mg/dl的比例?•②这一人群血液胆固醇含量高于225mg/dl的比例?概率与概率分布(3)课件 Example•从该总体中抽取100名男性,血液中胆固醇含量低于204m g/dl的概率?•解:因为总体服从正态分布,且总体方差已知,因此,根据样本平均数的抽样分布规律,样本的平均数和样本的方差分别为:概率与概率分布(3)课件 Example•如果有25人严格吃素,他们血液中胆固醇平均含量188mg/dl,请问是否可以说他们血液中胆固醇含量显著偏低吗(α=0.05)?概率与概率分布(3)课件 总体标准差未知时的样本平均数分布总体标准差未知时的样本平均数分布----t分布分布•总体方差未知时,从总体中抽样,当样本容量大时(n>30) ,可用样本的方差估计总体方差;当样本容量小时(n<30),如果仍用样本方差去估计总体方差,则样本的平均数不服从正态分布,而是服从具有 n-1 自由度的t分布。

      • • 为样本标准误差概率与概率分布(3)课件 t分布的特征•t分布的平均数和标准差为:• (df>1), • (df>2) •不同自由度的不同自由度的t t分布密度曲线分布密度曲线概率与概率分布(3)课件 • 1、t分布受自由度的制约,每一个自由度都有一• 条t分布密度曲线• 2、t分布密度曲线以纵轴为对称轴,左右对称,• 且在t=0时,分布密度函数取得最大值• 3、与标准正态分布曲线相比,t分布曲线顶部略• 低,两尾部稍高而平df越小这种趋势越明显• df越大,t分布越趋近于标准正态分布• 4、n>30时,t分布与标准正态分布区别很小; • n >100时,t分布基本与标准正态分布相同;• n→∞时,t 分布与标准正态分布完全一致t t分布的特征分布的特征概率与概率分布(3)课件 分布分布•概概 念念: 读作卡方,是度量实际观察次数与理论次数偏离程度的一个统计量 。

      其表述公式为:•其中:A 表示实际观测次数,T表示理论次数•卡方越小,表明实际观察次数与理论次数越接近;卡方为零,表示两者完全吻合;卡方越大,表示两者相差越大 概率与概率分布(3)课件 • 设有一平均数为μ、方差为 的正态总体 • 现从此总体中独立随机抽取k个样本容量为n的随机样本,构成样本的方差分布:• • 在研究样本方差分布时,由于其带有度量单位,因此将其进行标准化,得到不到任何单位的纯数,标准化的方法如下:• 概率与概率分布(3)课件 样本方差的分布样本方差的分布•标准化后的纯数是服从自由度为(n-1)的卡方分布其密度函数为:概率与概率分布(3)课件 样本方差分布的特征数概率与概率分布(3)课件 概率与概率分布(3)课件 卡方分布的特征卡方分布的特征•1、分布是由正态总体随机抽样得来的一种连续型随机变量的分布显然,≥0,即的取值范围是[0,+∞; •2、分布密度曲线是随自由度不同而改变的一组曲线随自由度的增大,曲线由偏斜渐趋于对称; •3、当自由度df较小时,样本方差的分布明显偏离正态,曲线右倾。

      概率与概率分布(3)课件 卡方分布密度曲线卡方分布密度曲线几个自由度的概率分布密度曲线概率与概率分布(3)课件 卡方分布表•为了便于计算,统计学家列出了卡放分布•的上侧临界值(右尾值)表,见教材附表4.•附表4左侧竖栏位自由度,上侧横栏为卡方右尾概率值,表右下方所列为相应自由度和右尾概率下的卡方值•α=0.05时,df=9的卡方值为16.92•若要查下侧(左尾)临界值,只要查1-α时的临界值如左尾值α=0.05时,df=9的卡方值为df=9,右尾α=1-0.05时的卡方值3.33.概率与概率分布(3)课件 抽样分布的注意事项抽样分布的注意事项•1 1、当总体方差已知时,无论是从正态总体或非、当总体方差已知时,无论是从正态总体或非正态总体中抽样,只要样本容量足够大,样本平正态总体中抽样,只要样本容量足够大,样本平均数分布均服从正态分布,均数分布均服从正态分布,•2 2、当总体方差未知时,从正态总体或非正态总、当总体方差未知时,从正态总体或非正态总体中抽样,如果样本容量较小,样本平均数分布体中抽样,如果样本容量较小,样本平均数分布均服从自由度为均服从自由度为n-1n-1的的t t分布,分布,t t分布也是一种对分布也是一种对称分布,随着自由度的增大,称分布,随着自由度的增大,t t分布近似正态分分布近似正态分布。

      布•3 3、从正态总体中抽样,样本方差服从卡方分布从正态总体中抽样,样本方差服从卡方分布卡方分布是非对称分布卡方分布是非对称分布•4 4、从非正态总体抽样,样本方差不能用卡方分、从非正态总体抽样,样本方差不能用卡方分布描述概率与概率分布(3)课件 两个方差已知总体平均数差数的抽样分布•从两个相互独立的正态总体•中分别抽取容量为n1 和 n2的样本,分别求出从这两个总体N1和N2抽取的样本的平均数与标准差•研究•当两个总体标准差已知时,其样本平均数和与差的分布也服从正态分布概率与概率分布(3)课件 其特征数为概率与概率分布(3)课件 两个方差未知总体平均数差数的抽样分布•当两个服从正态分布的总体标准差未知但相等时,其样本平均数和与差的分布服从自由度为对方df1= n1-1 和 df2=n2-1的t分布其统计量 t 为:概率与概率分布(3)课件 F F 分布分布•概念:设从两正态总体 中分别抽取样本含量分布为 的两个独立样本,其样本方差之比定义为F,则有:•F具有:• ,•当对这两个正态总体在特定的自由度下进行一系列抽样,则所有可能的F值就构成一个F分布。

      概率与概率分布(3)课件 F F分布的特征分布的特征•1、 F的取值区间为(0,+∝);•2、 F分布曲线的形状仅决定于两个自由度,df1=1 或2 时,F 分布曲线呈严重倾斜的反向J型,当df1≥3时,转为左偏曲线•3、 F分布的平均数为1概率与概率分布(3)课件 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.