
多元正态分布均值向量和协差阵的检验(共45页).ppt
44页第三章 多元正态分布均值向量和协差阵的检验2021/12/91第三章 多元正态分布均值向量和 协差阵的检验&第一节 均值向量的检验&第二节 协差阵的检验2021/12/92补充:到底什么是假设检验?让我们先看一个例子2021/12/93生产流水线上罐装可乐不断地封装,然后装箱外运 怎么知道这批罐装可乐的容量是否合格呢?把每一罐都打开倒入量杯, 看看容量是否合于标准? 罐装可乐的容量按标准应在350毫升和360毫升之间2021/12/94每隔一定时间,抽查若干罐 如每隔1小时,抽查35罐,得35个容量的值X1,X35,根据这些值来判断生产是否正常这就产生两种可能(假设):通常的办法是进行抽样检查生产正常?生产不正常?2021/12/95这就需要根据X1, X35的样本信息,检验上述的两个假设哪个正确:H0:称H0为原假设(或零假设) 它的对立假设是:H1:称H1为备选假设(或对立假设)生产正常生产不正常2021/12/96那么,如何判断原假设H0 是否成立呢?由于 是正态分布的期望值,它的估计量是样本均值 ,因此可以根据 与 的差距 来判断H0 是否成立当 时,可以认为H0是成立的;当 时,应认为H0不成立,即生产已不正常。
2021/12/97怎么来确定?合理的界限在何处?应由什么原则来确定?小概率原则:小概率事件在一次试验中基本上不会发生2021/12/98下面我们用一例说明这个原则这里有两个盒子,各装有100个球小概率事件在一次试验中基本上不会发生99个1个一盒中有99个红球和1个白球另一盒中装有99个白球和1个红球99个2021/12/99 ?现从两盒中随机取出一个盒子,问这个盒子里是白球99个还是红球99个?我们不妨先假设:这个盒子里有99个白球现在我们从中随机摸出一个球,发现是此时应该如何判断这个假设是否成立呢?2021/12/910假设其中真有99个白球,摸出红球的概率只有 ,Y这是小概率事件小概率事件在一次试验中竟然发生了,不能不使人怀疑所作假设的正确性,因此可以认为这个盒子应该不是装有99个白球的那个盒子Y这个例子中所使用的推理方法,称为“带概率性质的反证法”,或“概率反证法” 1/1002021/12/911在假设检验设检验 中,称这这个小概率为为显显著性水平,用 表示 的选择选择 要根据实际实际 情况而定常取u假设检验所以可行,其理论背景即为“小概率原理”假设检验的理论依据:2021/12/912现在回到我们前面罐装可乐的例中:在提出原假设H0后,如何作出接受和拒绝H0的结论呢? 罐装可乐的容量按标准应在350毫升和360毫升之间。
一批可乐出厂前进行抽样检查,现抽查了n罐,测得容量为X1 , X2 ,Xn,问这一批可乐的容量是否合格?可乐的假设检验2021/12/913提出假设: 假定 已知,构造检验统计量z: 对给定的显著性水平 ,可以在N(0,1)表中查到分位点的值 ,使由原来观察大小,转变为观察 的大小2021/12/914也就是说,“ ”是一个小概率事件故我们可以取拒绝域为: 如果由样本值算得该统计量的实测值落入区域 ,则拒绝H0 ;否则,不能拒绝H0 拒绝域如果H0 是对的,那么衡量差异大小的某个统计量落入红色区域 (拒绝域) 是个小概率事件也就是说, H0 成立下的小概率事件发生了,那么就认为H0不可信而否定它否则,我们就不能否定H0 (只好接受它)接受域拒绝域从小概率的角度看:2021/12/915&其基本思想和步骤均可归纳为:第一,提出待检验的假设H0和H1;第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)2021/12/916第一节 均值向量的检验 &单一变量检验 的回顾及HotellingT2分布&一个正态总 体均值向量的检验&两个正态总 体均值向量的检验&多个正态总 体均值向量的检验2021/12/917&单一变量假设检验的内容:提出假设构造检验统计量 (总体方差已知时) 判断:根据显著水平 确定临界值 ,当 落在拒绝域,接受备择假设,否则接受原假设。
一、单变量假设检验及Hotelling T2分布2021/12/918&当 未知时,用 (3.2)作为 的估计量,构造检验统计量: (3.3)判断,根据显著水平 ,确定临界值 ,当 ,落入拒绝域,接受备择假设;否则接受原假设 2021/12/919&(3.3)式可以表示为 (3.4)&定义3.1 设 , 且 与 相互独立, ,则称统计量 的分布为非中心HotellingT2分布,记为 当 时,称 服从(中心)HotellingT2 分布威沙特分布(Wishart)2021/12/920注意:F分布和t 分布有如下关系:&设X和Y是相互独立的服从卡方分布的随机变量,自由度分别为f 1,f 2,则称随机变量 &设X是标准正态变量,Y是自由度为v的卡方变量,且X和Y相互独立,则称随机变量2021/12/921&若 , 且 与 相互独立,令 ,则 &这表明,将HotellingT2统计量乘上一个适当的常数后,便成为F统计量,从而可利用F分布来进行推断实践中,常用上式给出的F统计量来代替HotellingT2统计量进行推断3.5)因此:HotellingT2与F分布的关系:2021/12/922&在一元正态总体的情况下,若&一元统计中样本方差 是 的估计,有 注意:Wishart分布(一元 分布的推广)2021/12/923&定义2.10 设 且相互独立,则由 组成的随机矩阵: 其中,& 若 且相互独立,则样本离差阵2021/12/924二、一个正态总体均值向量的检验&设 是来自p维正态总 体 的样本,且 , 。
2021/12/925(一)协差阵 已知时均值向量的检验& &假设 成立,检验统计 量为 (3.6)&给定检验水平 ,查 分布表找出临界值 ,&判断:若 ,则接受备择假设;否则接受原假设)nc;2p2c4=n10=n20=n02021/12/926&注意: 其中,&利用的是p维随机向量二次型的结论之一: 设 ,则 ,其中 2021/12/927(二)协差阵 未知时均值向量的检验& &假设 成立,检验统计 量为 其中, &给定检验水平 ,查F 分布表,可确定出临界值 .&判断:若 ,则接受备择假设,否则接受原假设3.7)()21,ffxp()50,1021=ff()10,1021=ff()4,1021=ffx02021/12/928例题:2021/12/929样本离差阵2021/12/930三、两个正态总体均值向量的检验(一)当协协差阵阵相等时,两个正态总体均值向量的检验&设 , ,为来自p 维正态总体 的容量为n的样本;& , ,为来自p维正态总体 的容量为 的样本两组样组样 本相互独立,且 2021/12/9311.针对有共同已知协差阵的情形& &假设 成立,检验统计 量为 (3.8)&给定显著水平 ,查 分布表确定临界值 。
判断:若 ,则接受备择假设 ;否则接受原假设两组样本独立2021/12/9322针对有共同的未知协差阵的情形&提出假设:& 构造检验统计 量 (3.9)&给定显著性水平 ,查F 分布表 确定临界值 &判断:若 ,则接受备择假设;否则接受原假设 2021/12/933例题:2021/12/9342021/12/9352021/12/936 (二)协差阵不等时,两个正态总体均值向量的检验(两总体协差阵未知)设 , ,为来自p 维正态总体 的容量为n的样本;& , ,为来自p维正态总体 的容量为 的样本两组样组样 本相互独立,且 ,2021/12/9371针对n=m 的情形& 令 &构造检验统计 量为 (3.10) 2021/12/938令 &构造检验统计 量为 2针对针对 nm 的情形(假设设nm 且两总总体协协差阵阵相差不大时时)2021/12/939第三节 协差阵的检验&一个正态总体协差阵的检验&多个协差阵相等检验2021/12/940一、一个正态总体协差阵的检验&设 来自p 维正态总体 的样本, 未知,且 提出假设用似然比方法可构造出检验统计 量为: (3.16) 其中 2021/12/941 给定检验水平 ,因为直接由 分布计算临界值 很困难,所以通常采用的近似分布。
在原假设成立时,当n较大时,其对数 极限分布是 分布因此当 ,由样本值计算出值,若 即 ,则拒绝原假设 ,否则接受原假设2021/12/942&注意,考虑检验 假设 因为 ,所以存在 ,使得& 令&则因此,检验 等价于检验 此时构造检验统计量为 其中 2021/12/9432021/12/944。












