多元正态分布.docx
20页第二章 多元正态分布多元统计分析涉及到的都是随机向量或多个随机向量放在一起组成的随机矩阵,在介绍正态分布之 前,先论述有关随机向量的基本概念为了便于理解概念和性质,借助复习一元统计分析中有关概念和 性质,自然推广给出多元统计分析中相应的概念和性质§2.1 基本概念1 随机向量的概率分布对许多社会经济现象进行认识和研究时,往往涉及多个随机变量一般说来,这些随机变量之间又 有某种联系,因而需要把这些随机变量作为一个整体(即向量)来研究定义1将P个随机变量X , X,…,X的整体称为p维随机向量,记为X = (X , X,…,X )1 2 p 1 2 p在多元统计分析中,仍然将所研究对象的全体称为总体,它是由许多(有限或无限)的个体构成的 集合,如果构成总体的个体是具有p个需要观测指标的个体,我们称这样的总体为p维总体(或p元总 体)由于从p维总体中随机抽取一个个体,其p个指标观测值是不能事先精确知道的,它依赖于被抽 到的个体,因此p维总体可用一个p维随机向量来表示这种表示便于人们用数学方法去研究p维总体 的特性这里“维”(或“元”)的概念,表示共有几个分量,例如要研究某类企业的三项经济效益指标, 则所有这类企业的三项经济效益指标就构成一个三元总体。
如果三项指标分别用 X , X , X 表示,则三123 元总体就用三维随机向量X = (X ,X ,X )'来表示,对随机向量的研究仍然限于讨论离散型和连续型123 两类随机向量先回顾一下一元统计中分布函数和密度函数定义设X是一个随机变量,称F(x)AP(X < x)为X的概率分布函数或简称为分布函数,记为X 〜F (x)若随机变量在有限或可列个值{x }上取值,记P(X = x ) = p (k = 1,2,…),且工p = 1,则称Xk k k kk 为离散型随机变量,并称P(X二x )二p (k二1,2,…)为X的概率分布kk设X ~ F(x),若存在一个非负函数f (x),使得对一切实数x有:F (x)二 jx f (t)dt则称X为连续型随机变量,称f (x)为X的分布密度函数,简称为密度函数一个函数f (x)能作为某 个随机变量X的分布密度函数的重要条件是:(1) f (x) > 0,对一切实数 x;(2) j+sf(x)dx = 1—g定义2设X = (X , X,…,X )'是p维随机向量,它的多元分布函数定义为:1 2 pF(x)AF(x ,x,…,x )二 P(X < x , X < x,…,X < x ) 记 为 X 〜F(x), 其 中— 1 2 p 112 2 p px = (x , x,…,x )'w Rp,Rp表示p维欧氏空间。
1 2 p多维随机向量的统计特性可用它的分布函数来完整地描述定义3设X = (X ,X,…,X )'是p维随机向量,若存在有限个或可列个p维数向量x ,x,…,记1 2 p 1 2P(X = x ) = p (k = 1,2,…)且满足p + p +…=1,则称X为离散型随机向量,称k k 1 2P(X = x ) = p (k = 1,2,…)为X概率分布kk设X ~ F(x)AF(x ,x,…,x ),若存在一个非负函数f (x ,x,…,x ),使得对一切1 2 p 1 2 px 二(x ,x,…,x )' w Rp 有1 2 pF(x)AF(x ,x ,…,x ) = Jx1 …Jxpf (t,…,t )dt …dt1 2 p -8-8 1 p 1 p则称X为连续型随机向量,称f (x ,x ,x )为分布密度函数,简称为密度函数或分布密度1 2 p一个p元函数f (x1,x2,…,x”)能作为Rp中某个随机向量的密度函数的主要条件是:(1) f (x ,x,…,x ) > 0, V(x ,x,…,x )'w Rp ;1 2 p 1 2 p(2) J+8 •••J+8f (x ,x ,…,x )dx dx …dx = 1。
8 -8 1 2 p 1 2 p离散型随机向量的统计性质可由它的概率分布完全确定,连续型随机向量的统计性质可由它的分布密度完全确定例 1 试证函数:f ( x],x2)=x1>0, x2>0其它e-(x1+x2), 0, 为随机向量x = ( x 1,X 2)'的密度函数证:只要验证满足密度函数两个条件即可:(1) 显然,有 f (xi,x2) > 0+8+8 +8+8(2) J J f (x ,x )dx dx = J J e-(x. + &)dx dx1 2 1 2 1 2 1 2J e -(x1 +x2)dx1 dx-0 --8-8 000+8二 J e -x2dx20=-e - x2定义4 设X = (X1,X2,…,X)是p维随机向量,称由它的q(< p)个分量组成的子向量 X(i) = (X , X ,…,X )'的分布为X的边缘(或边际)分布,相对地把X的分布称为联合分布通过交 i1 i2 iq换X中各分量的次序,总可假定X (1)正好是X的前q个分量,其余p - q个分量为X⑵,即x(1)X(1)X⑵p-q当X的分布函数是F(x ,x,…,x )时,X(1)的分布函数即边缘分布函数为: 1 2 pF(x ,x,…,x ) = P(X < x,…,X < x )1 2 q 1 1 q q=P( X < x,…,X < x , X <8,..., X < 8)1 1 q q q +1 p=F (x , x,…,x , 8,…,8)1 2 q当X有分布密度f (x ,x ,…,x )时(亦称联合分布密度函数),则X(1)也有分布密度,即边缘密度 1 2 p函数为:q,相应的取值也可分为两部分x二x(2)+8 +8f (x ,x,…,x )二 J …J f (x,…,x )dx …dx1 1 2 p 1 p q +1 p-8 -8例2对例1中的X = (X , X )'求边缘密度函数。
12解: f (X )二 I f (x ,x )dX1 2 2-8+8J e-(xi+七)心宀=e-xi,其它00,x > 02其它定义5若p个随机变量X [,…,X的联合分布等于各自的边缘分布的乘积,则称X [,…,X是相互 1 p 1 p独立的例3问例2中的X.与X 2是否相互独立?x > 0, x > 012其它同理f (X2)=e - x2,0,12I e -( x. + X),解:••• f (X , X ) = { 1 21 2 |0,x > 01 其它e-X2,0,f (X , X )二 f (x ) - f1 2 X1 1 X 2f (①=x2 2X > 01其它(X )2故x 1与X2相互独立需要注意的是:由X,…,X相互独立,可推知任何X与X (i丰j)独立,但反之不真1 p i j2 随机向量的数字特征定义 6 设 X = (X , X ,…,X ), 若EX (i = 1,…,p)存在且有限,则称 1 2 P iE(X) = (EX , EX,…,EX )'为X的均值(向量)或数学期望,有时也把E(X)和EX分别记为卩和卩,1 2 P i i即卩=(卩,卩,…,卩),容易推得均值(向量)具有以下性质:1 2 p(1) E (AX) = AE (X)(2) E(AXB)二 AE(X)B(3) E(AX + BY) = AE(X) + BE(Y)其中X、Y为随机向量,A、B为大小适合运算的常数矩阵。
定义 7 设X = (X,…X )', Y = (Y,…Y )',称D(X)AE(X - EX)(X - EX)'1 p 1_ Cov (X , X )1 1 Cov (X , X )21pCov (X , X )…Cov (X , X )1 2 1 pCov (X , X )…Cov (X , X )2 2 2 pCov(X , X )P1Cov (X , X )…Cov (X , X ) p 2 p pij为X的方差或协差阵,有时把D(X)简记为工,Cov(X , X )简记为c,从而有Y = (c );称随i j j j px p机向量X和Y的协差阵为:Cov(X, Y)AE(X - EX)(Y - EY)'_ Cov (X , Y)1 1Cov(X , Y)21当 X=Y 时,即为 D(X)Cov( X ,Y )P1Cov (X , Y )…Cov (X , Y )1 2 1 qCov (X , Y )…Cov (X , Y )2 2 2 qCov(X ,X )...Cov(X ,Y )p 2 p p若X = (X,…,X )'的协差阵存在,且每个分量的方差大于零,则称随机向量 1pR二(r ),其中ij px pCov(X , X )i j 二X 的相关阵为r =-ij ..Var(X I 'Var(X )i /为相关系数。
o=T-iji,j 二 1,…,P2 八 ° jj1设标准离差阵V 2 =则有这说明从丫可得到R,例 4 设则可得丄(V 2)-111 11E = V 2 RV 2 即 R = (V 2) -1 Z(V 2) -1可知R > 0ooo「412 [111213S =ooo=19-1212223ooo2116313233Jo00「20011为11V 2 =0220—03000TJo004\33」1——1001也可从V 2和R得到S,且由E>0,「100「100121「41212101019-10103312-116100*—_1004 _4 _从而可得相关阵为:1 丄R 二(V 2)-1 Z(V 2) -11614-1~\2若Cov(X, Y)二0,则称X和Y不相关,由X和Y相互独立易推得Cov(X, Y)二0,即X和Y不相。





