1、第10讲 协方差与相关系数 矩、协方差矩阵,我们在前一章研究过二维随机变量各自的概率分布特性以及与整体概率分布特性之间的关系. 我们知道联合分布可以唯一确定边缘分布,反之不成立。前两讲我们又介绍了随机变量的数学期望与方差,它们分别反映了随机变量取值的平均水平和随机变量取值相对于均值的分散程度,但有时需要考虑随机向量的数字特征与各自数字特征之间关系,为此我们引入协方差、相关系数、 协方差与矩的概念。,第10讲 协方差与相关系数 矩、协方差矩阵,一、协方差,1. 协方差定义,设(X,Y)为二维随机变量,如果EXE(X)YE(Y)存在. 则称此为随机变量X与Y的协方差.记为Cov(X,Y).即 Cov(X, Y)=EXE(X)YE(Y).,离散型,连续型,解 (1)无放回的情况,解 (1)无放回的情况,例2 设随机变量(X,Y)在区域D=(x,y)x2+y21上服从均匀分布,求Cov(X,Y).,解 由已知条件,于是,第10讲 协方差与相关系数 矩、协方差矩阵,一、协方差,1. 协方差定义,2. 协方差的计算公式,解 (2)有放回的情况,第10讲 协方差与相关系数 矩、协方差矩阵,一、协方差
2、,1. 协方差定义,2. 协方差的计算公式,3. 协方差的性质,(1) Cov(X, Y)=Cov(Y, X);,(2) Cov(X,X)=D(X); Cov(X,C)=0,第10讲 协方差与相关系数 矩、协方差矩阵,一、协方差,1. 协方差定义,2. 协方差的计算公式,3. 协方差的性质,(1) Cov(X, Y)=Cov(Y, X);,(2) Cov(X,X)=D(X); Cov(X,C)=0,(3) Cov(aX, bY)=abCov(X, Y), 其中a, b为 常数;,(4) D(X +Y)=D(X)+D(Y) + 2Cov(X, Y);,第10讲 协方差与相关系数 矩、协方差矩阵,一、协方差,1. 协方差定义,2. 协方差的计算公式,3. 协方差的性质,(1) Cov(X, Y)=Cov(Y, X);,(2) Cov(X,X)=D(X); Cov(X,C)=0,(3) Cov(aX, bY)=abCov(X, Y), 其中a, b为 常数;,(5) Cov(X+Y,Z)=Cov(X, Z)+Cov(Y, Z);,(4) D(X +Y)=D(X)+D(Y) + 2Cov(X,
3、 Y);,第10讲 协方差与相关系数 矩、协方差矩阵,一、协方差,1. 协方差定义,2. 协方差的计算公式,3. 协方差的性质,(1) Cov(X, Y)=Cov(Y, X);,(2) Cov(X,X)=D(X); Cov(X,C)=0,(3) Cov(aX, bY)=abCov(X, Y), 其中a, b为 常数;,(5) Cov(X+Y,Z)=Cov(X, Z)+Cov(Y, Z);,(4) D(X +Y)=D(X)+D(Y) + 2Cov(X, Y);,(6),对任意的实数t,有,又,所以,因此,即,特别,设(X,Y)为二维随机变量,如果EXE(X)YE(Y)存在,D(X)0,D(Y)0,则称 为X与Y的相关系数.记作XY .,二、相关系数,第10讲 协方差与相关系数 矩、协方差矩阵,1. 相关系数定义,2. 相关系数性质,可以证明,上式表明:均方误差是|XY|的严格单调递减函数,即当|XY|较大时,e较小,说明X,Y线性联系紧密,特别|XY|=1时,X,Y之间以概率1存在线性关系.从而XY表征了X,Y之间线性关系的紧密程度.当|XY|较大时,X,Y线性关系程度较好;当|XY|较
4、小时,X,Y线性关系 程度较差.,3. 随机变量的相关性,设随机变量X和Y的相关系数XY的存在,如果XY=0,则称X与Y不相关,否则,称X与Y相关;如果XY 0,则称X,Y正相关;如果XY 0,则称X,Y负相关.,解 (1)无放回的情况,解 (1)无放回的情况,解 (2)有放回的情况,例4 设(X,Y)服从二维正态分布 ,试求X与Y的相关系数,解 由已知条件我们有 , 即E(X)=1,E(Y)=2.,解 由已知条件我们有 , 即E(X)=1,E(Y)=2.,例4 设(X,Y)服从二维正态分布 ,试求X与Y的相关系数,解 由已知条件我们有 , 即E(X)=1,E(Y)=2.,标准正态分布的密度函数,标准正态分布的方差,例4 设(X,Y)服从二维正态分布 ,试求X与Y的相关系数,解 由已知条件我们有 , 即E(X)=1,E(Y)=2.,例4 设(X,Y)服从二维正态分布 ,试求X与Y的相关系数,说明:如果(X,Y)服 从二维正态分布,则 X与Y独立的充要条 件是,第10讲 协方差与相关系数 矩、协方差矩阵,三、矩与协方差矩阵,定义1 设X和Y是随机变量,若 存在, 则称它为X的k阶原点矩.
5、 简称k阶矩;,若 存在, 则称它为X的k阶中心矩;,若 存在,则称它为X和Y的k+l阶混合原点矩;,若 存在,则称它为X和Y的k+l阶混合中心矩.,定义2 设n维随机变量 的二阶混合中心矩 都存在, 则矩阵 为n维随机变量 的协方差矩阵.,例5 设(X1,X2)服从二维正态分布 ,试求X与Y的协方差矩阵.,解 由已知条件我们有 , 即 .,例5 设(X1,X2)服从二维正态分布 ,试求X与Y的协方差矩阵.,解 由已知条件我们有 , 即 .,自然将二维正态分布的定义推广到n维正态随机变量 的情形.,n维正态随机变量 定义为,n维正态随机变量的重要性质,(1) n维正态随机变量 的每一个分量Xi (i=1,2,n)都是正态随机变量;反之,若X1,X2,Xn都是正态随机变量,且相互独立,则 是n维正态随机变量,(2) n随机变量 服从n维正态分布的充要条件是 都任意线性组合 服从一维正态分布( 不全为零).,(3) 若 服从n维正态分布,设 是 线性函数,则 也服从多维正态分布.,n维正态随机变量的重要性质,(4) 若 服从n维正态分布, 则“ 相互独立” 与“ 两两不相关”是等价的.,例4 设(X,Y)服从二维正态分布N(1, 32; 0, 42; -0.5),其中Z=X/3+Y/2. 1)求Z的概率密度. 2)求X与Z的相关系数. 3)问X与Z是否相互独立?为什么?,分析 由于(X,Y)服从二维正态分布,由性质(2)可知Z=X/3+Y/2服从一维正态分布. 因此,只需计算Z的期望和方差.,解 根据已知条件 ,那么,由数学期望、方差、协方差的性质,解 根据已知条件 ,那么,由数学期望、方差、协方差的性质,(4) 若 服从n维正态分布, 则“ 相互独立” 与“ 两两不相关”是等价的.,由于,(3) 若 服从n维正态分布,设 是 线性函数,则 也服从多维正态分布.,由性质(3)可知(X,Z)服从二维正态分布.,又 ,所以X与Z不相关,再根据性质(4)可知X与Y独立.,
《第10讲协方差与相关系数.》由会员今***分享,可在线阅读,更多相关《第10讲协方差与相关系数.》请在金锄头文库上搜索。