多元正态分布ppt课件.ppt
32页第三章 多元正态分布v§3.1 多元正态分布的定义v§3.2 多元正态分布的性质v§3.3 复相关系数和偏相关系数v§3.4 极大似然估计及估计量的性质v§3.5 和(n − 1) S的抽样分布v*§3.6 二次型分布§3.1 多元正态分布的定义v一元正态分布N(μ,σ2)的概率密度函数为v假设随机向量 的概率密度函数为v那么称x服从p元正态分布,记作x~Np (μ, Σ),其中,参数μ和Σ分别为x的均值和协差阵例3.1.1〔二元正态分布 〕v设x~N2(μ, Σ),这里v易见,ρ是x1和 x2的相关系数当|ρ|<1时,可得x的概率密度函数为二元正态分布的密度曲面图 v以下图是当 时二元正态分布的钟形密度曲面图二元正态分布等高线v等高〔椭圆〕线:v上述等高线上的密度值二元正态分布的密度等高线族〔运用SAS/INSIGHT,由10000个二维随机数生成〕 §3.2 多元正态分布的性质v*〔1〕略v〔2〕设x是一个p维随机向量,那么x服从多元正态分布,当且仅当它的任何线性函数 均服从一元正态分布。
v性质〔2〕常可用来证明随机向量服从多元正态分布v〔3〕设x~N p (μ, Σ),y=Cx+b其中C为r×p 常数矩阵,那么v该性质阐明,〔多元〕正态变量的任何线性变换仍为〔多元〕正态变量v例3.2.2 设x~Np (μ, Σ),a为p维常数向量,那么由上述性质〔2〕或〔3〕知,v〔4〕设x~Np (μ, Σ),那么x的任何子向量也服从〔多元〕正态分布,其均值为μ的相应子向量,协方差矩阵为Σ的相应子矩阵v该性质阐明了多元正态分布的任何边缘分布仍为〔多元〕正态分布v需留意,随机向量的任何边缘分布皆为〔多元〕正态分布未必阐明该随机向量就服从多元正态分布例2.2.2就是这样的一个反例 v还需留意,正态变量的线性组合未必就是正态变量v这是由于:vx1,x2, ⋯,xn均为一元正态变量v⟸(⇏)x1,x2, ⋯,xn的结合分布为多元正态分布v⟺x1,x2, ⋯,xn的一切线性组合是一元正态变量v例3.2.4 设x~N4(μ, Σ),这里v 那么 〔i〕 ; 〔ii〕 ; 〔iii〕 。
§3.2 多元正态分布的性质v〔5〕设x1,x2, ⋯,xn相互独立,且xi~N p (μi, Σi) ,i=1,2,⋯,n,那么对恣意n个常数,有v此性质阐明,独立的多元正态变量〔维数一样〕的恣意线性组合仍为多元正态变量v〔6〕设x~N p (μ, Σ),对x, μ, Σ(>0)作如下的剖分: 那么子向量x1和x2相互独立,当且仅当Σ12=0该性质指出,对于多元正态变量而言,其子向量之间互不相关和相互独立是等价的〔7〕设x~N p (μ, Σ), Σ>0,那么例3.2.5 设x~N3(μ,Σ),其中那么x2和x3不独立,x1和(x2,x3)独立〔8〕略v*〔9〕略v*〔10〕略v〔11〕设x~N p (μ, Σ), Σ>0,作如下剖分v那么给定x2时x1的条件分布为 ,其中vμ1·2和Σ11·2分别是条件数学期望和条件协方差矩阵,Σ11·2通常称为偏协方差矩阵Ø这一性质阐明,对于多元正态变量,其子向量的条件分布仍是〔多元〕正态的Ø例3.2.7 设x~N3(μ, Σ),其中Ø试求给定x1+2x3时 的条件分布。
§3.3 复相关系数和偏相关系数 v一、复相关系数v二、偏相关系数一、复相关系数v〔简单〕相关系数度量了一个随机变量x1与另一个随机变量x2之间线性关系的强弱v复相关系数度量了一个随机变量x1与一组随机变量x2, ⋯,xp之间线性关系的强弱v将x, Σ(>0)剖分如下:v x1和x2的线性函数 间的最大相关系数称为 x1和x2间的复(或多重)相关系数(multiple correlation coefficient),记作ρ1∙2,⋯,p, 它度量了一个变量x1与一组变量x2, ⋯,xp间的相关程度v可推导出v例3.3.1 随机变量x1,⋯,xp的任一线性函数F=l1x1+⋯+v lp xp与x1,⋯,xp的复相关系数为1v证明二、偏相关系数v将x, Σ(>0)剖分如下:v称 为给定x2时x1的偏协方差矩阵记 ,称 为偏协方差,它是剔除了 的〔线性〕影响之后,xi和xj之间的协方差。
v给定x2时xi 和xj的偏相关系数〔partial correlation coefficient〕定义为v其中 vρij∙k+1,⋯,p度量了剔除xk+1, ⋯,xp的〔线性〕影响之后,xi和xj间相关关系的强弱 v对于多元正态变量x,由于Σ11∙2也是条件协方差矩阵,故此时偏相关系数与条件相关系数是同一个值,从而ρij∙k+1,⋯,p同时也度量了在xk+1, ⋯,xp值给定的条件下xi和xj间相关关系的强弱 §3.4 极大似然估计及估计量的性质v本课程第二章和第三章前三节的内容属概率论的范畴v从第三章§3.4 开场的内容属数理统计的范畴,特点是推断和分析从样本出发v一、样本x1,x2, ⋯,xn的结合概率密度v二、 μ和Σ的极大似然估计 v三、相关系数的极大似然估计 v四、估计量的性质v设x~Np(μ, Σ) , Σ>0,x1,x2, ⋯,xn是从总体x中抽取的一个简单随机样本〔今后简称为样本〕,即满足:x1,x2, ⋯,xn独立,且与总体分布一样v令v称之为〔样本〕数据矩阵或观测值矩阵一、样本x1,x2, ⋯,xn的结合概率密度v极大似然估计是经过似然函数来求得的,似然函数可以是样本结合概率密度 f (x1,x2,⋯,xn)的恣意正常数倍,我们无妨取成相等,记为L(μ, Σ)。
可详细表达为:二、μ和Σ的极大似然估计v一元正态情形:v多元正态情形:v其中 称为样本均值向量〔简称为样本均值〕,v 称为样本离差矩阵三、相关系数的极大似然估计v1.简单相关系数v2.复相关系数v3.偏相关系数1.简单相关系数v相关系数ρij的极大似然估计为v其中 称S为样本协方差矩阵、rij为样本相关系数、 为样本相关矩阵2.复相关系数v将x, Σ(>0),S剖分如下:v那么复相关系数ρ1∙2,⋯,p的极大似然估计为r1∙2,⋯,p,称之为样本复相关系数其中v 3.偏相关系数v将x, Σ(>0),S剖分如下:v 那么偏相关系数ρij∙k+1,⋯,p的极大似然估计为rij∙k+1,⋯,p ,称之为样本偏相关系数,其中v v 四、估计量的性质v1.无偏性v2.有效性v3.一致性v4.充分性1.无偏性v设 是未知参数ᵬ 〔可以是一个向量或矩阵〕的一个估计量,假设 ,那么称估计量 是被估参数ᵬ 的一个无偏估计,否那么就称为有偏的。
v样本均值 是总体均值μ的无偏估计,即有 v由于 ,故 不是Σ的无偏估计v假设将该估计量稍加修正为v那么S将是Σ的一个无偏估计,即有E(S)=Σ§3.5 和(n − 1)S的抽样分布v一、 的抽样分布v二、 (n − 1)S的抽样分布一、 的抽样分布v1.正态总体v 设x~Np (μ, Σ), Σ>0 ,x1,x2, ⋯,xn是从总体x中抽取的一个样本,那么v2.非正态总体〔中心极限定理〕 v 设x1,x2, ⋯,xn是来自总体x的一个样本,μ和Σ存在,那么当n很大且n相对于p也很大时,上式近似地成立。





