
第五专题 矩阵的数值特征(行列式、范数、条件数、迹、秩、相对特征根)扫描.docx
10页文档整理 | 借鉴参考collection of questions and answers20XX第五专题 矩阵的数值特征〔行列式、迹、秩、相对特征根、范数、条件数〕一、行列式Ap×q, Bq×p, 那么|Ip+AB|=|Iq+BA|证明一:参照课本194页,例4.3.证明二:利用AB和BA有一样的非零特征值的性质;从而Ip+AB,Iq+BA中不等于1的特征值的数目一样,大小一样;其余特征值都等于1行列式是特征值的乘积,因此|Ip+AB|和|Iq+BA|等于特征值〔不等于1〕的乘积,所以二者相等二、矩阵的迹矩阵的迹相对其它数值特征简单些,然而,它在许多领域,如数值计算,逼近论,以及统计估计等都有相当多的应用,许多量的计算都会归结为矩阵的迹的运算下面讨论有关迹的一些性质和不等式定义:,etrA=exp(trA)性质:1. ,线性性质;2. ;3. ;4. ;5. 为向量;6. ;从Schur定理〔或Jordan标准形〕和〔4〕证明;7. ,那么,且等号成立的充要条件是A=0;8. ,那么,且等号成立的充要条件是A=B〔〕;9. 对于n阶方阵A,假设存在正整数k,使得Ak=0,那么tr(A)=0〔从Schur定理或Jordan标准形证明〕。
假设干根本不等式对于两个m×n复矩阵A和B,tr(AHB)是m×n维酉空间上的内积,也就是将它们按列依次排成的两个mn维列向量的内积,利用Cauchy-schwarz不等式[x,y]2≤[x,x]﹒[y,y] 得定理:对任意两个m×n复矩阵A和B |tr(AHB)|2≤tr(AHA)﹒tr(BHB) 这里等号成立的充要条件是A=cB,c为一常数特别当A和B为实对称阵或Hermit矩阵时0≤|tr(AB)|≤定理:设A和B为两个n阶Hermite阵,且A≥0,B≥0,那么 0≤tr(AB)≤λ1(B)tr(A) ≤tr(A)﹒tr(B) λ1(B)表示B的最大特征值证明:tr(AB)= tr(A1/2BA1/2) ≥0,又因为A1/2[λ1(B)I-B]A1/2≥0,所以λ1(B)tr(A)≥A1/2BA1/2,得tr(AB)= tr(A1/2BA1/2)≤tr(λ1(B) A)=λ1(B) tr(A)≤tr(A)﹒tr(B)推论:设A为Hermite矩阵,且A>0,那么tr(A)tr(A-1)≥n另外,关于矩阵的迹的不等式还有很多,请参考?矩阵论中不等式?三、矩阵的秩矩阵的秩的概念是由Sylvester于1861年引进的。
它是矩阵的最重要的数字特征之一下面讨论有关矩阵秩的一些性质和不等式定义:矩阵A的秩定义为它的行〔或列〕向量的最大无关组所包含的向量的个数记为rank(A)性质:1. ;2. ;3. ;4. ,其中X列满秩,Y行满秩〔消去法那么〕定理〔Sylvester〕:设A和B分别为m×n和n×l矩阵,那么 Sylveste定理是关于两个矩阵乘积的秩的不等式其等号成立的充要条件请参考王松桂编写的?矩阵论中不等式?,三个矩阵乘积的秩的不等式也一并参考上述文献四、相对特征根定义:设A和B均为P阶实对称阵,B>0,方程|A-λB|=0的根称为A相对于B的特征根性质:|A-λB|=0等价于|B-1/2AB-1/2-λI|=0(因为B>0,所以B1/2>0)注:求A相对于B的特征根问题转化为求B-1/2AB-1/2的特征根问题或AB-1的特征根因B-1/2AB-1/2是实对称阵,所以特征根为实数定义:使(A-λiB)li=0的非零向量li称为对应于λi的A相对于B的特征向量性质:① 设l是相对于λ的A B-1的特征向量,那么A B-1l=λl 或 A (B-1l)=λB( B-1l)B-1l 为对应λ的A相对于B的特征向量〔转化为求A B-1的特征向量问题〕。
② 设l是相对于λ的B-1/2AB-1/2的特征向量,那么B-1/2AB-1/2l=λl 可得A (B-1/2l)=λB(B-1/2l)那么B-1/2l 为对应λ的A相对于B的特征向量〔转化为求B-1/2AB-1/2对称阵的特征向量问题〕五、向量范数与矩阵范数向量与矩阵的范数是描述向量和矩阵“大小〞的一种度量先讨论向量范数1. 向量范数定义:设V为数域F上的线性空间,假设对于V的任一向量x,对应一个实值函数,并满足以下三个条件: 〔1〕非负性 ,等号当且仅当x=0时成立; 〔2〕齐次性 〔3〕三角不等式那么称为V中向量x的范数,简称为向量范数定义了范数的线性空间定义称为赋范线性空间例1. ,它可表示成,, 就是一种范数,称为欧氏范数或2-范数证明:〔i〕非负性 ,当且仅当时,即x=0时,=0 〔ii〕齐次性 〔iii〕三角不等式 , 根据Hölder不等式:, 2. 常用的向量范数〔设向量为〕 1-范数:; ∞-范数:;P-范数: 〔p>1, p=1, 2,…,∞,〕;2-范数:;椭圆范数(2-范数的推广):,A为Hermite正定阵.加权范数:, 当,证明:显然满足非负性和齐次性 〔iii〕,,应用Hölder不等式 即 3. 向量范数的等价性定理 设、为的两种向量范数,那么必定存在正数m、M,使得 ,〔m、M与x无关〕,称此为向量范数的等价性。
同时有注:〔1〕对某一向量X而言,如果它的某一种范数小〔或大〕,那么它的其它范数也小〔或大〕〔2〕不同的向量范数可能大小不同,但在考虑向量序列的收敛性问题时,却表现出明显的一致性4、矩阵范数向量范数的概念推广到矩阵情况因为一个m×n阶矩阵可以看成一个mn维向量,所以中任何一种向量范数都可以认为是m×n阶矩阵的矩阵范数1. 矩阵范数定义:设表示数域C上全体阶矩阵的集合假设对于中任一矩阵A,均对应一个实值函数,并满足以下四个条件: 〔1〕非负性: ,等号当且仅当A=0时成立; 〔2〕齐次性: 〔3〕三角不等式:,那么称为广义矩阵范数; 〔4〕相容性:,那么称为矩阵范数5. 常用的矩阵范数〔1〕Frobenius范数〔F-范数〕F-范数: = =矩阵和向量之间常以乘积的形式出现,因而需要考虑矩阵范数与向量范数的协调性定义:如果矩阵范数和向量范数满足那么称这两种范数是相容的给一种向量范数后,我们总可以找到一个矩阵范数与之相容〔2〕诱导范数设A∈Cm×n,x∈Cn, 为x的某种向量范数,记 那么是矩阵A的且与相容的矩阵范数,也称之为A的诱导范数或算子范数〔3〕p-范数:,,x为所有可能的向量,,, ,,可以证明以下矩阵范数都是诱导范数:〔1〕 列〔和〕范数;〔2〕 谱范数;的最大特征值称为的谱半径。
当A是Hermite矩阵时,是A的谱半径注:谱范数有许多良好的性质,因而经常用到〔3〕 行〔和〕范数〔 ,〕定理 矩阵A的任意一种范数是A的元素的连续函数;矩阵A的任意两种范数是等价的定理 设A∈Cn×n,x∈Cn, 那么和是相容的即 证明:由于成立定理 设A∈Cn×n,那么是酉不变的,即对于任意酉矩阵U,V∈Cn×n,有证明: 定义 设A∈Cn×n,A的所有不同特征值组成的集合称为A的谱;特征值的模的最大值称为A的谱半径,记为ρ(A)定理 ρ(A)不大于A的任何一种诱导范数,即ρ(A)≤ 证明:设λ是A的任意特征值,x是相应的特征向量,即 Ax=λx那么|λ|·||x||= ||Ax||≤||A||·||x||, ||x||≠0即 |λ|≤||A||试证:设A是n阶方阵,||A||是诱导范数,当||A||<1时,I-A可逆,且有||(I-A)-1||≤(1-||A||)-1证明:假设I-A不可逆,那么齐次线性方程组(I-A)x=0有非零解x,即x=Ax,因而有||x||=||Ax||≤||A||﹒||x||<||x||但这是不可能的,故I-A可逆。
于是 (I-A)-1=[ (I-A)+A] (I-A)-1=I+A (I-A)-1因此||(I-A)-1||≤||I||+||A(I-A)-1||=1+||A(I-A)-1||≤1+||A||﹒|| (I-A)-1||即证 ||(I-A)-1||≤(1-||A||)-1补充证明||I||=1:由相容性可知:||A||﹒||A-1||≥||A A-1||=||I||对于诱导范数( )六、条件数条件数对研究方程的性态起着重要的作用 定义:设矩阵A是可逆方阵,称||A||﹒||A-1||为矩阵A的条件数,记为cond(A),即cond(A)= ||A||﹒||A-1||性质:〔1〕cond(A) ≥1,并且A的条件数与所取的诱导范数的类型有关因cond(A)= ||A||﹒||A-1||≥||A A-1||=||I||=1〔2〕cond(kA)= cond(A)=cond(A-1),这里k为任意非零常数中选用不用的范数时,就得到不同的条件数,如:cond1(A)= ||A||1﹒||A-1||1cond∞(A)= ||A||∞﹒||A-1||∞cond2(A)= ||A||2﹒||A-1||2=,其中分别为AHA的特征值的模的最大值和最小值。
谱条件数特别地,如果A为可逆的Hermite矩阵,那么有cond2(A)= 这里分别为A的特征值的模的最大值和最小值如果A为酉阵,那么cond2(A)= 1例 求矩阵A的条件数cond1(A),cond∞(A) 解:||A||1=max{6;14;4}=14;||A||∞=max{8;3;13}=14;故||A-1||1=17/4;||A-1||∞=47/4;cond1(A)= ||A||1﹒||A-1||1=14×17/4=259/2;cond∞(A)= ||A||∞﹒||A-1||∞=611/4例 设线性方程组Ax=b的系数矩阵A可逆讨论当b有误差δb时,解的相对误差δx的大小解:因矩阵A可逆,所以Ax=b有唯一解x=A-1b,设解的误差为δx,由A(x+δx)=b+δb得 Aδx=δb或δx=A-1δb得 〔1〕又Ax=b,可得,或 〔2〕所以由〔1〕和〔2〕,得 这说明相误差的大小与条件数cond(A)密切相关;当右端b的相对误差一定时,cond(A)越大,解的相对误差就可能越大;cond(A)越小,解的相对误差就可能越小因而条件数cond(A)可以反映A的特性。
一般来说:条件数反映了误差放大的程度,条件数越大,矩阵越病态条件数在最小二乘估计的稳定性研究中有重要应用。
