LDA算法详解上课讲义
13页1、线性鉴别分析法线性鉴别分析(Linear Discriminant Analysis, LDA),有时也称 Fisher 线性判别(Fisher Linear Discriminant ,FLD), 这种算法是 Ronald Fisher 于 1936年发明的,是模式识别的经典算法i在1996年由Belhumeur引入模式识 别和人工智能领域的。性鉴别分析的基本思想是将高维的模式样本投影到最佳鉴 别矢量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式 样本在新的子空间有最大的类间距离和最小的类内距离,即模式在该空间中有最 佳的可分离性。因此,它是一种有效的特征抽取方法。使用这种方法能够使投影 后模式样本的类间散布矩阵最大,并且同时类内散布矩阵最小。就是说,它能够 保证投影后模式样本在新的空间中有最小的类内距离和最大的类间距离,即模式 在该空间中有最佳的可分离性。3.2.1 Fisher 线性判别准则假设有一组属于两个类的n个d维样本X,.,X,其中前n个样本属1n1于类o ,后面n个样本属于类o,均服从同协方差矩阵的高斯分布。各类样1 2 2本均值向量m (i=1,2)
2、如式(3-15):im =丄 Z X i=1,2(3-15)ini xeXt样本类内离散度矩阵s和总的类内离散度矩阵s如式(3-16)、式(3-17)iw3-16)3-17)3-18)S = m z (x 一 m )(x 一 m )ti iii養Xts =s +sw12t样本类间离散度矩阵S如式(3-18):bS = (m 一m )(m 一m )Tb 1 2 1 2现寻找一最佳超平面将两类分开,则只需将所有样本投影到此超平面的法线方向上 o G Rd,|w|=l:y = WT Xi=l,,n(3-19)ii得到n个标量 y,., y WR,这n个标量相应的属于集合Y和Y,并1 n 1 2 且Y和Y能很好的分开。12为了能找到这样的能达到最好分类效果的投影方向w, Fisher规定了一个准则函数:要求选择的投影方向W能使降维后Y和Y两类具有最大的类间距离 12与类内距离比:(w)(m1-m 2)23-20)S12 + S 22其中类间距离用两类均值m和丁之间的距离表示,类内距离用每类样本12距其类均值距离的和表示,在式中为s+s 2。其中m (i=1,2)为降维后各类样本均值:ii=1,
3、23-21)m =丄工yi n /i y=1.iS .2(i=1,2)为降维后每类样本类内离散度,S12 + S为总的类内离散度s :i12ws2 丄(y - m )2,ii2 2s =s 2+s 2w12i=1,23-22)3-23)类间离散度表示为(mm)2。但式(3-20)Fisher准则函数并不是w的显示函数,无法根据此准则求解W,因此需要对Fisher准则函数形式进行修改:因 y 二 wtxiii=1,,n,则i=1,23-24)丁 =丄工y =丄工 wTX =wT mi n / nii y=Y . i xgXt(m-m)2 =(wTm-wTm)2=wt(m m)(m1-m2)tw1 2 1 2 1 2 1 23-25)= wT s wb同样s 2i(i=l, 2)也可推出与w的关系:s .2 =工(y - m .)2 =工(wTxwTm .)2 xeXt=wt工(x-m)(x-m.)Tw=wtS w xeXt3-26)因此2 2S1 +S 2则最终可表示为:=wt(S + S )w二 wtS ww3-27)12(w)=F(m m 2)22 2Sl+ s 2wT s wb W
4、tS ww3-28)根据式(3-28)Fisher准则函数,要寻找一投影向量W,使J (w)最大化,F则需对J (w)按变量W求导并使之为零:wT s wQ ( b ) d J (w)wT S wF=wdwdwS w(wT S w) - S w(wT S w) bwwb = 0ww (wT s w)2 w3-29)则需s w(wT s w)bw-sww ( wT s w )=0bWS这是一个广义特征值问题,若 s 非奇异,则 w3-30)(w) s wFw令J (w)三九,则F3-31)3-32)WS -1 S因此可以通过对s -1 s进行特征值分解,将最大特征值对应的特征向量作 wb为最佳投影方向W。以上 Fisher 准则只能用于解决两类分类问题,为了解决多类分类问题,Dudal提出了判别矢量集的概念,被称为经典的Fisher线性判别分析方法。Duda指出,对于c类问题,则需要c-1个上节的用于两类分类的Fisher线 性判别函数,即需要由c-1个投影向量W组成一个投影矩阵WW Rdxc-1,将样本 投影到此投影矩阵上,从而可以提取c-1维的特征矢量。针对c类问题,则样本 的统计特
《LDA算法详解上课讲义》由会员大米分享,可在线阅读,更多相关《LDA算法详解上课讲义》请在金锄头文库上搜索。
2023-04-10 2页
2023-01-16 8页
2023-08-11 9页
2022-09-23 12页
2023-05-19 9页
2023-01-16 9页
2023-08-12 19页
2022-12-06 33页
2024-01-07 15页
2023-06-05 9页