
毕业论文翻译.doc
13页基于自然人脸和 Gabor 人脸结合的改进人脸识别算法摘要过去的几年里,在人脸识别领域提出了很多基于人脸整体性信息的识别算法其中一些方法包括颜色处理、人脸的不同描述以及图像处理技术这些方法的出发点是用来提高光照变化的鲁棒性在众多的方法之中,Gabor 人脸的使用已经被证明是最成功的方法之一在不同人脸识别方法的结合方面也有不少研究,无论是特征方面还是在得分方面本文提出了一种有效地结合方案,这种方案通过结合自然人脸和对应的 Gabor 人脸的识别得分来达到改善单一整体性方法的效果本文利用最知名的几种整体性方法在 FRGC 数据库上评价了这种方法的有效性结果显示,在各种情况下,识别率至少达到了 10%的改善更重要的是,当识别得分来自两种不同的方法,其中一种方法使用自然人脸,另外一种方法使用 Gabor 人脸,这种方案仍然有效这些结果表明,两种人脸描述具有互补性,并且在得分水平能够很好地被融合关键词: 人脸识别 Gabor 图像描述 FRGC 人脸库 核 Gabor 变换 主成分分析(PCA)1 引言在过去的几年里,信息安全领域关注度的不断提高促进了人脸身份鉴别的各种生物技术的研究在这些技术中,人脸识别技术由于它的非侵入性吸引了公有机构和私营机构共同的兴趣,成为了一个非常活跃地研究课题(Chellappa et al.,1995;Zhao et al.,2003).例如,人脸自动识别系统目前已经用来帮助人类掌权者用于边界的控制。
这些系统能用于完成两种不同的任务:人脸识别和人脸验证前者主要用于判断一个相关人脸是否在一个具有 N 个人脸的列表之中后者主要用于鉴别两幅人脸图像是否属于同一个人本文所讨论的系统主要用于识别和验证,所使用的图像是正面静止的二维人脸大多数人脸识别和验证算法被设计成分类器分类器在从人脸库取得的一部分人脸图像上进行训练,以用于寻找一些描述这些人脸的差异性特征这个训练过程通常是在离线状态下进行的一经训练后,分类器可以被用来从新的人脸图像中提取差异性特征呈现给系统这样,就可通过比较两个特征的差异来比较两个人脸的差异了人脸特征提取的算法可以粗略的划分为整体性和局部性的方法(Zhao et al.,2003) 整体性方法使用整个人脸区域作为原始输入呈递给系统一般而言,这些系统把人脸投影到一个便于识别的低维系统众所周知的整体性技术有特征脸法(Turk and Pentland 1991)和 Fisher 脸法(Belhumeur et al.,1997)相反,局部方法试图聚集一些能够很好定义的位置信息来识别人脸其中一些局部方法有弹性图匹配算法(Wiskott et al.,1997)和隐马尔科夫模型(Nefian and Hayes,1998) 。
目前,无论是整体性方法还是局部性方法的研究都很活跃(Zhao et al.,2003;Tolba et al.,2005) 自从 Daugman(1980), Daugman et al.(1985)提出 Gabor 变换能够很好地模拟皮质层单细胞的感受域剖面图后,这个变换一直被应用到各种计算机视觉算法之中确实,这种变换是弹性图匹配算法(Wiskott et al.,1997)和许多著名的整体性算法(Liu and Wechsler,2001,2002;Liu,2004,2006)的核心Gabor 变换分析了不同尺度、位置和方向上纹理的空间频率分布当结合整体性分类器时,提取的特征不同于那些从自然人脸提取的特征,通常呈现出更好的精确性然而,当使用 Gabor 脸时,一些与鉴定相关的信息也有可能会丢失本文研究了通过结合两种分类器获得的得分能否改善有代表性的整体性方法的识别精度这两种分类器分别在自然人脸和 Gabor 人脸上得到训练所提出的结合方案在FRGC(Phillips et al.,2005)人脸库上进行了评价 FRGC 是和人脸识别最相关的二维静止图像人脸库我们的结果表明,所提出的得分融合方案改善了本文所研究的所有整体性方法的精确度。
本文剩下的部分是按这样的方式进行组织的:第 2 和第 3 部分分别讨论了相关的工作和 Gabor 人脸描述的一些背景第 4 和第 5 部分简明的介绍了本文所需的整体性验证算法和结合不同得分的方法最后,第 6 和第 7 部分评价、总结了我们的发现并提出了一些未来的研究工作2 相关工作Gabor 变换曾经被用来改善整体性方法的识别精度Liu 和 Wechsler 在 2001 和 2002年提出了一种将 Gabor 脸输入到特征脸 (PCA)和 Fisher 脸(LDA)中,从而得到了改进的统计识别方法,该方法在 FERET 人脸库上进行试验,识别率提高了 30%左右后来,Liu在 2004 和 2006 年提出的将上述 Gabor 脸输入到独立核版本中,也表明得到了最好的效果之一Xie et al 在 2005 年提出了一种不同的整体性方法 KCFA这种方法计算了训练样本集中每一个人的二维相关系数滤波器在识别的时候,新图像与每一个滤波器相关,相关系数平面的中心被认为是该图像的特征向量使用 Xie et al 在 2005 年提出的核技巧能够使得相关系数变成非线性的本文,我们通过对输入图像做 Gabor 小波变换的手段,稍微修改了一下原始方法。
在生物研究领域,不同识别系统的结合受到了越来越多的重视一般来讲,结合可以在两种不同的水平:特征融合和得分融合前者涉及到大多数判别特征的选择性问题,这需要一个额外的训练阶段例如,Zhao et al.在 2004 年提出了一种基于下相同输入的不同特征提取方法的结合,最终的得分是由 Neural Network Committee 分类器判定的Tan 和 Triggs 在 2007 年提出了另一种有趣的结合方案,这种结合方案将 Gabor 和 LBP图像的 PCA 特征向量结合在一起然而,大多数判别特征向量的提取使用的方法是KDCV另一方面, 2005 年,Jain et al.在不同生物识别系统的得分水平结合的选择性方面做了更进一步的研究对于每一个识别个体,一个全局的匹配得分是通过结合(加法、乘法、取最大或最小)不同生物系统的得分而获得的我们应该注意到这种结合方案并不需要任何额外的训练阶段,并且比特征水平的融合副本更容易一般化当不同系统的信息能够得到互补(至少是部分的)的时候,就能够获得好的结果本文,我们分析了两种得分结合的效果这两种得分使用相同的人脸识别方法,只是输入系统的图像不同而已,其中一种是自然人脸,另一种是 Gabor 人脸。
使用的策略是 Jain et al.在 2005 年提出的混合模型系统值得注意的是,我们并不是研究来自特征结合的最具有判别性的特征,而是计算以个体得分结合为基础的最终得分在 FRG 数据集上的实验表明,这种简单的融合方案提高了本文介绍的所有整体性方法的识别率3 Gabor 人脸描述Gabor 人脸图像是通过计算原始图像和几个 Gabor 小波函数的卷积得到的 Gabor 小波是由 Lee,1996;Lades et al,1993 提出来的定义如下:(1) 2,2,,,2 ,vvkrvikrvree其中 , .Lades et al 在 1993 年指出,当在频率域选择合,cos,invk(,)rxy适的小波函数时,Gabor 人脸能够非常有效基于这个目的,我们可以很方便的定义,其中 是最大频率, 是在频率域核空间间的因子这些参数max,/8vfmaxkf的选择不仅依赖于需要进行处理的图像的数目和我们想要考虑的离散频率表一是 Lades et al 在 1993 年列出了针对 128 128 图像的一个有效的参数组合。
Table 1Gabor 小波变换的参数选择(图像大小为 128×128) maxkf/2220,7 0,4设 是一个灰度分布图像,图像 和和 Gabor 小波核函数的卷积定义如下:,IxyI(2), ,,v vOxy其中, 代表卷积运算, 是与 Gabor 核函数在方向 和尺度 相关的运算结果 尽管式(2)的运算结果是复数值,但我们使用的是该复数的模值,这种模值表示被证明在边缘方面描述得效果很好(Lades et al.,1993) 此外,我们对得到的 按因子,vOxy进行下抽样(即 8 行 8 列)以保证最终维数不超过原图像的维数64设 表示 按因子 下抽样后由每一行串在一块得到的列向量,该,Oxy, ,vxy列向量进行了均值为 0 方差为 1 的标准化处理这样,图像 的最终 Gabor 描述如下:I(3)ttt()()()0,,14,7其中 是转置运算这样,增加的 Gabor 特征向量包含了所有的 Gabor 小波描述的集合,t,作为重要的鉴别信息。
例如,对于,():,,0,4SOxy 像素的图像而言,这个响亮的尺寸为 10240(40×16×16) 1284 验证算法Fig.1 呈现了一个典型的整体识别或验证系统的块状图对于经过预处理的图像,一个训练样本数据库被用来设计一个作为特征提取用的分类器这个过程是在离线状态下进行的那么,当两幅新的图像被输入系统后(上线) ,他们各自的特征向量会被提取,并且特征向量之间的距离会被计算验证结果可以通过与所设定距离阈值进行比较得到,该阈值的由来依据系统的期望错误接受率通常使用的向量间距离的衡量包括曼哈坦距离( ) 、欧式距离( ) 、余弦值( )和明考斯基距离 1L2LcosMd在本文中,我们考虑了四种特征提取方法:PCA,LDA,KDA 和 KCFA,在下文中会有更加详细的介绍在每种情况下,我们考虑的都是一幅具有 个灰N度值的二维向量为了方便起见, ,图像被表示成一个 维的行向量 ,该行NiX向量是通过将图像矩阵各行数据组合在一块得到的设给定一个训练样本集能够被分成 类(即来自 个不同的个体) 我NiXR:1,iM :1,kwL L们用 表示类别 包含的样本数。
kk4.1 主成分分析法主成分分析法是利用协方差矩阵的特征向量作为投影方向进行特征提取的协方差矩阵从给定的样本集中进行估计的:. (4)1MTiiiSX其中, 令 是矩阵 的前 个最大特征值对应ii 011,,rU Xr的特征列向量组成的矩阵主成分分析法就是将上述 个特征向量作为基向量,将原始空间的样本向量 投影到上述特征向量所张成空间中不妨设 在上述Y Y特征空间中的投影向量为 则F(5).TFUY4.2 线性鉴别分析上述 PCA 特征提取方法是针对所有给定样本而言的,样本的所属类别信息并没有纳入到算法中去线性鉴别分析法,是从 Fisher 判别理论发展而来的,因而又叫做 Fisher 线性判别法LDA [7,8]方法采用了使得样本能够正确分类识别的先验知识,即寻找最优投影方向,使得投影后向量的类间离散度矩阵和类内离散度矩阵的比率最大化,这有助于识别率的提高这些投影方向被用来对给定的样本向量进行特征提取给定样本向量的类间离散矩阵定义为:. (6)1LTBkkSM类内离散度矩阵定义为:(7)1ikLTWikikXw其中, 是所有样本向量的均值向量, 是第 个类别1Mii 1ikkiXwM的均值向量。
线性判别分析试图寻找 个方向向量 使得如下关系式最大化1Lv(8)TBWvSJ由 Rayleigh 商的知识可知使得等式(1)中 最大化的向量 是。












