
基于改进初始化判别K—SVD方法的人脸识别.pdf
5页薛 科婷等 : 基于改进初始化判别 K — S VD方法的人脸识别 表示 , 就可得到很好的识别效果 然而 , S RC算法 要求选择大量的训练样本来保证冗余字典的过完 备性 , 由于字典 的规模较大 , 求解稀疏解时需要使 用贪婪算法或迭代搜索算法, 导致识别速度较慢 K — S VD( K— S i n g u l a r Va l u e De c o mp o s i t i o n ) 方 法 从一个大规模的待训练样本集 中训 练出一个 优化 的小规模字典 , 可 以加快识别速度然而 , 经 K ~ S VD训练的字典仅保持了稀疏性 , 没有判别性 , 不适 用 于分 类 问题 最近 , 训练具有判别性的字典的方法开始受到 关注 D — k s v d ( Di s c r i mi n a t i v e K — s v d算法 可 同时训练判别字典和线性分类器, 使训练字典在保 持稀疏性的同时具有一定的判别性 , 在具有较快识 别速度的同时可取得较好 的分类结果D- k s v d算 法在初始化阶段 , 从每类待训练样本中选择部分样 本 , 再 经 K— S VD训练得 到初 始化字典 , 由于选取 的部分样本并不能完全表示每类样本的特点, 使得 待训练数据与初始化矩阵的误差较大 , 影响了判别 字典 的有 效性 , 从 而影 响 了 D — k s v d方 法 的性 能 。
本文对 D — k s v d算法的字典初始化方法进行改 进 , 先 在类 内训 练小 字 典 , 由 于 每个 类 别 内 的样 本 相似度比较接近 , 所以训练出的类内训练字典是该 类别的优化稀疏字典 , 误差较小 , 能够较好地表示 每类训练样本 的特性 ; 再将每个类 内小字典级联构 成初始化字典 , 如此 , 较完整地包 含了训练样本 的 所有信息 , 较好地 降低 了判别字典 的误差 , 从 而提 高 了人脸 识别 率 本文 的结 构 如 下 : 第 2节 简单 介 绍 了 D — k s v d 算法的原理; 第 3节介绍了改进 的 D — k s v d初始化 方法 ; 第 4节在 E x t e n d e d Ya l e B人脸库_ 8 上进行 实验 , 分析比较了实验结果 ; 第 5节对本文进行总 结 2 判别 字典 学 习方法 ( D — k s v d ) 常用的训练字典方法——K— S VD算法 的描述 如公式( 1 ) 所示 : 一 a r g mi n_l x— D 口l l : D , 口 S . t . I l 口 ≤ T ( 1 ) 其 中, x为待训练数据 , D为训练字典, T为迭代终 止条件。
通过该算法训练 的字典缺乏判别性 , 不适 用于 分类 问题 为了得到一个 同时满足稀疏性和判别性 的训 练字典文献[ 7 ] 提出 D — k s v d方法 , 它 的基本思想 是通过学 习一个线 性分类器 w, 使 其能根据训 练 字典 的稀疏解 进行分类数学表示如下所示 : 一 a r g mi n l】 —D* j! ; + ) , * 【 l H —w S . t . c l a l l ≤ T ( 2 ) 解决该 问题 , 需要分 步求解训 练字典 D与线 性分类器 w, 如此将陷入局部最优化问题 , 不能得 到理想的判别字典 与分类器 将算法进一步改进 为如下形式 : 一 a r ⋯ H]一 2D,W ,a 【√ y * H J 【√ y V J S . t . I } ≤ 丁 ( 3 ) 其中, 为待训练数据 , H 为待训练数 据的类别信 息 , D为训练字典 , 为训练 的线性分类器 , 在训 练开始前 D和 w 均需要初始化 , 其 中参数 y通常 选 1 通过比较 , 该问题可以用 K— S VD算法求解 , 得到判别训练字典 D和线性分类器 W。
训练字典 流程 如 图 1 所 示 初 Fi gu r e 1 Fl ow c ha r t of t r a i n i n g di c t i o na r y u s i n g D- k s v d a l g o r i t h m 图 1 D - k s v d方法训练字典流程 图 训 练 字 典 完 成 后 ,得 到 矩 阵 (品 ) , 由 于 字 典 和线性分类器 级联在一起 且被逐列归一化 , 需 要将矩阵拆分 , 并且对字典 D重新归一化 , 字典对 应 的线 性 分类 器 w 也 需 要 进 行 换 算 如公 式 ( 4 ) 所 示 : D 一 { d , d , ⋯ , d }一 f d l d 2 d 1 1 丽 ’ ’ ⋯’ 丽 f W 一 {硼 , , ⋯ , 叫 }一 { d , d , ⋯ , d ) ㈩ ll ’ ll I1 ’ ’ ll ll 』 ¨ 1 5 2 C o mp u t e r E n g i n e e r i n g& S c i e n c e 计算机工程与科学2 0 1 4 , 3 6 ( 1 ) 归一化完成后 , 求解测试样 本 Y在训 练字典 D 上 的稀 疏 表示 口 , 如公 式 ( 5 ) 所 示 : ( > 一 a r g rai n【l Y —D * , ll : S . t . , ll 。
≤ T ( 5 ) 最终 , 线性分类器 w 作为稀疏解 a 的评价工 具决定分类结果 , 如公式( 5 ) 所示 , 向量 l 一 [ z , l , ⋯ ,z ]可看作测试样本 的类别 相似度 , 取 最大值 对 应 的类别 为最 终分 类结果 Z— W * ( 6) 在初始化字典 D 的过程 中得到初始化分类器 W 需 要 的稀疏 解 口 使用 岭 回归模 型 对线 性 分 类器 w 进行初始化 , 如公式( 7 ) 所示 : 一( r + I ) ~ *仃*/ -/ ( 7 ) 至此完成初始化工作将待训练数据 x与类 别信息H 组成一个整体 , 初始化字典 与初始化 线性分类器 组成 一个整体 , 根据公式 ( 3 ) 使用 K— S VD方法同时训 练得 到判别 字典 D 和线性分 类 器 W 3 改进初始化方法的判别字典学 习4 实验 结果及分析 D - k s v d算法在训练字典前 , 需要对字典 D 和 线性分类器 w 进行初始化初始化方法 为: 选取 待训练数据 x=[ , z , ⋯, ], 从每类训练样本 中选取一些样本构成初始化矩阵D一[ D , D , ⋯, D ], 其中 代表类别数 , 用 K — S VD方法训练得 到 D — k s v d算法的初始化字典 D , 如图 2所示 。
然 而, 部分样本不能完全表示每类样本的特点 , 使得 初始化字典 的误差增大 , 从而无法保证字典的最优 化 待训练数据 化字典 Fi gu r e 2 Fl ow c ha r t of i ni t i a l i z i ng di c t i on a r y us i n g D- ks vd a l g or i t h m 图 2 Dk s v d方法初始化字典流程 图 为了弥补这一缺点 , 我们提出了改进初始化方 法的 D — k s v d , 如 图 3所示先从 每类 中随机选 取 部分样本构成类别初始化矩阵 D , 在类 内训练小 字典 D , 其中 i 代表第 i类再将各类别 的训 练 字典 D 级联构成改进的初始化字典D 一 [ D , D , ⋯ ,D ] D 中各类样本经过训练 , 较完 整地保 留 了每类样本 的特点 , 降低 了初始化字典的误差 Fi g ur e 3 Fl o w c h a r t o f i ni t i a l i z i n g di c t i on a r y i n t he c a t e g or y u s i ng i mpr o ve d i n i t i a l i z a t i o n me t ho d o f D- ks v d a l go r i t hm 图 3 改进 初始化方法 D - k s v d类 内初始化字典 流程 图 本文采用 Ex t e n d e d Ya l e B人脸库作为实验数 据。
将 S R C l_ 】 ] 、 D- k s v d算法¨ 7 与改进初始化方法 的 D — k s v d算 法进行 分 析 比较 4 . 1 实验数 据及预 处 理 E x t e n d e d Ya l e B人脸库 包含 3 8个不 同人在 多光 照条 件下 的 2 4 1 4幅 正 面人 脸 图像 , 将 其 归 一 化 至 1 9 2 ×1 6 8大小 构成 实验 数据 集 ] 随机 选 取 每人 3 2幅共 1 2 1 6幅图像构成训练样本 , 其余为测 试样本 提 取每幅图像的随机脸 ( R a n d o m F a c e ) 特征口 ] , 即将每幅 尺 M 的图像映射到一个维数 为 R∞ ¨ 的标准正态分布随机矩阵上, 取三 次随机结果的平均值构成维数为 R∞ 的特征向量 将所有特征 向量级联构成维数 为 尺 ∞ 的训练 样本矩阵同时 , 根据训练样本的类别构建维数为 R鹅 ¨的类别标签矩 阵在 字典 的初始化 阶段 , 从 每类训 练样 本 中随机 选取 1 5幅 图像 构 成类 内初 始化矩阵, 训练类内字典再级联得到改进的初始化 字典。
训练字典的迭代终止条件为 T一2 0 所 有 实 验 均 在 Ma t l a b R 2 0 1 0 b上 运 行 实 现 计算机硬件配置 为 AMD 6 4位双核处理器, 内存 为 1 . 0 0 G B 4 . 2实验结 果 比较与 分析 我们 分 别 用 S R C 算 法 l 1 ] 、 D — k s v d算 法 l 7 】 、 改 进 初始化 方 法 的 D- k s v d算 法 , 在 E x t e n d e d Y a l e B 人脸库上进行了四组实验 , 所有结果均为三次实验 的平均值其中 S R C算法完全参考文献 [ 1 ] 中的 方法 , 分两种情况 : 一种是使用所有训练样本构成 冗余字典 , 另一种是从 每类训练样 本 中随机选取 l 5幅图像构成与训练字典相 同规模的字典 , 在表 1 中分别用 S R C和 S R C( 1 5 ) 表示 D - k s v d算 法参 考文献[ 7 ] 中的方法, 从每类训练样本 中随机选取 1 5幅 图像构 成初 始化字 典 , 训练得 到 大小 为 5 0 4 × 薛科婷 等 : 基 于改进初始化判别 K— S VD方法 的人脸识别 1 5 3 6 5 0的训练字典 , 在 表 1中用 D — k s v d表示 。
四组 实验求解稀 疏解 的方法均 为正交匹配追 踪 OMP ( Or t h o g o n a l Ma t c h i n g P u r s u i t ) 方 法 四组实验的人脸识别率如表 1 所示 , 其中改进 方法的识别率与 S RC的识别率相 同且最 高, 均为 9 3 . 7 4 % 由实 验 结果 可知 , 与 S RC 比较 , 改 进 方 法仅 使 用 了将 近一 半 的样 本 数 据, 却 达 到 了与 S R C同样高的识别率 与 D - k s v d方法相 比, 改进 方法通过类 内训练字典 的方法 降。
