电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

深度学习--人脸识别

28页
  • 卖家[上传人]:野鹰
  • 文档编号:46064774
  • 上传时间:2018-06-21
  • 文档格式:PPT
  • 文档大小:2.18MB
  • / 28 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、 Related works for feature learning 1. Learning-based descriptors2. Deep models Network ArchitectureDeep Learning Identity-Preserving Face SpaceXianhao Gan PCA是将分散在一组变量上的信息集中到某几个综合指 标(主成分)上的数学方法,实际上起着数据降维的作 用,并保证降维过程最大化保留原数据的差异。这对最大化类间差异(即不同人之间的差异)并最小化类内差异 (即同一人的不同图像间的差异)很有效用PCA将2维数据降到1维的例子,绿色点表示二维数据,PCA的目标就是找到这样一条直线,使得所有点在这条直线上的投影点之间的平均距离最大。也就是最大化地保留了原数据的差异性。本征脸本征脸(eigenfaceeigenface)方法方法是人脸识别的基准技术,并已成为事实上的工业标准, 该方法基于主成分分析(PCA)本征脸方法本征脸方法如果将本征向量恢复成图像,这些图像很像人脸 ,因此称为“本征脸”。M. Turk & A. Pentland, JC

      2、N91本征脸法认为图像的全局结构信息对于识别最重要,将图像看做矩阵,计算本征值和对应的本征向量作为代数特征进行识别,具有无需提取眼、嘴、鼻等几何特征的优点,但在单样本时识别率不高,且在人脸模式数较大时计算量大。本征特征(本征特征(eigenfeatureeigenfeature)方法)方法利用PCA分析眼、鼻、嘴等局部特征,即本征特征方法R. Brunelli & T. Poggio, TPAMI93 A. Pentland et al., CVPR94这实际上相当于:为若干重要的特征建立本征空间,然后将多个 本征空间集成起来本征脸本征脸 vs vs 本征特征本征特征本征脸利用全局特征,本征特征利用局部特征,二者各有优势待识别图像本征脸识别结果本征特征识别结果A. Pentland et al., CVPR94本征脸本征脸 vs vs 本征特征本征特征(2)(1)(3)(4)难题能否自动确定:该用哪些特征?(眼睛?鼻子?嘴?)特征的确切位置在哪儿?(从哪儿到哪儿算眼睛?)将二者结合,可以得到更好的识别效果 同样,这实际上相当于:为若干重要的特征建立本征空间,然 后将多个本征空间集成起来

      3、由于嘴部受表情影响 很严重,因此未考虑 嘴部特征深度模型(Deep models)受限波尔兹曼机RBM深度信念网络DBN卷积受限波尔兹曼机CRBM混合神经网络-受限波尔兹曼机CNN-RBM.“深度模型”是手段, “特征学习”是目的!深度学习1.什么是深度学习?2.深度学习的基本思想3.深度学习的常用方法1)自动编码机(AutoEncoder)2)稀疏编码(Sparse Coding)3)受限波尔兹曼机(Restrict Boltzmann Machine , RBM)什么是深度学习?2006年,加拿大多伦多大学教授、机器学习领域的 泰斗Geoffrey Hinton和他的学生RuslanSalakhutdinov在 科学上发表了一篇文章,开启了深度学习在学术界 和工业界的浪潮。深度学习是机器学习研究中的一个新的领域,其动 机在于建立、模拟人脑进行分析学习的神经网络,它模 仿人脑的机制来解释数据,例如图像,声音和文本,它 是无监督学习的一种。深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。深度学习的基本思想假设我们

      4、有一个系统S,它有n层(S1,Sn),它的输入是I,输出是O,形象地表示为: I =S1=S2=.=Sn = O,如果输出O等于输入I,即输入I经过这个系统变化之后没有任何的信息损失。深度学习的常用方法:1.自动编码机(AutoEncoder)Deep Learning最简单的一种方法是利用人工神经网络的特点,自动编码器就是一种尽可能复现输入信号的神经网络。为了实现这种复现,自动编码器就必须捕捉可以代表输入数据的最重要的因素,就像PCA那样,找到可以代表原信息的主要成分。1)给定无标签数据,用非监督学习学习特征2)通过编码过编码 器产产生特征,然后训练训练 下一层层。这样这样 逐层训练层训练 :稀疏自动编码器( Sparse AutoEncoder ):如果在AutoEncoder的基础上加上L1的Regularity限制(L1主要是约束每一层中的节点中大部分都要为0,只有少数不为0,这就是Sparse名字的来源),我们就可以得到Sparse AutoEncoder法。 稀疏自动编码器(Sparse AutoEncoder)Input PatchFiltersFeaturesSpars

      5、e Coding2.稀疏编码(Sparse Coding)如果我们把输出必须和输入相等的限制放松,同时 利用线性代数中基的概念,即O = a1*1 + a2*2+.+ an*n, i是基,ai是系数,我们可以得到这样一个优 化问题:Min |I O|,其中I表示输入,O表示输出。通过求解这个最优化式子,我们可以求得系数ai和 基i,这些系数和基就是输入的另外一种近似表达。因此,它们可以用来表达输入I,这个过程也是自动 学习得到的。如果我们在上述式子上加上L1的Regularity 限制,得到: Min |I O| + u*(|a1| + |a2| + + |an |)3.受限波尔兹曼机RBM假设有一个二部图(二分图),每一层的节点之间没有链接, 一层是可视层 ,即输入数据层(v),一层是隐藏层(h),如果假设 所有的节点都是随机二值变 量节点(只能取0或者1值),同时假 设全概率分布p(v,h)满足Boltzmann 分布,我们称这个模型是 Restricted BoltzmannMachine (RBM)。深度信念网络( Deep Belief Networks )深度信念网络是一个

      6、包含多层隐层(隐层数大于2) 的概率模型,每一层从前一层的隐含单元捕获高度相关 的关联。DBNs是一个概率生成模型,与传统的判别模型 的神经网络相对,生成模型是建立一个观察数据和 标签之间的联合分布,对P(Observation|Label)和 P(Label|Observation)都做了评估。典型的DNBs,可视数据v和隐含向量h的关系可 以用概率表示成如下所示形式: CRBM是为识别二维图像信息而特殊设计的一个多层感知器。概念示范:输入图像通过与m个可 训练的滤波器和可加偏置进行卷积 ,在C1层产生m个特征映射图,然 后特征映射图中每组的n个像素再 进行求和,加权值,加偏置,通过 一个Sigmoid函数得到m个S2层的特 征映射图。这些映射图再进过滤波 得到C3层。这个层级结构再和S2一 样产生S4。最终,这些像素值被光 栅化,并连接成一个向量输入到传 统的神经网络,得到输出。卷积波尔兹曼机(Convolutional RBM ) 权值共享减少参数的方法: 每个神经元无需对全局图像做感受,只需感受局部区域(Feature Map ),在高层会将这些感受不同局部的神经元综合起来获得

      7、全局信息。 每个神经元参数设为相同,即权值共享,也即每个神经元用同一个卷积 核去卷积图像。卷积波尔兹曼机(Convolutional RBM )Fully connected neural netLocally connected neural net卷积波尔兹曼机(Convolutional RBM) 多滤波器情形不同的颜色表示不同种类的滤波器p每层隐层神经元的个数按 滤波器种类的数量翻倍p每层隐层参数个数仅与滤 波器大小、滤波器种类的多 少有关例如:隐含层的每个神经元都连接 10x10像素图像区域,同时有100种 卷积核(滤波器)。则参数总个数 为:(10x10+1)x100=10100个卷积波尔兹曼机(Convolutional RBM) 隐层神经元数量的确定p神经元数量与输入图像大 小、滤波器大小和滤波器的 滑动步长有关。例如,输入图像是1000x1000像素,滤 波器大小是10x10,假设滤波器间没有 重叠,即步长为10,这样隐层的神经 元个数就是(1000x1000 )/ (10x10)=10000个卷积波尔兹曼机(Convolutional RBM)p卷积过程:用一个可训

      8、练的滤波器fx去卷积一个输入的图 像(第一阶段是输入的图像,后面的阶段就是Feature Map 了),然后加一个偏置bx,得到卷积层Cx。 p子采样过程:每邻域n个像素通过池化(pooling)步骤变 为一个像素,然后通过标量Wx+1加权,再增加偏置bx+1,然 后通过一个sigmoid激活函数,产生一个大概缩小n倍的特征 映射图Sx+1。FIP特征脸法FIP(Face Identity-Preserving)特征学习采用的是一种多层深度模型,不像DNB与DBM只利用全局特征,它结合了局部和全局的特征,网络架构类似于CRBM(卷积波尔兹曼机),但FIP是一种有监督的特征学习方式,并且FIP要求能重建恢复正面的人脸,因此这种方法对姿态和光照变量具有更好的鲁棒性。(a)LBP:Local Binary Pattern(局部二值模式) (b)LE:an unsupervised feature learning method,PCA (c)CRBM:卷积受限波尔兹曼机 (d)FIP:Face Identity-PreservingFIP深度模型网络架构(Architecture of the deep network)第一个特征提取层中,X0经过X1层后产生32个特征 映射图 ,它是通过一个包含32个子矩阵的权 重矩阵W1滤波后,对X0的某个局部特征的稀疏保留 。where is the rectified linear function that is feature-intensity- invariant.其中

      《深度学习--人脸识别》由会员野鹰分享,可在线阅读,更多相关《深度学习--人脸识别》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结 2022年家长会心得体会集合15篇
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.