声纹识别原理、技术及应用
78页1、声纹识别原理、技术及应用 洪青阳副教授洪青阳副教授 厦门大学信息科学与技术学院厦门大学信息科学与技术学院 E-mail: 文本无关声纹识别及应用 4 生物识别技术 1 声纹识别基本原理 2 文本相关声纹识别及应用 3 文本提示声纹识别及应用 5 总结及展望 6 主要内容 生物识别技术 当今信息社会中,在国家安全、金融、司法等 社会各个领域均需要个人身份验证。 生物特征识别(Biometrics Authentification) 技术是通过计算机与光学、声学、生物传感器 和生物统计学原理等高科技手段密切结合,利 用人体固有的生理特性(如指纹、人脸、虹膜、 声音等)来进行个人身份的鉴定。 生物特征识别技术比传统的身份鉴定方法更具 安全、保密和方便性,且具有不易遗忘、防伪 性能好、不易伪造或被盗、随身“携带”和随 时随地可用等优点。 生物识别技术 图图1 各类认证技术比较各类认证技术比较 生物识别技术 你是谁 你有什么 你知道什么 生物识别技术生物识别技术 U盾盾/密保卡等密保卡等 文本密码文本密码 生物识别技术市场 机密机密 6 错误接受率错误接受率 错误拒绝率错误拒绝率 容易实用性容
2、易实用性 处理速度处理速度/ /人人 指纹识别指纹识别 很低 较低 好 2s-5s 掌纹识别掌纹识别 低 5% 使用困难 5s-10s 人脸识别人脸识别 低 接受 宣称说话人模型 对比 是XX的 声音吗? 分类方式二 按说话内容分类 文本无关(Text-Independent) 不限定说什么文本 语种无关(Language-Independent) 语种相关(Language-Dependent) 文本相关(Text-Dependent) 要求说特定的文本(与训练阶段一致,或现场提示) 必定是语种相关的 性能评价标准 对于说话人辨认系统,其性能的评价标准主要是 正确识别率。 对于说话人确认(SV)系统,其最重要的两个指标 是错误拒绝率(FRR)与错误接受率(FAR),前者是 拒绝真实的说话人,又称“拒真率”,后者是接 受冒认者而造成的错误,又称“认假率”,两者 均与阈值的设定相关。 等错率(EER):FRR与FAR相等。 DET曲线图 文本无关声纹识别及应用 4 生物识别技术 1 声纹识别基本原理 2 文本相关声纹识别及应用 3 文本提示声纹识别及应用 5 总结及展望 6 主要内容 声
3、纹识别基本原理 特征提取过程 MFCC参数计算过程参数计算过程 分帧预加重加窗FFT MEL滤波器logDCT 语音信号 MFCC 声纹建模方法 类型类型 主要算法主要算法 文本相关文本相关 SCHMM(半连续隐马尔科夫模型) GMM-UBM 文本无关文本无关 GMM-UBM GMM-SVM(支持向量机) GMM-UBM-LFA i-vector/PLDA 文本提示文本提示 HMM(自适应算法MLLR/MAP) GMM-UBM GMM-UBM说话人确认系统 经典方法(GMM-UBM) 说话人需要建立自己的模型时,就可以通过MAP自适应 UBM来得到个性特征,即修正后的参数,从而得到自己的 GMM。 高斯混合模型(GMM) GMM本质上是一种多维概率密度函数本质上是一种多维概率密度函数 M 阶阶GMM的概率密度的概率密度函数如下:函数如下: M 阶阶GMM是用是用M个单高斯分布的线性组合来描述。个单高斯分布的线性组合来描述。 Dim 1 Dim 2 Model ( | )px MM ii ixP i cixPxP 11 ),|()|,()|( M i i c 1 1其中其中 2 )( 1
4、 )( exp 2/1 2/ )2( 1 ),|( i x i T i x i K ixP Parameters i i Dim 1 Dim 2 ( )p x Nicolas Malyska, Sanjeev Mohindra, Karen Lauro, Douglas Reynolds, and Jeremy Kepner 高斯混合模型(GMM) ci UBM UBM通用背景模型通用背景模型 UBM也是一个也是一个GMM,只是这个,只是这个GMM需要用大量的需要用大量的 不同说话人的语音数据经过训练来表示说话不同说话人的语音数据经过训练来表示说话 人无关的人无关的 特征分布,这种特征是大多数说话人的共性特征。特征分布,这种特征是大多数说话人的共性特征。 UBM采用比较大的高斯混合数采用比较大的高斯混合数(M阶阶) NIST评测:评测:2048 mixtures 实网应用:实网应用:512 mixtures 手机应用:手机应用:64128mixtures GMM优缺点 GMMGMM优点优点: 概率统计模型,通过大量训练语音数据集的统 计分布进行描述,可较好地刻画目标话者不同 情况下的特
《声纹识别原理、技术及应用》由会员suns****4568分享,可在线阅读,更多相关《声纹识别原理、技术及应用》请在金锄头文库上搜索。
土地管理与地籍测量---第八章界址点测量
人机工程学案例分析(2)
工程安全培训_201303
第9章房地产投资决策分析
第2章房地产经纪制度
ACM程序设计-东北林业大学acm05
《亲爱的汉修先生》读书交流会
中原_深圳新世界尖岗山项目市场汇报_40P_2012年_别墅_项目分析_量价走势
五年级数学质量分析演示文稿
人工智能小镇-智慧小镇建设20180525
景观基本知识及发展历程
建设工程信息管理(2)
机电驱动技术第二章步进驱动技术
工程力学-第9章圆轴扭转时的应力变形分析与强度刚度设计
第一章第二节幼儿园文化环境建设的原则
第一章检测技术的基础知识
第一章__现代表面工程技术
第六章钢结构工程
第9节项目试运行管理
班主任工作经验交流课件(4)
2023-02-24 13页
2023-01-08 279页
2023-12-29 4页
2023-02-05 14页
2023-11-19 3页
2023-06-29 3页
2022-09-22 9页
2024-02-17 14页
2023-01-19 8页
2022-10-22 7页