电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

实验3 语音信号的端点检测

20页
  • 卖家[上传人]:suns****4568
  • 文档编号:88961387
  • 上传时间:2019-05-14
  • 文档格式:PPT
  • 文档大小:214.50KB
  • / 20 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、实验三 语音信号的端点检测,一、实验目的,1、本次实验是设计性实验,鼓励学生充分发挥自己的创造性,灵活利用所学的理论知识,设计出自己的解决方案。 2、熟悉并掌握语音端点检测技术。,二、实验原理,语音端点检测就是检测语音信号的起点和终点,因此也叫起止点识别。它是语音处理技术中的一个重要方面,其目标是要在一段输入信号中将语音信号同其它信号如背景噪声分离开来。在语音识别中,一个关键问题就是如何将语音信号精确地检测出来,为获得准确的识别提供前提。,以过零率ZCR和能量E为特征的起止点算法的根据是背景噪声与语音的短时段ZCR及E特征从统计看都有相当的区别。这里的E特征指的是能量类特征,用到的是该类特征中的短时段平均幅度M特征。 过零率的定义为:在统计的短时段中,信号波形穿越零电平的次数。,该方法的要点为:由于采集声音信号的最初的短时段为无语音段,仅有均匀分布的背景噪声信号。这样就可以用已知为静态的最初几帧(一般取帧)信号计算其过零率阈值IZCT及能量阈值ITL(低能量阈)和ITU(高能量阈)。 接下来就可以用过零率阈值IZCT及能量阈值ITL(低能量阈)和ITU(高能量阈)来进行起点及止点的判别

      2、。,先根据ITL、ITU算得一初始起点N1。方法为从第帧11开始,逐次比较每帧的平均幅度,N1为平均幅度超过的ITL第一帧的帧号。但若后续帧的平均幅度在尚未超过之前ITU又降到ITL之下,则原N1不作为初始起点,改记下一个平均幅度超过了的帧的帧号为ITL N1,依此类推,在找到第一个平均幅度超过ITU的帧时停止比较。,N1只是根据能量信息找到的起点,还未必是语音的精确起点。这是由于语音的起始段往往存在着能量很弱的清辅音,仅依靠能量很难把它们和无声区分开。但研究发现它们的过零率明显高于无声段,因此可以利用过零率这个参数来精确判断清辅音与无声区二者的分界点。 当N1确定后,从N1帧向N1-25帧搜索,依次比较各帧的过零率,若有3帧以上的ZCRIZCT,则将起点N1定为满足ZCRIZCT的最前帧的帧号,否则即以N1为起点。,语音结束点N2的检测方法与检测起点相同,从后向前搜索,找第一个平均幅度低于ITL、且其前向帧的平均幅度在超出ITU前没有下降到ILT以下的帧的帧号,记为N2,随后根据过零率向N2+25帧搜索,若有3帧以上的ZCRIZCT,则将结束点N2定为满足ZCRIZCT的最后帧的帧号

      3、,否则即以N2作为结束点。,三、实验要求,要求通过所学语音信号处理的知识,独立设计算法,实现对一段包含背景噪声且前后有一段空白的语音信号进行端点检测,找出语音的真实起点和终点。,四、实现方法,可先用麦克风录制一段语音,然后对语音加窗分帧,并利用语音增强技术最大限度地滤除背景噪声;对加窗后的语音信号求其短时平均幅度函数和短时平均过零率,然后设定这两种参数的阈值,最终在整段语音内通过两种参数与各自的阈值比较找出语音的真实起点和终点。,五、报告要求,1、实验目的及原理说明; 2、详细的算法说明; 3、实验的具体实施方案; 4、实验程序清单及实验结果; 5、实验结果分析。 6、参考文献(3-4本参考资料),例:对whut.wav声音文件进行端点检测,%声音读取 x,fs=wavread(c:whut.wav); x=x(20000:length(x); x=x; %幅度归一化到-1,1 x = double(x); x = x / max(abs(x);,%常数设置 FrameLen = 240; FrameInc = 80; amp1 = 8; amp2 = 1; zcr1 = 10; zc

      4、r2 = 5; maxsilence = 8; % 8*10ms = 80ms minlen = 15; % 15*10ms = 150ms status = 0; count = 0; silence = 0;,%计算过零率 tmp1 = enframe(x(1:end-1), FrameLen, FrameInc); tmp2 = enframe(x(2:end) , FrameLen, FrameInc); signs = (tmp1.*tmp2)0.02; zcr = sum(signs.*diffs, 2); %计算短时能量 amp = sum(abs(enframe(filter(1 -0.9375, 1, x), FrameLen, FrameInc), 2);,%调整能量门限 amp1 = min(amp1, max(amp)/4); amp2 = min(amp2, max(amp)/20); %开始端点检测 x1 = 0; x2 = 0; for n=1:length(zcr) goto = 0; switch status case 0,1 % 0 = 静音, 1

      5、 = 可能开始,if amp(n) amp1 % 确信进入语音段 x1 = max(n-count-1,1); status = 2; silence = 0; count = count + 1; elseif amp(n) amp2 | . % 可能处于语音段 zcr(n) zcr2 status = 1; count = count + 1; else % 静音状态 status = 0; count = 0; end,case 2, % 2 = 语音段 if amp(n) amp2 | . % 保持在语音段 zcr(n) zcr2 count = count + 1; else % 语音将结束 silence = silence+1; if silence maxsilence % 静音还不够长,尚未结束 count = count + 1; elseif count minlen % 语音长度太短,认为是噪声 status = 0; silence = 0; count = 0; else % 语音结束,status = 3; end end case 3, break; end end count = count-silence/2; x2 = x1 + count -1;,x1=fix(x1*length(x)/length(amp); x2=fix(x2*length(x)/length(amp); y=x(x1:x2); subplot(311) plot(x) title(原波形图) subplot(313) plot(y) title(新波形图),

      《实验3 语音信号的端点检测》由会员suns****4568分享,可在线阅读,更多相关《实验3 语音信号的端点检测》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结 2022年家长会心得体会集合15篇
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.