好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

【2017年整理】音频信号处理技术.ppt

28页
  • 卖家[上传人]:油条
  • 文档编号:4119040
  • 上传时间:2017-08-06
  • 文档格式:PPT
  • 文档大小:866KB
  • / 28 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 下午8时25分,1,4.2 音频信号处理技术,课程内容:11版第4章 4.2,下午8时25分,2,音频信号处理技术,1 . 音频的数字化与MIDI合成音乐 2 . 音频媒体的管理3 . 音频处理技术(GoldWave)4 . 语音合成与识别技术,下午8时25分,3,多媒体计算机中产生声音的方式外部声音源录制和重放:Wave音频(波形音乐)MIDI电子音频,4.2.1 音频的数字化与MIDI合成音乐,下午8时25分,4,波形音频的数字化,Windows中最基本的波形声音格式:扩展名是.WAV 的文件,下午8时25分,5,波形音频的数字化,一、波形音频特征(三个参数),采样频率量化位数声道数,下午8时25分,6,采样频率:每秒从模拟声波中采集声音样本的个数 频率越高,采集的样本数越多,声音质量越好,占用存储空间越大人耳感受范围:0~20kHz 一般采用:11.025kHz、22.05kHz、44.1kHz,波形音频三个参数,对原始声波采样,采样后得到的数据,下午8时25分,7,量化位数:将采样数据按大小存储的过程 一般有8、16、32位等,量化位数越大,声音的幅度分辨率越高,还原时声音的品质越好,声音数据占用的存储空间越大,波形音频三个参数,下午8时25分,8,声道数:数字音频声音质量的另一个因素。

      一般有单声道 、双声道、多声道存储量计算:采样频率×量化位数×声道数×时间/8 (字节)举例:采样频率44.1kHz,16位量化,双声道,一分钟的音频所需要的存储量为:44.1×1000×16×2×60/8=10584000(字节),波形音频三个参数,下午8时25分,9,Wave音频文件,标准数字音频,扩展名是.WAV 多数声卡能以16位、44.1kHz采样率录制和播放 主要缺点:产生的文件太大,不适合长时间记录 压缩方法:从PCM(均匀量化)到ADPCM(自适应差分量化),下午8时25分,10,Wave音频文件的制作工具,录音机:Wave文件录制、播放和进行一些简单处理的基本工具Adobe AuditionUlead Audio EditorGoldWave,下午8时25分,11,MIDI合成音乐,MIDI(Musical Instrument Digital Interface)MIDI是乐器数字接口的缩写,文件扩展名是 .MID MIDI文件的内容是能使合成音乐芯片演奏乐曲的代码多媒体PC平台能够通过内部合成器或连接到计算机MIDI端口的外部合成器播放MIDI文件,下午8时25分,12,MIDI合成音乐,产生: 合成器:,FM合成器波表合成器,下午8时25分,13,合成器,利用DSP或其他芯片产生音乐或声音的电子装置 FM合成器采用频率调制的原理产生声音 FM合成器能发出128种乐器的声音 波表合成器对真实乐器声采样,制波表保存,由DSP查表调用处理DSP(digital signal processor)是一种独特的微处理器,是以数字信号来处理大量信息的器件。

      其工作原理是接收模拟信号,转换为0或1的数字信号,再对数字信号进行修改、删除、强化,并在其他系统芯片中把数字数据解译回模拟数据 声音效果与真实的乐器声几乎无差别声卡带有波形表ROM的接口 或 本身带有波形表ROMROM的容量越大,可存储的乐器音就越多,下午8时25分,14,MIDI音乐产生原理,MIDI标准:规定了电子乐器与计算机连接的电缆、硬件标准和通信协议乐谱的数字描述(MIDI指令信息) 由音符序列、定时和多达16个通道的演奏音符定义组成演奏音符定义由键号、通道号、音长、音量和力度组成建立MIDI文件:设备演奏时输入或软件编辑产生MIDI文件特点:是一系列指令不是波形,文件小 MIDI设备端口 :MIDI In、MIDI Out、MIDI Thru 媒体播放器可直接播放,下午8时25分,15,4.2.2 音频媒体管理,Windows Media Player媒体文件的导入媒体文件的管理,音频媒体管理,,下午8时25分,16,菜单栏,功能选项卡,播放列表,窗口切换按钮,地址栏,工具栏,导航窗格,详细信息窗格,播放控制区,下午8时25分,17,音频的格式,1. WAV格式:Windows标准波形文件,多数音频编辑软件支持,文件较大。

      2. MP3格式:高压缩比,文件较小,音质接近CD3. MIDI文件:存储指令,文件短小,播放效果因软硬件而异下午8时25分,18,音频的格式,4. CD格式:音质最好的数字音频格式,CDA文件只含索引信息5. RealAudio格式:适用网上音乐欣赏,可随带宽不同改变音质6. WMA格式:音质强于MP3,内置版权保护技术,支持音频流技术媒体的播放、转换与分享,媒体文件的播放Windows Media Player可以播放影音媒体文件、影音CD、DVD、图片声音格式的转换将CD音乐文件转换为WMA、MP3或WAVCD翻录音乐,下午8时25分,19,4.2.3 音频处理技术,音频处理:录音编辑添加音效格式转换GoldWave:数字音乐编辑器,下午8时25分,20,GoldWave界面,下午8时25分,21,使用GoldWave录音,录制从麦克风输入的声音录制计算机中其他播放器通过声卡播放的声音,下午8时25分,22,声音的编辑,剪裁波形删除波形复制、粘贴波形混音,下午8时25分,23,声音的特效处理,调整音量调整播放时间和播放速度添加回声音乐淡入淡出效果消除音乐中的静音段,下午8时25分,24,利用GoldWave转换音频格式,单个文件转换文件/另存为“保存声音为”对话框中选择保存类型批量转换文件格式文件/批处理“批处理”对话框添加文件选中“转换文件格式为”复选框选择“另存类型”,下午8时25分,25,下午8时25分,26,4.2.4 语音合成与识别,语音合成技术赋计算机“讲话”能力用语音输出结果语音识别技术 使计算机具有“听懂”语音的能力 用语音替代键盘输入,下午8时25分,27,语音合成与识别,一、语音合成技术方法:语音合成方法、参数合成方法 目标:可懂、清晰、自然、具有表现力 应用:文语转换(TTS)二、语音识别技术 ViaVoice中文连续语音识别系统输入速度:150汉字/分 识别率:95%发展方向:自然话语识别与理解解决语音识别中的一系列难题,习题与实践,实验16 多媒体技术体验准备:可以事先拍摄数码照片带来,并带相关驱动程序实验17 声音的处理准备:自己携带耳机话筒自己携带音乐CD唱片体验:语音合成:Windows讲述人语音识别:Windows语音识别,下午8时25分,28,。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.