电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

类型多媒体音频信号处理

收藏

编号:342929945    类型:共享资源    大小:2.03MB    格式:PPT    上传时间:2023-01-18
  
10
金贝
分享到微信 分享到微博 分享到QQ空间
关 键 词:
多媒体 音频 信号 处理
资源描述:
第第4章章 多媒体音频信号处理多媒体音频信号处理第第4章章 多媒体音频多媒体音频(ynpn)信号处理信号处理4.1 音频信号概述音频信号概述4.2 音音频频信信号号的的获获取取与与处处理理(chl)4.3 话音信号的参数编码话音信号的参数编码4.4 乐器数字接口乐器数字接口MIDI4.5 声卡概述声卡概述第一页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理4.1 音频信号音频信号(xnho)概述概述1.确定信号及随机信号能够用一确定的时间函数来表示的信号就是确定信号。这种信号对应某一时刻都有一个确定的信号值。有一些信号具有不可预知的不确定性,这种信号就是随机信号。我们将要研究(ynji)的音频信号、视频信号以至计算机中的数字信号均为确定信号。第二页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理2.周期信号与非周期信号按一定时间间隔周而复始重复的信号就是周期信号,而在时间上不具有周而复始的重复特性的信号就是非周期信号。3.连续信号与离散信号信号随时间的取值是连续的,这样的信号就是连续信号。如果信号在时间上的取值是离散的,则这种信号就称为离散信号。可见(kjin),离散信号在时间上是离散的,但信号在幅度上可以是连续的,也可以是离散的。第三页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理4.模拟信号与数字信号如果信号在时间上和幅度上都是连续的,那么(nme)这样的信号就是模拟信号。模拟信号以一定时间间隔取值,则可获得离散信号,又称之为采样信号。若将离散信号进行二进制编码,以二进制编码来表示离散值的幅度,那么(nme)这种二进制编码信号叫做数字信号。在本书后面的讨论中可以看到,话筒或摄像机产生的信号为模拟信号。模拟信号经过采样可获得离散信号,离散信号经A/D转换变成二进制的数字信号,数字信号就可以由计算机直接进行处理了。模拟信号、离散信号与二进制编码的数字信号之间的关系表示在图4-1上。第四页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理图4-1模拟信号、离散(lsn)信号及数字信号第五页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理图4-1中,用连续变化的曲线表示模拟信号;用圆点表示以相等时间间隔取值而得到的离散信号;图4-1的纵坐标上标的是幅度的二进制编码值。1.采样定理(dngl)设输入信号是带宽有限的信号,最高信号频率为fm,则从采样得到信号序列(离散信号)重构(复现)连续信号的条件是采样频率fs2fm,否则,将产生混迭效应,而使信号失真。频率2fm称为奈奎斯特(Nyquist)频率fq,fq=2fm。时域信号与它的傅立叶变换频谱密度如图4-2所示。第六页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理图4-2时域信号(xnho)及其频谱密度第七页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理2.信号重构设时域信号为x(t),对应的频谱密度为X(f),若时域采样脉冲序列为是等间隔(T)的单位脉冲序列,由信号理论可知(kzh)对应的频谱为是一个等间隔(fs)频域冲激序列。其中T是时域采样序列的周期,即采样频率第八页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理可以(ky)写出时域采样序列的表达式,即x*(t)就是x(t)在t=nT处的离散序列。由卷积定理,时域的乘积对应频域的卷积,即因为是一个冲激序列,卷积的结果相当于X(f)搬移至序列出现的地方,从而成为周期函数。x(t)在时域的采样与X(f)在频域卷积(搬移)的关系如图4-3所示。第九页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理图4-3时域采样(ciyn)与频域卷积第十页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理可见,若fs=1/T不是足够(zgu)大,采样以后对应的频谱就会产生混迭,用矩形(带通)滤波器滤波所得的主频谱就会失真,恢复到时域以后,时域连续信号也将失真。因此,采样频率fs必须满足采样定理的要求,即fs2fm。图4-4音频(ynpn)信号的带宽第十一页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理4.2 音频音频(ynpn)信号的获取与处理信号的获取与处理1.常见音频信号常见的音频信号主要有电话音频信号、调频、调幅(diof)无线电广播音频信号和高保真数字的立体声音频信号。由于用途不同,这些音频信号频带宽度也各不相同,而且,在音响设备中,通常以音频信号的带宽来衡量声音的质量。图4-4中表示了这4种常见音频信号的带宽。第十二页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理图4-4表示了人们公认的音频信号的质量标准。其中,等级最高的是激光唱盘的音频信号;其次是调频无线电广播,调幅无线电广播;最低的是电话话音的频带,从0.2kHz到3.4kHz,带宽只有3.2kHz。2.声音的特性1)声音的波动性任何物体的振动通过空气的传播都会形成连续或间断的波动,这种波动引起人的耳膜的振动,变为人的听觉。因此(ync),声音是一种连续或间断的波动。第十三页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理2)声音的三要素音调、音强和音色称为声音的三要素。其中,音调与声波的频率相关,频率高则音调高,频率低则音调低。音调高时声音尖锐,俗称高音;音调低时声音沉闷(chnmn),俗称低音。人的耳朵对于声音的感知频率范围为20Hz20kHz之间。低于20Hz的声波为次声波,高于20kHz的声波称为超声波。音强取决于声波的幅度,振幅高时音强强,振幅低时音强弱。音色则由叠加在声音基波上的谐波所决定,一个声波上的谐波越丰富,音色越好。第十四页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理3)声音的连续谱声音信号一般为非周期信号,包含有一定频带的所有频率分量,其频谱是连续谱。声波的连续谱成分使声音听起来饱满、生动。4)声音的方向性声音的传播是以弹性波形式进行的,传播具有方向性,人通过到达左右两耳声波的时间差及声音强度差异来辨别声音的方向。声音的方向性是产生立体声效果(xiogu)和空间效果(xiogu)的基础。第十五页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理3.音频的种类在自然界中,声音包含声响、语音和音乐等三种形式。在多媒体系统中,声音不论是何种形式都是一种装载信息的媒体,统称为音频。由产生音频的方式不同音频被分为波形音频,MIDI音频和CD音频三类。1)波形音频以声波表示的声响、语音、音乐等各种形式的声音经过声音获取设备(例如麦克风)和声音播放设备(例如录音机、CD唱机等)输入,并通过声卡控制采样(ciyn),由A/D转换将模拟信号转变成数字信号,然后以*.WAV文件格式存储在硬盘上,这种声音媒体称为波形音频。波形音频重放时,必须经过D/A转换将数字信号转换成模拟信号,由声卡上的混音器混合后生成声波,再由音箱输出声音。第十六页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理波形音频的*.WAV文件中记录的是数字信号,可以使用计算机对*.WAV文件进行各种处理,并像其他数据文件一样被存取、复制(fzh)和传输。2)MIDI音频将电子乐器演奏时的指令信息(例如音高、音长和力度等)通过声卡上的MIDI控制器输入计算机,或者利用一种称为音序器的计算机音乐处理软件编辑产生音乐指令集合,以*.MID文件格式存储在硬盘上,这种声音媒体称为MIDI音频。MIDI音频重放时,必须经过合成器将MIDI指令译成相应的声音信号,再由声卡上的混音器混合后生成声波,最后由音箱播出音乐。第十七页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理MIDI音频的*.MID文件中可以包含多达16种不同乐器的声音定义。MIDI文件记录(jl)的不是乐曲本身,而是一些描述乐曲演奏过程中的指令,因此,MIDI音频是乐谱的数字化描述。MIDI文件的存储量比较小,因此,它可以满足较长时间音乐播放的要求,但是MIDI文件的录制工作较为复杂,需要使用MIDI创作并改编作品的专业知识以及专门化工具,例如键盘合成器等。3)CD音频CD音频是指以44.1kHz频率、16位精度采样而获得的一种立体声数字化声音。第十八页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理1.音频信号(xnho)的获取音频信号的获取框图如图4-5所示。图4-5音频信号获取(huq)框图第十九页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理2.音频信号的处理在第3章里已经提到,不管多媒体信息是音频信号还是视频信号,其数据量都是十分巨大的。如果像图4-5所示的那样,经A/D转换的数字化音频信号直接进入计算机进行存储(记录)或进行传送,是不可取的。3.音频信号的回放经压缩的音频信号以一定的格式记录在有关的媒体上,例如,磁带、磁盘及光盘等,或者以一定的格式传送到接收端。在音频信号接收端或由媒体回放音频信号时,首先由专用的硬件(ynjin)或软件对压缩数据进行解压缩,恢复音频数字信号,然后,经由图4-6所示的电路框图对音频信号进行放音。第二十页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理图4-6音频信号(xnho)的回放框图第二十一页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理4.有关音频信号的标准及规范在第1章中,已经特别说明(shumng)标准及规范在多媒体世界中的重要性。这里,首先阐明数字电话音频信号的数据压缩标准。在表4-1中列出了国际电报电话咨询委员会(CCITT),欧洲移动通信专家组(GSM),美国移动通信标准(CTIA)及美国国家安全局各自制定的有关电话通信的编码标准。表中还给出了各种标准的大致使用领域以及它们的质量,其中,质量是以最高为5.0分来表示的。第二十二页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理除了上面所提到的数字电话编码标准外,调幅广播的音频信号范围为50Hz7kHz,又称“7kHz音频信号”,其最高频率为7kHz,当使用16kHz对其采样并进行14位二进制编码时,其数据的传送(chunsn)速率为224KB/s。为了对最高频率进行压缩,CCITT于1988年为其制定了G.722标准,标准规定这种信号的数据传送(chunsn)率为64KB/s。第二十三页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理表4-1数字电话(shzdinhu)的编码标准组织ISOCCITT标准G.711G.712G.728制定时间1992197219841992传送速率(Kb/s)128643216编码算法PCMADPCMLDCELP质量5.04.34.14.0使用场合CD长途电话网络第二十四页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理GSMCTIANSAGSMGIA19831989198919821384.82.4RPELTVSELPCELPLPC3.73.83.22.5移动通信保密电话第二十五页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理5.常用语音文件格式在多媒体计算机的语音处理或在后面将要说明的声卡中所用到的操作系统或工具软件为我们提供了语音文件。这些语音文件都有各自的标准,以便于用户使用(shyng)和相互转换。在这里将简要介绍目前最常见的语音文件格式。1)VOC语音文件格式VOC语音文件由文件头和数据块两大部分组成。其中VOC语音文件的文件头如表4-2所示。第二十六页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理表4-2VOC语音(yyn)文件的文件头偏移地址内容0013H文件类型1415H从VOC文件开始到数据块的偏移量1617HVOC文件版本号1819HVOC文件标志1AHVOC文件的数据块标志1B1DH数据块长度1EH数据采样率第二十七页,共七十九页。第第4章章 多媒体音频信号处理多媒体音频信号处理由表4-2看到,VOC文件的文
展开阅读全文
提示  金锄头文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:多媒体音频信号处理
链接地址:https://www.jinchutou.com/shtml/view-342929945.html
关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.