
多媒体技术(初级)第二章上国家人才网.docx
13页多媒体技术(初级)第二章上国家人才网本章要紧学习:了解声音的差不多概念及其属性特点、声音的数字化原理、常见的音频文件及其特点,等等需要把握的内容: Cool Edit Pro2.0声音编辑软件的使用方法第一节 数字音频基础一、声音的差不多概念 声音是因为物体的振动而产生的机械振动或气流扰动引起周围弹性媒介发生波动,产生声波产生声波的物体称为声源,如乐器、音箱等声波所及的空间范畴称为声场声波传入到人耳,通过人类听觉系统的感知确实是声音声音要紧具有以下3种属性 1.音调 音频信号可分为语音信号和非语音信号两类语音信号包含清晰、丰富的意义和内涵,是人类进行信息交流特有的形式;非语音信号要紧包括音乐和自然界存在的其他声音,非语音信号的特点是不具有复杂的语义和语法信息,识别较简单 2.音色 音色,即声音的特色声音分纯音和复音两种类型,纯音是指振幅和周期均固定的声音;复音那么是指具有不同频率和不同振幅的声音混合大自然中存在的声音绝大部分是复音在复音中,最低频率的声音是〝基音〞,它是声音的基调,其他频率的声音称为〝谐音〞,也叫泛音基音和谐音是构成复音音色的重要因素。
各种声源都具有自己专门的音色,例如各种乐器的声音、人的话语、动物的叫声等,人们绝大部分情形下是依据音色来辨别声源种类的 3.音强 音强是声音的强度,也称为声音的响度,即常说的〝音量〞音强与声波的振幅成正比,振幅越大,强度越大磁带、CD光盘等声音载体中的声音强度是一定的,然而能够通过播放设备的音量操纵来改变倾听时的响度由于物体在振动的时候并不总是规那么的,因此声音又有〝乐音〞和〝噪音〞之分规那么振动发出的是乐音,反之那么称为噪音二、声音的质量 有3种常用方法能够衡量声音的质量:一是用声音信号的带宽来度量,二是客观度量,三是主观度量评判语音质量时,经常采取复合法评估,即采取两种以上的方法综合评估 1.带宽度量图1显示了几种常见的声音带宽,带宽越大,声音的质量越好其质量等级由高到低依次是CD、FM、AM和 图1 几种觉的声音带宽对比 2.客观度量 声音客观质量的度量要紧用信噪比(Signal to Noise Ratio,SNR)来度量信噪比是指声源产生最大不失真声音信号强度与同时发出噪音强度的比率,通常以S/N表示,以分贝(dB)为单位,信噪比越高,表示声音的质量越好。
3.主观度量 与客观度量相比较,应该说人的感受更具有决定意义感受上的、主观上的印象应该成为评判声音质量不可缺少的部分有的学者认为,在语音信号编码中使用主观度量比使用客观度量更加直截了当和恰当,更有意义三、数字音频压缩标准〔1〕音频压缩方法概述在多媒体音频处理中,一样需要对数字化后的音频信号进行压缩编码,使其成为具有一定字长的二进制数字序列,并以这种形式在运算机内传输和储备,最后由解码器将二进制编码复原成原先的音频信号播放,如图2所示图2 音频压缩处理流程 所谓压缩编码技术,确实是指用某种方法使数字化信息的编码率降低的技术音频信号能进行压缩编码的差不多依据有两个:一是声音信号中存在专门大的冗余度,通过识别和去除这些冗余度,便能达到压缩编码率的目的;二是人的听觉具有一个强音能抑制一个同时存在的弱音的现象,如此就能够抑制与信号同时存在的量化噪声另外,人耳对低频端比较敏锐,而对高频端不太敏锐,由此引出了〝子带编码技术〞 一样来说,音频信号的压缩编码要紧分为无损压缩编码和有损压缩编码两大类,无损压缩编码包括不引入任何数据失确实各种熵编码;有损压缩编码又分为波形编码、参数编码和混合编码。
1.熵编码 这是以信息论变长编码定理为理论基础的编码方法,如霍夫曼编码、算术编码和行程编码等 2.波形编码 波形编码是利用采样和量化过程来表示音频信号的波形,使编码后的音频信号与原始信号的波形尽可能匹配它要紧依照人耳的听觉特性进行量化,以达到压缩数据的目的波形编码的特点是适应性强,音频质量好,在较高码率的条件下能够获得高质量的音频信号,适合于高质量的音频信号,也适合于高保真语音和音乐信号由于易受量化噪声阻碍,进一步降低编码率较困难 波形编码方法有全频带编码(脉冲编码调制(PCM)、差分脉冲编码调制(DPCM)、自适应差分脉冲编码调制(ADPCM)、子带编码(自适应变换编码(ATC)、心理学模型)和矢量量化编码等 3.参数编码 参数编码是将音频信号以某种模型来表示,利用特点提取的方法抽取必要的模型参数和鼓舞信号的信息,并对这些信息编码,最后在输出端合成原始信号其目的是重建音频,保持原始音频的特性参数编码的压缩率专门大,但运算量大,保真度不高,适合于语音信号的编码 参数编码方法有线性推测(LPC)声码器、通道声码器、共振峰声码器等 4.混合编码 混合编码是在参数编码方法的基础上,引用波形编码准那么优化鼓舞源信号的一种方案,能够在较低的码率上得到较高的音质。
混合编码方法有多脉冲线性推测编码(MPLPC)、码本鼓舞线性推测编码(CELP)、短延时码本鼓舞线性推测编码(TDCELP)、长延时线性推测规那么码鼓舞(RPELTP)等〔2〕音频压缩技术标准 1. 质量的音频压缩标准 质量语音信号的频率范畴是200~3400Hz,采纳标准的脉冲编码调制(PCM),当采样频率为8kHz、量化位数为8位时,对应的数据速率为64kb/s为了压缩音频数据,国际上从CCITT最初的G.711标准开始,已制定了一系列的语音压缩编码的标准表1所列是ITU建议的用于 质量的语音压缩标准表1 ITU建议的用于 质量的语音压缩标准 随着数字移动通信的进展,人们关于低速语音编码有了更迫切的要求1989年美国公布的数字移动通信标准CTIA,采纳矢量和鼓舞线性推测技术〔VSELP〕,速率为8kb/s为了适应保密通信的要求,美国国家安全局NSA分别于1982年和1989年制定了基于LPC、速率为2.4kb/s和基于CELP、速率为4.8kb/s的编码方案2.调幅广播质量的音频压缩标准调幅广播质量音频信号的频率范畴是50~7 000Hz,当使用16kHz的采样频率和14位的量化位数时,信号速率为224kb/s。
1988年,ITU制定了G.722标准,它可把信号速率压缩成64kb/sG.722标准采纳基于子带的ADPCM技术,将现有的带宽分成两个独立的子带信道,使输入信号进入滤波器组分成高子信号和低子信号,然后分别进行ADPCM编码,最后进入混合器形成输出码流利用G.722标准,能够在窄带ISDN的一个B信道上传输调幅广播质量的音频信号由于这种压缩方法能够在8kb/s的储备量下给出相当好的音乐信号,因此也适合于需要储备大量高质量音频信号的多媒体系统使用 3.高保真立体声音频压缩标准 高保真立体声音频信号的频率范畴是50~20000Hz,在44.1kHz采样频率下用16位量化,信号速率为每声道705kh/s目前,世界上第一个高保真立体声音频压缩标准为MPEG音频压缩算法,尽管MPEG音频标准是MPEG标准的一部分,但它也完全能够独立使用MPEG音频标准提供了3个独立的压缩层次,用户对层次的选择可在复杂性和声音质量之间进行权衡第一层的编码器最为简单,编码器的输出数据率为384kb/s,要紧用于小型数字合式磁带〔Digital Compact Cassette,DCC〕;第二层的编码器的复杂程度属于中等,编码器的输出数据率为192~256kb/s,其应用包括数字广播音频、数字音乐、CD-I和VCD等;第三层的编码器最为复杂,编码器的输出数据率为64kb/s,要紧应用于ISDN上的声音传输。
〔3〕音频压缩工具 MP3、WMA、RA格式差不多上比较流行的音频压缩文件格式,而Yamaha公司曾推出一款音频压缩文件格式VQF不管在音频压缩率依旧音质上,VQF比起MP3都有专门大的优势,但由于推广不得力,加之MP3早已深入人心,VQF格式的音乐文件在Internet上差不多逐步销声匿迹了下面介绍豪杰公司出品的MP3压缩工具,即豪杰超级解霸3000中的一个有用工具——MP3格式转换器运行MP3格式转换器,显现的界面如图3所示图3 MP3格式转换器单击【设置】按钮,在弹出的【MP3设置】对话框中能够对压缩层次、位率、频率和输出路径等进行调剂通过【添加名目】、【添加文件】、【删除所选】等操作,能够把需要压缩的各种音频文件(wav、mid、mpg、dat、ra和rm等)添加到左侧的列表框中,右边列表框自动显现相应的MP3文件单击【开始压缩】按钮,那么压缩进度栏会显示当前的进程压缩完毕后,所压缩的文件即可储存到设置的名目中总之,MP3压缩工具能方便地将各种音频格式文件转换成MP3文件,也能转换成波形文件第二节 音频处理软件一、音频处理软件Cool Edit概述〔1〕Cool Edit Pro 2.O简介 Cool Edit Pro 2.0是一个音频编辑兼多轨音频混音软件,由美国Syntrillium软件公司开发,Cool Edit是一个专门杰出的数字音乐编辑器和MP3制作软件,可同时处理多达128个音频文件,轻松地在多个音频文件中进行剪切、粘贴、合并、重叠等操作;它还提供多种特效,对音频进行放大、降低噪音、压缩、扩展、回声、失真、延迟等处理;并能够模拟生成噪音、低音、静音、 信号等。
该软件包含有CD播放器,还包括支持可选的插件、崩溃复原、自动静音检测和删除、自动节拍查找、录制等功能另外,它还能够在AIF、AU、MP3、Raw PCM、SAM、VOC、VOX、WAV等文件格式之间进行转换,同时能够储存为RealAudio格式 Cool Edit的要紧特性:128轨增强的音频编辑能力,超过40种音频成效器,mastering和音频分析工具,以及音频降噪、修复工具、音乐CD烧录、实时成效器和EQ32-bit处理精度,支持最高达32bit/192kHz精度的编辑、混音,支持视频,多轨状态下支持MIDI输入〔2〕Cool Edit 2.0的差不多操作 Cool Edit 2.0的操作界面如图4所示其常用菜单命令简介如下 1.File(文件) 此菜单中包含了常用的新建、打开、关闭、储存、另存为等命令其中需要注意的几个命令是: ①Close 关闭当前波形文件; ②Close All(Waves and Session) 关闭所有的波形文件和任务,包括驻留在内存中的未关闭波形文件; ③Close Only Non-Session Wavefrom关闭当前未使用波形文件,打开的波形多了,能够用那个命令来开释一部分内存; ④Save Selection 储存任务,假如任务中有未储存的波形也一起储存,但会提示; ⑤Free Up Space in Temp Files 删除临时文件,开释部分硬盘空间。
图4 Cool Edit2.0的操作界面 2.Edit(编辑) 此菜单中包含了常用的拷贝、剪切、粘贴、调整采样速率、转换采样格式等命令,在多轨状态下,还有缩混命令其中需要注意区分的几个命令是: ①Zero Crossings 零点穿越,使。