好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

多媒体技术应用教程之音频处理技术.ppt

60页
  • 卖家[上传人]:re****.1
  • 文档编号:591122867
  • 上传时间:2024-09-16
  • 文档格式:PPT
  • 文档大小:1.28MB
  • / 60 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 多媒体技术应用教程多媒体技术应用教程陈永强,张聪主编陈永强,张聪主编胡兵,崔树芹,苏勇参编胡兵,崔树芹,苏勇参编电子工业出版社电子工业出版社￿￿￿￿2011.81 第二章第二章 音频处理技术音频处理技术n n2.12.12.12.1 音频基本原理音频基本原理音频基本原理音频基本原理￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿2.1.12.1.12.1.12.1.1 人类听觉特性人类听觉特性人类听觉特性人类听觉特性￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿2.1.22.1.22.1.22.1.2 数字音频数字音频数字音频数字音频 2.1.3 2.1.3 声音声音声音声音 2.1.4 2.1.4 语音语音语音语音n n2.22.22.22.2常用音频压缩标准常用音频压缩标准常用音频压缩标准常用音频压缩标准￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿2.2.12.2.12.2.12.2.1音频压缩基础音频压缩基础音频压缩基础音频压缩基础￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿2.2.22.2.22.2.22.2.2常用音频压缩标准常用音频压缩标准常用音频压缩标准常用音频压缩标准￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿2.2.32.2.32.2.32.2.3音频文件格式音频文件格式音频文件格式音频文件格式n n2.32.32.32.3音频处理软件音频处理软件音频处理软件音频处理软件AuditionAudition￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿2.3.12.3.12.3.12.3.1功能介绍功能介绍功能介绍功能介绍￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿2.3.22.3.22.3.22.3.2编辑环境编辑环境编辑环境编辑环境￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿￿2.3.32.3.32.3.32.3.3基本操作基本操作基本操作基本操作n n2.4 2.4 音频实验音频实验音频实验音频实验 2.4.12.4.1音频处理实验音频处理实验音频处理实验音频处理实验 2.4.22.4.2录制歌曲实验录制歌曲实验录制歌曲实验录制歌曲实验2 第二章第二章 音频处理技术音频处理技术n n2.12.1 音频基本原理音频基本原理ØØ2.1.12.1.1 人类听觉特性人类听觉特性ØØ2.1.22.1.2 数字音频数字音频ØØ2.1.3 声音声音ØØ2.1.4 语音语音3 近十年来,随着计算机技术的高速发展,以及能同近十年来,随着计算机技术的高速发展,以及能同近十年来,随着计算机技术的高速发展,以及能同近十年来,随着计算机技术的高速发展,以及能同时满足数字信号的高压缩率和数字信号的高保真时满足数字信号的高压缩率和数字信号的高保真时满足数字信号的高压缩率和数字信号的高保真时满足数字信号的高压缩率和数字信号的高保真透明重放质量的压缩算法及标准得到大量开发与透明重放质量的压缩算法及标准得到大量开发与透明重放质量的压缩算法及标准得到大量开发与透明重放质量的压缩算法及标准得到大量开发与使用,数字音频已经广泛应用于因特网、多媒体使用,数字音频已经广泛应用于因特网、多媒体使用,数字音频已经广泛应用于因特网、多媒体使用,数字音频已经广泛应用于因特网、多媒体及无线通信系统,及无线通信系统,及无线通信系统,及无线通信系统,CDCDCDCD品质的数字音频品质的数字音频品质的数字音频品质的数字音频已经从根本已经从根本已经从根本已经从根本上替代了模拟音频。

      因此,人们对音频信号数字上替代了模拟音频因此,人们对音频信号数字上替代了模拟音频因此,人们对音频信号数字上替代了模拟音频因此,人们对音频信号数字化处理提出了越来越高的要求,相应软硬件实现化处理提出了越来越高的要求,相应软硬件实现化处理提出了越来越高的要求,相应软硬件实现化处理提出了越来越高的要求,相应软硬件实现手段的效率也在不断提高手段的效率也在不断提高手段的效率也在不断提高手段的效率也在不断提高4 ØØ2.1.12.1.1 人类听觉特性人类听觉特性音频信号的感知过程与人耳的听觉系统密不可分音频信号的感知过程与人耳的听觉系统密不可分音频信号的感知过程与人耳的听觉系统密不可分音频信号的感知过程与人耳的听觉系统密不可分对于对于对于对于人类听力感知人类听力感知人类听力感知人类听力感知的研究,其范围从人耳的生理的研究,其范围从人耳的生理的研究,其范围从人耳的生理的研究,其范围从人耳的生理设计到大脑对听觉信息的解释当前,大部分感设计到大脑对听觉信息的解释当前,大部分感设计到大脑对听觉信息的解释当前,大部分感设计到大脑对听觉信息的解释当前,大部分感知音频的编码算法都是基于心理声学模型的知音频的编码算法都是基于心理声学模型的。

      知音频的编码算法都是基于心理声学模型的知音频的编码算法都是基于心理声学模型的5 ØØ2.1.12.1.1 人类听觉特性人类听觉特性1 1 1 1.听阈与听域.听阈与听域.听阈与听域.听阈与听域2 2 2 2.音调.音调.音调.音调3 3 3 3.响度和响度级.响度和响度级.响度和响度级.响度和响度级4 4 4 4.绝对听觉门限.绝对听觉门限.绝对听觉门限.绝对听觉门限5 5 5 5.临界频带.临界频带.临界频带.临界频带6 6 6 6.同时掩蔽.同时掩蔽.同时掩蔽.同时掩蔽7 7 7 7.异时掩蔽.异时掩蔽.异时掩蔽.异时掩蔽8 8 8 8.感知熵.感知熵.感知熵.感知熵6 ØØ2.1.12.1.1 人类听觉特性人类听觉特性1 1 1 1.听阈与听域.听阈与听域.听阈与听域.听阈与听域听阈(听阈(听阈(听阈(Auditory ThresholdAuditory ThresholdAuditory ThresholdAuditory Threshold)就是指人能听到的)就是指人能听到的)就是指人能听到的)就是指人能听到的最最最最低声压级低声压级低声压级低声压级((((Sound Power LevelSound Power LevelSound Power LevelSound Power Level,,,,SPLSPLSPLSPL)。

      听域(听域(听域(听域(Audible AreaAudible AreaAudible AreaAudible Area)是指)是指)是指)是指人能感知的声音的范围人能感知的声音的范围人能感知的声音的范围人能感知的声音的范围,,,,正常人耳能够感知的频率范围大致是正常人耳能够感知的频率范围大致是正常人耳能够感知的频率范围大致是正常人耳能够感知的频率范围大致是20Hz20Hz20Hz20Hz~~~~20kHz20kHz20kHz20kHz;正常人能感知声音的声压级范围是;正常人能感知声音的声压级范围是;正常人能感知声音的声压级范围是;正常人能感知声音的声压级范围是0 0 0 0~~~~128dB128dB128dB128dB7 图图2-1 2-1 听阈听阈- -频率曲线频率曲线 8 ØØ2.1.12.1.1 人类听觉特性人类听觉特性2 2 2 2.音调.音调.音调.音调音调(音调(音调(音调(PitchPitchPitchPitch)在物理学中是指)在物理学中是指)在物理学中是指)在物理学中是指声音的高低声音的高低声音的高低声音的高低,实际上,实际上,实际上,实际上就是指人耳对不同频率声音的一种主观感受。

      就是指人耳对不同频率声音的一种主观感受就是指人耳对不同频率声音的一种主观感受就是指人耳对不同频率声音的一种主观感受音音音音调主要由声音的频率决定调主要由声音的频率决定调主要由声音的频率决定调主要由声音的频率决定,同时也与声音强度有,同时也与声音强度有,同时也与声音强度有,同时也与声音强度有关频率高的声音,人感觉其音调也较高,反之,关频率高的声音,人感觉其音调也较高,反之,关频率高的声音,人感觉其音调也较高,反之,关频率高的声音,人感觉其音调也较高,反之,人感知音调低的声音其频率也低人感知音调低的声音其频率也低人感知音调低的声音其频率也低人感知音调低的声音其频率也低对音调可以进行定量的判断,其度量单位为对音调可以进行定量的判断,其度量单位为对音调可以进行定量的判断,其度量单位为对音调可以进行定量的判断,其度量单位为美美美美((((MelMelMelMel),),),),定义一个声压级为定义一个声压级为定义一个声压级为定义一个声压级为40dB40dB40dB40dB,频率为,频率为,频率为,频率为1kHz1kHz1kHz1kHz的的的的纯音的音调为纯音的音调为纯音的音调为纯音的音调为1000Mel1000Mel1000Mel1000Mel。

      9 ØØ2.1.12.1.1 人类听觉特性人类听觉特性3 3 3 3.响度和响度级.响度和响度级.响度和响度级.响度和响度级响度(响度(响度(响度(LoudnessLoudnessLoudnessLoudness)是)是)是)是人耳感受声音强弱人耳感受声音强弱人耳感受声音强弱人耳感受声音强弱的主观感觉的主观感觉的主观感觉的主观感觉程度,这种感觉与音强、频率和波形都有关系,程度,这种感觉与音强、频率和波形都有关系,程度,这种感觉与音强、频率和波形都有关系,程度,这种感觉与音强、频率和波形都有关系,其度量单位为宋(其度量单位为宋(其度量单位为宋(其度量单位为宋(SoneSoneSoneSone),定义一个声压级为),定义一个声压级为),定义一个声压级为),定义一个声压级为40dB40dB40dB40dB,频率为,频率为,频率为,频率为1kHz1kHz1kHz1kHz的纯音的响度为的纯音的响度为的纯音的响度为的纯音的响度为1Sone1Sone1Sone1Sone响度级(响度级(响度级(响度级(Loudness LevelLoudness LevelLoudness LevelLoudness Level)是)是)是)是指某响度与基准响度指某响度与基准响度指某响度与基准响度指某响度与基准响度相比的等级相比的等级相比的等级相比的等级,其度量单位为方(,其度量单位为方(,其度量单位为方(,其度量单位为方(PhonPhonPhonPhon),定义),定义),定义),定义1kHz1kHz1kHz1kHz纯音的响度级为纯音的响度级为纯音的响度级为纯音的响度级为1Phon1Phon1Phon1Phon。

      10 图图2-2 2-2 人耳可听最小响度曲线人耳可听最小响度曲线 11 ØØ2.1.12.1.1 人类听觉特性人类听觉特性4 4 4 4.绝对听觉门限.绝对听觉门限.绝对听觉门限.绝对听觉门限绝对听觉门限(绝对听觉门限(绝对听觉门限(绝对听觉门限(Absolute Threshold of HearingAbsolute Threshold of HearingAbsolute Threshold of HearingAbsolute Threshold of Hearing,,,,ATHATHATHATH)指一个人在没有噪声的环境下,能够产生听)指一个人在没有噪声的环境下,能够产生听)指一个人在没有噪声的环境下,能够产生听)指一个人在没有噪声的环境下,能够产生听觉,感知到一个纯音信号(某频率点)的最小能觉,感知到一个纯音信号(某频率点)的最小能觉,感知到一个纯音信号(某频率点)的最小能觉,感知到一个纯音信号(某频率点)的最小能量幅度 绝对听觉门限用声压级表示,静音为绝对听觉门限用声压级表示,静音为绝对听觉门限用声压级表示,静音为绝对听觉门限用声压级表示,静音为0dB0dB0dB0dB,痛阈为,痛阈为,痛阈为,痛阈为140dB140dB140dB140dB。

      12 图图2-3 2-3 绝对听觉门限曲线绝对听觉门限曲线 13 ØØ2.1.12.1.1 人类听觉特性人类听觉特性5 5 5 5.临界频带.临界频带.临界频带.临界频带指一个纯音可以被以它为中心频率,并且具有一定指一个纯音可以被以它为中心频率,并且具有一定指一个纯音可以被以它为中心频率,并且具有一定指一个纯音可以被以它为中心频率,并且具有一定频带宽度的连续噪声所掩蔽,在这一频带内噪声频带宽度的连续噪声所掩蔽,在这一频带内噪声频带宽度的连续噪声所掩蔽,在这一频带内噪声频带宽度的连续噪声所掩蔽,在这一频带内噪声功率等于该纯音的功率使该纯音处于刚能被听功率等于该纯音的功率使该纯音处于刚能被听功率等于该纯音的功率使该纯音处于刚能被听功率等于该纯音的功率使该纯音处于刚能被听到的临界状态,即称这一带宽为临界频带宽度到的临界状态,即称这一带宽为临界频带宽度到的临界状态,即称这一带宽为临界频带宽度到的临界状态,即称这一带宽为临界频带宽度临界频带的单位为巴克(临界频带的单位为巴克(临界频带的单位为巴克(临界频带的单位为巴克(BarkBarkBarkBark)￿14 ØØ2.1.12.1.1 人类听觉特性人类听觉特性6 6 6 6.同时掩蔽.同时掩蔽.同时掩蔽.同时掩蔽掩蔽效应是指当两个响度不等的声音作用于掩蔽效应是指当两个响度不等的声音作用于人耳时,响度较高的频率成分的存在会影人耳时,响度较高的频率成分的存在会影响到对响度较低的频率成分的感知。

      响到对响度较低的频率成分的感知 当两个或更多的音频信号到达人内耳时,掩当两个或更多的音频信号到达人内耳时,掩蔽声与被掩蔽声同时作用发生掩蔽效应,蔽声与被掩蔽声同时作用发生掩蔽效应,就称同时掩蔽就称同时掩蔽￿15 ØØ2.1.12.1.1 人类听觉特性人类听觉特性7 7 7 7.异时掩蔽.异时掩蔽.异时掩蔽.异时掩蔽指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现的指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现的指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现的指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现的情况下若掩蔽声音出现之前的一段时间内发生掩蔽效应,若掩蔽声音出现之前的一段时间内发生掩蔽效应,若掩蔽声音出现之前的一段时间内发生掩蔽效应,若掩蔽声音出现之前的一段时间内发生掩蔽效应,则称为超前掩蔽,否则称为滞后掩蔽则称为超前掩蔽,否则称为滞后掩蔽则称为超前掩蔽,否则称为滞后掩蔽则称为超前掩蔽,否则称为滞后掩蔽 16 ØØ2.1.12.1.1 人类听觉特性人类听觉特性8 8 8 8.感知熵.感知熵.感知熵.感知熵感知熵(感知熵(感知熵(感知熵(Perceptual EntropyPerceptual EntropyPerceptual EntropyPerceptual Entropy)指利用心理声学的)指利用心理声学的)指利用心理声学的)指利用心理声学的掩蔽现象和信号能量化原理来测量音频信号中感掩蔽现象和信号能量化原理来测量音频信号中感掩蔽现象和信号能量化原理来测量音频信号中感掩蔽现象和信号能量化原理来测量音频信号中感知相关的信息。

      一般以位(知相关的信息一般以位(知相关的信息一般以位(知相关的信息一般以位(bitbitbitbit)作为单位,实际)作为单位,实际)作为单位,实际)作为单位,实际上表示了音频信号压缩的理论极限上表示了音频信号压缩的理论极限上表示了音频信号压缩的理论极限上表示了音频信号压缩的理论极限￿17 ØØ2.1.22.1.22.1.22.1.2 数字音频数字音频数字音频数字音频音频信号是音频信号是音频信号是音频信号是时间和幅度都连续变化的一维模拟信号时间和幅度都连续变化的一维模拟信号时间和幅度都连续变化的一维模拟信号时间和幅度都连续变化的一维模拟信号,,,,要想在计算机中对它进行处理,就要将它变成时要想在计算机中对它进行处理,就要将它变成时要想在计算机中对它进行处理,就要将它变成时要想在计算机中对它进行处理,就要将它变成时间和幅度都是离散的数字信号,所以间和幅度都是离散的数字信号,所以间和幅度都是离散的数字信号,所以间和幅度都是离散的数字信号,所以数字音频是数字音频是数字音频是数字音频是指音频信号经过离散化处理后再用一系列的数字指音频信号经过离散化处理后再用一系列的数字指音频信号经过离散化处理后再用一系列的数字指音频信号经过离散化处理后再用一系列的数字来表示的信号来表示的信号来表示的信号来表示的信号,其特点是保真度好,动态范围大。

      其特点是保真度好,动态范围大其特点是保真度好,动态范围大其特点是保真度好,动态范围大数字音频可分为数字音频可分为数字音频可分为数字音频可分为波形声音波形声音波形声音波形声音、、、、语音语音语音语音和和和和音乐音乐音乐音乐波形声音波形声音波形声音波形声音实际上包含了所有的声音形式,因此数字音频有实际上包含了所有的声音形式,因此数字音频有实际上包含了所有的声音形式,因此数字音频有实际上包含了所有的声音形式,因此数字音频有时也泛称为声音时也泛称为声音时也泛称为声音时也泛称为声音18 n n2.1.22.1.2 数字音频数字音频用计算机来处理音频信号必须将模拟音频信号转换用计算机来处理音频信号必须将模拟音频信号转换用计算机来处理音频信号必须将模拟音频信号转换用计算机来处理音频信号必须将模拟音频信号转换成有限个数字表示的离散序列,过程为:成有限个数字表示的离散序列,过程为:成有限个数字表示的离散序列,过程为:成有限个数字表示的离散序列,过程为:选择采选择采选择采选择采样频率,即进行采样样频率,即进行采样样频率,即进行采样样频率,即进行采样;;;;选择分辨率,即进行量化选择分辨率,即进行量化选择分辨率,即进行量化选择分辨率,即进行量化;;;;最后编码形成声音文件。

      声音的采样与量化如图最后编码形成声音文件声音的采样与量化如图最后编码形成声音文件声音的采样与量化如图最后编码形成声音文件声音的采样与量化如图所示19 ØØ2.1.22.1.2 数字音频数字音频1.采样采样采样(采样(采样(采样(SamplingSamplingSamplingSampling)指把模拟信号在时域上以)指把模拟信号在时域上以)指把模拟信号在时域上以)指把模拟信号在时域上以固定的时间间隔固定的时间间隔固定的时间间隔固定的时间间隔对波形的值进行抽取,再用若干位二进制数表示对波形的值进行抽取,再用若干位二进制数表示对波形的值进行抽取,再用若干位二进制数表示对波形的值进行抽取,再用若干位二进制数表示对声音波形对声音波形对声音波形对声音波形采样的频率直接影响声音的质量采样的频率直接影响声音的质量采样的频率直接影响声音的质量采样的频率直接影响声音的质量,采样频率越高,,采样频率越高,,采样频率越高,,采样频率越高,声音保真度越好,但所要求的数据存储量也越大声音保真度越好,但所要求的数据存储量也越大声音保真度越好,但所要求的数据存储量也越大声音保真度越好,但所要求的数据存储量也越大根据采样定理,当根据采样定理,当根据采样定理,当根据采样定理,当采样频率大于信号最高频率的两倍时采样频率大于信号最高频率的两倍时采样频率大于信号最高频率的两倍时采样频率大于信号最高频率的两倍时,在,在,在,在采样过程中就不会丢失信息,并且可以用采样后的信号重采样过程中就不会丢失信息,并且可以用采样后的信号重采样过程中就不会丢失信息,并且可以用采样后的信号重采样过程中就不会丢失信息,并且可以用采样后的信号重构原始信号,从而不失真地还原出原始的声音信号。

      构原始信号,从而不失真地还原出原始的声音信号构原始信号,从而不失真地还原出原始的声音信号构原始信号,从而不失真地还原出原始的声音信号对于音频,最常用的采样频率有三种:对于音频,最常用的采样频率有三种:对于音频,最常用的采样频率有三种:对于音频,最常用的采样频率有三种:44.1kHz44.1kHz44.1kHz44.1kHz、、、、22.05 kHz22.05 kHz22.05 kHz22.05 kHz和和和和11.025 kHz11.025 kHz11.025 kHz11.025 kHz,其中,其中,其中,其中44.1kHz44.1kHz44.1kHz44.1kHz采样频率是最常用的采样频率是最常用的采样频率是最常用的采样频率是最常用的声道数是声音通道的个数,指一次采样的声道数是声音通道的个数,指一次采样的声道数是声音通道的个数,指一次采样的声道数是声音通道的个数,指一次采样的声音波形个数声音波形个数声音波形个数声音波形个数 20 ØØ2.1.22.1.2 数字音频数字音频2.量化量化量化(量化(量化(量化(QuantityQuantityQuantityQuantity)的目的是将采样后的信号波形的)的目的是将采样后的信号波形的)的目的是将采样后的信号波形的)的目的是将采样后的信号波形的幅度值(样本)进行离散化处理,样本从模拟量幅度值(样本)进行离散化处理,样本从模拟量幅度值(样本)进行离散化处理,样本从模拟量幅度值(样本)进行离散化处理,样本从模拟量转化成了数字量。

      转化成了数字量转化成了数字量转化成了数字量量化位数越多,所得到的量化值越接近原始波形的量化位数越多,所得到的量化值越接近原始波形的量化位数越多,所得到的量化值越接近原始波形的量化位数越多,所得到的量化值越接近原始波形的采样值量化方式有三种:量化方式有三种:量化方式有三种:量化方式有三种:零记忆量化零记忆量化零记忆量化零记忆量化、、、、分组量化分组量化分组量化分组量化和和和和序列量序列量序列量序列量化化化化21 ØØ2.1.3 声音声音声学是研究声音的学科,包括声波的产生、传播和声学是研究声音的学科,包括声波的产生、传播和声学是研究声音的学科,包括声波的产生、传播和声学是研究声音的学科,包括声波的产生、传播和接收物体振动在弹性体里的传播称为接收物体振动在弹性体里的传播称为接收物体振动在弹性体里的传播称为接收物体振动在弹性体里的传播称为波波波波,而在,而在,而在,而在空气中传播的波就称为空气中传播的波就称为空气中传播的波就称为空气中传播的波就称为声波声波声波声波,能被人的听觉器官,能被人的听觉器官,能被人的听觉器官,能被人的听觉器官所感觉到的声波叫所感觉到的声波叫所感觉到的声波叫所感觉到的声波叫声音声音声音声音,其频率一般在,其频率一般在,其频率一般在,其频率一般在20Hz20Hz20Hz20Hz~~~~20kHz20kHz20kHz20kHz之间。

      之间￿22 ØØ2.1.3 声音声音声音的三要素是声音的三要素是声音的三要素是声音的三要素是音调音调音调音调、、、、音色音色音色音色和和和和音强音强音强音强 音调是指声音的高低,音调与频率有关音调是指声音的高低,音调与频率有关音调是指声音的高低,音调与频率有关音调是指声音的高低,音调与频率有关音色是指具有特色的声音音色是指具有特色的声音音色是指具有特色的声音音色是指具有特色的声音 音强是指声音的强度,也称为声音的响度,音强与音强是指声音的强度,也称为声音的响度,音强与音强是指声音的强度,也称为声音的响度,音强与音强是指声音的强度,也称为声音的响度,音强与声波的振幅成正比声波的振幅成正比声波的振幅成正比声波的振幅成正比 23 ØØ2.1.3 声音声音声音的质量简称音质声音的质量简称音质声音的质量简称音质声音的质量简称音质1 1 1 1))))与采样频率有关与采样频率有关与采样频率有关与采样频率有关对于数字音频信号,对于数字音频信号,对于数字音频信号,对于数字音频信号,音质的好音质的好音质的好音质的好坏与数据采样频率和数据位数有关坏与数据采样频率和数据位数有关坏与数据采样频率和数据位数有关坏与数据采样频率和数据位数有关。

      采样频率越采样频率越采样频率越采样频率越低,位数越少,音质越差低,位数越少,音质越差低,位数越少,音质越差低,位数越少,音质越差2 2 2 2))))与音频处理设备有关与音频处理设备有关与音频处理设备有关与音频处理设备有关音响放大器和扬声器的质音响放大器和扬声器的质音响放大器和扬声器的质音响放大器和扬声器的质量能够直接影响重放的质量量能够直接影响重放的质量量能够直接影响重放的质量量能够直接影响重放的质量3 3 3 3))))与信号噪声比有关与信号噪声比有关与信号噪声比有关与信号噪声比有关在录音时,音频信号幅度与在录音时,音频信号幅度与在录音时,音频信号幅度与在录音时,音频信号幅度与噪声幅度的比值越大越好,否则声音被噪声干扰,噪声幅度的比值越大越好,否则声音被噪声干扰,噪声幅度的比值越大越好,否则声音被噪声干扰,噪声幅度的比值越大越好,否则声音被噪声干扰,会影响音质会影响音质会影响音质会影响音质24 ØØ2.1.3 语音语音语音是一种特殊的媒体,语音是人类所特有的,但语音是一种特殊的媒体,语音是人类所特有的,但语音是一种特殊的媒体,语音是人类所特有的,但语音是一种特殊的媒体,语音是人类所特有的,但也是也是也是也是一种波形一种波形一种波形一种波形,在计算机中表示方式与波形声音,在计算机中表示方式与波形声音,在计算机中表示方式与波形声音,在计算机中表示方式与波形声音的文件格式相同。

      的文件格式相同的文件格式相同的文件格式相同语音处理的研究已经有一百多年的历史,其研究范语音处理的研究已经有一百多年的历史,其研究范语音处理的研究已经有一百多年的历史,其研究范语音处理的研究已经有一百多年的历史,其研究范围主要涉及:围主要涉及:围主要涉及:围主要涉及:语音合成语音合成语音合成语音合成、、、、语音编码语音编码语音编码语音编码、、、、语音识别语音识别语音识别语音识别的的的的基本算法和应用基本算法和应用基本算法和应用基本算法和应用计算机处理语音过程如图所示计算机处理语音过程如图所示计算机处理语音过程如图所示计算机处理语音过程如图所示25 图图2-8 2-8 计算机处理语音过程计算机处理语音过程 26 第二章第二章 音频处理技术音频处理技术n n2.22.2常用音频压缩标准常用音频压缩标准ØØ2.2.12.2.1音频压缩基础音频压缩基础ØØ2.2.22.2.2常用音频压缩标准常用音频压缩标准ØØ2.2.32.2.3音频文件格式音频文件格式27 ØØ2.2.12.2.1音频压缩基础音频压缩基础1 1 1 1.数据压缩条件.数据压缩条件.数据压缩条件.数据压缩条件2 2 2 2.数据冗余.数据冗余.数据冗余.数据冗余3 3 3 3.数据压缩算法分类.数据压缩算法分类.数据压缩算法分类.数据压缩算法分类28 ØØ2.2.12.2.1音频压缩基础音频压缩基础1 1 1 1.数据压缩条件.数据压缩条件.数据压缩条件.数据压缩条件信号之所以能被压缩和编码,其原因主要是:信号之所以能被压缩和编码,其原因主要是:信号之所以能被压缩和编码,其原因主要是:信号之所以能被压缩和编码,其原因主要是:1 1 1 1)数据冗余度)数据冗余度)数据冗余度)数据冗余度2 2 2 2)人类不敏感因素)人类不敏感因素)人类不敏感因素)人类不敏感因素3 3 3 3)信息传输与存储)信息传输与存储)信息传输与存储)信息传输与存储 29 ØØ2.2.12.2.1音频压缩基础音频压缩基础2 2 2 2.数据冗余.数据冗余.数据冗余.数据冗余冗余是指信息所具有的各种性质中多余的无用空间,冗余是指信息所具有的各种性质中多余的无用空间,冗余是指信息所具有的各种性质中多余的无用空间,冗余是指信息所具有的各种性质中多余的无用空间,其多余的程度称为冗余度。

      其多余的程度称为冗余度其多余的程度称为冗余度其多余的程度称为冗余度 冗余大致可分为空间冗余、时间冗余、统计冗余、冗余大致可分为空间冗余、时间冗余、统计冗余、冗余大致可分为空间冗余、时间冗余、统计冗余、冗余大致可分为空间冗余、时间冗余、统计冗余、结构冗余、信息熵冗余和知识冗余等结构冗余、信息熵冗余和知识冗余等结构冗余、信息熵冗余和知识冗余等结构冗余、信息熵冗余和知识冗余等￿30 ØØ2.2.12.2.1音频压缩基础音频压缩基础3 3 3 3.数据压缩算法分类.数据压缩算法分类.数据压缩算法分类.数据压缩算法分类图图2-10 2-10 数据压缩数据压缩算法分类算法分类 31 ØØ2.2.22.2.2常用音频压缩标准常用音频压缩标准1 1 1 1....G.711 64Kb/sG.711 64Kb/sG.711 64Kb/sG.711 64Kb/s脉冲编码调制(脉冲编码调制(脉冲编码调制(脉冲编码调制(PCMPCMPCMPCM))))2 2 2 2....G.721G.721G.721G.721自适应差分脉冲编码调制(自适应差分脉冲编码调制(自适应差分脉冲编码调制(自适应差分脉冲编码调制(ADPCMADPCMADPCMADPCM))))3 3 3 3....G.722 7kHzG.722 7kHzG.722 7kHzG.722 7kHz声音编码器声音编码器声音编码器声音编码器4 4 4 4....G.723 G.723 G.723 G.723 双速率语音编码器双速率语音编码器双速率语音编码器双速率语音编码器5 5 5 5....G.728 16Kb/sG.728 16Kb/sG.728 16Kb/sG.728 16Kb/s低延迟码激励线性预测编码(低延迟码激励线性预测编码(低延迟码激励线性预测编码(低延迟码激励线性预测编码(LD-CELPLD-CELPLD-CELPLD-CELP))))6 6 6 6....G.729 G.729 G.729 G.729 语音编码器语音编码器语音编码器语音编码器7 7 7 7....MPEG-1MPEG-1MPEG-1MPEG-1音频编码音频编码音频编码音频编码8 8 8 8....ACACACAC音频编码音频编码音频编码音频编码9 9 9 9.空间音频编码.空间音频编码.空间音频编码.空间音频编码10101010.移动音频编码.移动音频编码.移动音频编码.移动音频编码32 ØØ2.2.22.2.2常用音频压缩标准常用音频压缩标准1 1 1 1....G.711 64Kb/sG.711 64Kb/sG.711 64Kb/sG.711 64Kb/s脉冲编码调制(脉冲编码调制(脉冲编码调制(脉冲编码调制(PCMPCMPCMPCM))))脉冲编码调制(脉冲编码调制(脉冲编码调制(脉冲编码调制(Pulse Code ModulationPulse Code ModulationPulse Code ModulationPulse Code Modulation,,,,PCMPCMPCMPCM)是)是)是)是ITUITUITUITU制定出来的一套语音压缩标准,主要用于。

      制定出来的一套语音压缩标准,主要用于制定出来的一套语音压缩标准,主要用于制定出来的一套语音压缩标准,主要用于 1972197219721972年,年,年,年,CCITTCCITTCCITTCCITT对一个对一个对一个对一个64Kb/s64Kb/s64Kb/s64Kb/s压扩型压扩型压扩型压扩型PCMPCMPCMPCM编码器做了编码器做了编码器做了编码器做了标准化,称为标准化,称为标准化,称为标准化,称为G.711G.711G.711G.711这个标准主要有两种压缩算这个标准主要有两种压缩算这个标准主要有两种压缩算这个标准主要有两种压缩算法,在北美和日本,使用法,在北美和日本,使用法,在北美和日本,使用法,在北美和日本,使用μμμμ律律律律PCMPCMPCMPCM;而世界其他国;而世界其他国;而世界其他国;而世界其他国家使用家使用家使用家使用A A A A律律律律PCMPCMPCMPCM G.711G.711G.711G.711在在在在64Kb/s64Kb/s64Kb/s64Kb/s速率话音质量能够达到网络等级,目速率话音质量能够达到网络等级,目速率话音质量能够达到网络等级,目速率话音质量能够达到网络等级,目前已广泛应用于各种数字通信系统中,如电缆、前已广泛应用于各种数字通信系统中,如电缆、前已广泛应用于各种数字通信系统中,如电缆、前已广泛应用于各种数字通信系统中,如电缆、微波、卫星、光缆等。

      微波、卫星、光缆等微波、卫星、光缆等微波、卫星、光缆等￿ ￿33 ØØ2.2.22.2.2常用音频压缩标准常用音频压缩标准2 2 2 2....G.721G.721G.721G.721自适应差分脉冲编码调制(自适应差分脉冲编码调制(自适应差分脉冲编码调制(自适应差分脉冲编码调制(ADPCMADPCMADPCMADPCM))))自适应差分脉冲编码调制(自适应差分脉冲编码调制(自适应差分脉冲编码调制(自适应差分脉冲编码调制(Adaptive Differential Adaptive Differential Adaptive Differential Adaptive Differential Pulse Code ModulationPulse Code ModulationPulse Code ModulationPulse Code Modulation,,,,ADPCMADPCMADPCMADPCM)在)在)在)在PCMPCMPCMPCM的基础上的基础上的基础上的基础上进行改进,进一步利用了语音信号样点间的相关进行改进,进一步利用了语音信号样点间的相关进行改进,进一步利用了语音信号样点间的相关进行改进,进一步利用了语音信号样点间的相关性,并针对语音信号的非平稳特点,使用了自适性,并针对语音信号的非平稳特点,使用了自适性,并针对语音信号的非平稳特点,使用了自适性,并针对语音信号的非平稳特点,使用了自适应预测和自适应量化应预测和自适应量化应预测和自适应量化应预测和自适应量化 1984198419841984年,年,年,年,CCITTCCITTCCITTCCITT首先对首先对首先对首先对32Kb/s ADPCM32Kb/s ADPCM32Kb/s ADPCM32Kb/s ADPCM做了标准化,称做了标准化,称做了标准化,称做了标准化,称为为为为G.721G.721G.721G.721。

      G.721G.721G.721G.721于于于于1986198619861986年根据两年间运行中出现的一些问题,年根据两年间运行中出现的一些问题,年根据两年间运行中出现的一些问题,年根据两年间运行中出现的一些问题,做了进一步修正,又重新标准化做了进一步修正,又重新标准化做了进一步修正,又重新标准化做了进一步修正,又重新标准化 34 Ø2.2.22.2.2常用音频压缩标准常用音频压缩标准3 3..G.722 7kHzG.722 7kHz声音编码器声音编码器1988198819881988年,正式通过关于年,正式通过关于年,正式通过关于年,正式通过关于““““用用用用64Kb/s64Kb/s64Kb/s64Kb/s或低于此编码速或低于此编码速或低于此编码速或低于此编码速率的率的率的率的7kHz7kHz7kHz7kHz音频信号编码器音频信号编码器音频信号编码器音频信号编码器””””的标准,称为的标准,称为的标准,称为的标准,称为G.722G.722G.722G.722 G.722G.722G.722G.722的主要目标是保持的主要目标是保持的主要目标是保持的主要目标是保持64Kb/s64Kb/s64Kb/s64Kb/s的数据率,而音频信的数据率,而音频信的数据率,而音频信的数据率,而音频信号的质量要明显高于号的质量要明显高于号的质量要明显高于号的质量要明显高于G.711G.711G.711G.711的质量。

      的质量￿35 Ø.2.2.2.2常用音频压缩标准常用音频压缩标准4 4..G.723 G.723 双速率语音编码器双速率语音编码器G.723G.723G.723G.723是在是在是在是在1996199619961996年制定的一种多媒体语音编解码标准年制定的一种多媒体语音编解码标准年制定的一种多媒体语音编解码标准年制定的一种多媒体语音编解码标准 G.723G.723G.723G.723标准传输码率有标准传输码率有标准传输码率有标准传输码率有5.3Kb/s5.3Kb/s5.3Kb/s5.3Kb/s和和和和6.3Kb/s6.3Kb/s6.3Kb/s6.3Kb/s两种,在编两种,在编两种,在编两种,在编程过程中可随时切换程过程中可随时切换程过程中可随时切换程过程中可随时切换￿36 ØØ2.2.22.2.2常用音频压缩标准常用音频压缩标准5 5 5 5....G.728 16Kb/sG.728 16Kb/sG.728 16Kb/sG.728 16Kb/s低延迟码激励线性预测编码(低延迟码激励线性预测编码(低延迟码激励线性预测编码(低延迟码激励线性预测编码(LD-LD-LD-LD-CELPCELPCELPCELP))))G.728G.728G.728G.728的工作进程是从的工作进程是从的工作进程是从的工作进程是从1988198819881988年开始的,试图建立通用年开始的,试图建立通用年开始的,试图建立通用年开始的,试图建立通用的的的的16Kb/s16Kb/s16Kb/s16Kb/s长话质量的语音编码标准。

      长话质量的语音编码标准长话质量的语音编码标准长话质量的语音编码标准 G.728G.728G.728G.728开始是按照浮点开始是按照浮点开始是按照浮点开始是按照浮点CELPCELPCELPCELP编码算法规定的编码算法规定的编码算法规定的编码算法规定的 1994199419941994年完成了按照严格定点规定的算法年完成了按照严格定点规定的算法年完成了按照严格定点规定的算法年完成了按照严格定点规定的算法37 Ø2.2.22.2.2常用音频压缩标准常用音频压缩标准6 6..G G.729 .729 语音编码器语音编码器在在在在1996199619961996年年年年3 3 3 3月,月,月,月,ITU-TITU-TITU-TITU-T的第的第的第的第15151515研究小组提出研究小组提出研究小组提出研究小组提出8Kb/s8Kb/s8Kb/s8Kb/s的语的语的语的语音编码协议,称为音编码协议,称为音编码协议,称为音编码协议,称为G.729G.729G.729G.729 G.729G.729G.729G.729标准使用的算法是共轭结构的代数码本激励线标准使用的算法是共轭结构的代数码本激励线标准使用的算法是共轭结构的代数码本激励线标准使用的算法是共轭结构的代数码本激励线性预测(性预测(性预测(性预测(CS-ACELPCS-ACELPCS-ACELPCS-ACELP),它基于),它基于),它基于),它基于CELPCELPCELPCELP编码模型。

      编码模型编码模型编码模型￿38 Ø2.2.22.2.2常用音频压缩标准常用音频压缩标准7 7..MPEG-1MPEG-1音频编码音频编码MPEG-1MPEG-1MPEG-1MPEG-1音频编码作为音频编码作为音频编码作为音频编码作为MPEGMPEGMPEGMPEG标准的一部分,对应于标准的一部分,对应于标准的一部分,对应于标准的一部分,对应于ISO/IEC 11172-3ISO/IEC 11172-3ISO/IEC 11172-3ISO/IEC 11172-3,规定了高质量音频编码方法、,规定了高质量音频编码方法、,规定了高质量音频编码方法、,规定了高质量音频编码方法、存储表示和解码方法存储表示和解码方法存储表示和解码方法存储表示和解码方法￿39 ØØ2.2.22.2.2常用音频压缩标准常用音频压缩标准8 8 8 8....ACACACAC音频编码音频编码音频编码音频编码杜比实验室在杜比实验室在杜比实验室在杜比实验室在1987198719871987年第一次将数字编码技术引入到年第一次将数字编码技术引入到年第一次将数字编码技术引入到年第一次将数字编码技术引入到HDTVHDTVHDTVHDTV的开发中,即的开发中,即的开发中,即的开发中,即AC-1AC-1AC-1AC-1标准标准标准标准 。

      1990199019901990年杜比实验室又推出了立体声编码标准年杜比实验室又推出了立体声编码标准年杜比实验室又推出了立体声编码标准年杜比实验室又推出了立体声编码标准AC-2 AC-2 AC-2 AC-2 1994199419941994年杜比公司与日本先锋公司联合推出了最新一年杜比公司与日本先锋公司联合推出了最新一年杜比公司与日本先锋公司联合推出了最新一年杜比公司与日本先锋公司联合推出了最新一代的杜比数码代的杜比数码代的杜比数码代的杜比数码环绕声环绕声环绕声环绕声系统系统系统系统Dolby Surround Audio Dolby Surround Audio Dolby Surround Audio Dolby Surround Audio Coding-3Coding-3Coding-3Coding-3,简称为,简称为,简称为,简称为AC-3AC-3AC-3AC-3￿ ￿40 ØØ2.2.22.2.2常用音频压缩标准常用音频压缩标准9 9 9 9.空间音频编码.空间音频编码.空间音频编码.空间音频编码随着人类听觉研究在空间心理声学、认知心理学等学科的不随着人类听觉研究在空间心理声学、认知心理学等学科的不随着人类听觉研究在空间心理声学、认知心理学等学科的不随着人类听觉研究在空间心理声学、认知心理学等学科的不断深入,出现了将人类空间方位感知参数引入音频压缩编断深入,出现了将人类空间方位感知参数引入音频压缩编断深入,出现了将人类空间方位感知参数引入音频压缩编断深入,出现了将人类空间方位感知参数引入音频压缩编码技术的研究码技术的研究码技术的研究码技术的研究————————空间音频编码(空间音频编码(空间音频编码(空间音频编码(Spatial Audio CodingSpatial Audio CodingSpatial Audio CodingSpatial Audio Coding,,,,SACSACSACSAC)。

      通过将空间线索(通过将空间线索(通过将空间线索(通过将空间线索(Spatial CuesSpatial CuesSpatial CuesSpatial Cues)参数引入到音频压缩编码)参数引入到音频压缩编码)参数引入到音频压缩编码)参数引入到音频压缩编码算法中,即所谓的参数立体声(算法中,即所谓的参数立体声(算法中,即所谓的参数立体声(算法中,即所谓的参数立体声(Parametric StereoParametric StereoParametric StereoParametric Stereo,,,,PSPSPSPS)技术,分析声道间冗余信息量,采用立体声参数提取)技术,分析声道间冗余信息量,采用立体声参数提取)技术,分析声道间冗余信息量,采用立体声参数提取)技术,分析声道间冗余信息量,采用立体声参数提取的联合声道编码模式,取代传统的声道分离编码模式,可的联合声道编码模式,取代传统的声道分离编码模式,可的联合声道编码模式,取代传统的声道分离编码模式,可的联合声道编码模式,取代传统的声道分离编码模式,可以降低近以降低近以降低近以降低近50%50%50%50%的编码码率,使空间成为数字音频编码技术的编码码率,使空间成为数字音频编码技术的编码码率,使空间成为数字音频编码技术的编码码率,使空间成为数字音频编码技术的有效组成部分。

      的有效组成部分的有效组成部分的有效组成部分 41 Ø2.2.22.2.2常用音频压缩标准常用音频压缩标准1010.移动音频编码.移动音频编码在移动通信系统中采用混合压缩编码,可以根据需在移动通信系统中采用混合压缩编码,可以根据需在移动通信系统中采用混合压缩编码,可以根据需在移动通信系统中采用混合压缩编码,可以根据需要动态调整编码码率,在合成音频质量、系统空要动态调整编码码率,在合成音频质量、系统空要动态调整编码码率,在合成音频质量、系统空要动态调整编码码率,在合成音频质量、系统空间中取得平衡,最大限度地发挥系统的效能间中取得平衡,最大限度地发挥系统的效能间中取得平衡,最大限度地发挥系统的效能间中取得平衡,最大限度地发挥系统的效能 3GPP 3GPP 3GPP 3GPP 将将将将AMR-WB+AMR-WB+AMR-WB+AMR-WB+和和和和EAAC+EAAC+EAAC+EAAC+两种编码标准用于第三代移两种编码标准用于第三代移两种编码标准用于第三代移两种编码标准用于第三代移动网络中的多媒体服务动网络中的多媒体服务动网络中的多媒体服务动网络中的多媒体服务￿42 方 法算 法名 称数 据 率标 准应 用质 量波形编码PCM脉冲编码调制公共网ISDN配音4.0~4.5μ(A)μ(A)64Kb/sG.711APCM自适应脉冲编码调制DPCM差分脉冲编码调制ADPCM自适应差分脉冲编码调制32Kb/sG.721SB-ADPCM子带自适应差分脉冲编码调制64Kb/sG.7225.3Kb/s6.3Kb/sG.723参数编码LPC线性预测编码2.4Kb/s保密话声2.5~3.5混合编码CELPC码激励LPC4.6Kb/s移动通信3.7~4.0VSELP矢量和激励LPC8Kb/s语音通信RPE-LTP长时预测规则码激励13.2Kb/sISDNLD-CELP低延迟码激励LPC16Kb/sG.728网络通信CS-ACELP共轭结构代数码激励线性预测8Kb/sG.729语音通信MPEG子带感知编码128Kb/sMPEG-1、MPEG-2、MPEG-4CD5.0AC-3感知编码音响5.043 ØØ2.2.32.2.3音频文件格式音频文件格式1 1 1 1.波形格式.波形格式.波形格式.波形格式 2 2 2 2....MIDIMIDIMIDIMIDI格式格式格式格式 3 3 3 3....MP3MP3MP3MP3压缩格式压缩格式压缩格式压缩格式 4 4 4 4.几种流式音频格式.几种流式音频格式.几种流式音频格式.几种流式音频格式￿44 ØØ2.2.32.2.3音频文件格式音频文件格式1 1 1 1.波形格式.波形格式.波形格式.波形格式WAVWAVWAVWAV是是是是Microsoft WindowsMicrosoft WindowsMicrosoft WindowsMicrosoft Windows本身提供的音频格式,用本身提供的音频格式,用本身提供的音频格式,用本身提供的音频格式,用.wav.wav.wav.wav作为扩展名,其文件格式称为作为扩展名,其文件格式称为作为扩展名,其文件格式称为作为扩展名,其文件格式称为波形文件格式波形文件格式波形文件格式波形文件格式((((Wave File FormatWave File FormatWave File FormatWave File Format),),),),在多媒体编程接口和数在多媒体编程接口和数在多媒体编程接口和数在多媒体编程接口和数据规范据规范据规范据规范1.01.01.01.0((((Multimedia Programming Interface Multimedia Programming Interface Multimedia Programming Interface Multimedia Programming Interface and Data Specifications 1.0and Data Specifications 1.0and Data Specifications 1.0and Data Specifications 1.0)文档中有详细)文档中有详细)文档中有详细)文档中有详细的描述。

      的描述45 ØØ2.2.32.2.3音频文件格式音频文件格式2 2 2 2....MIDIMIDIMIDIMIDI格式格式格式格式 电子乐器数字接口电子乐器数字接口电子乐器数字接口电子乐器数字接口((((Musical Instrument Digital Musical Instrument Digital Musical Instrument Digital Musical Instrument Digital InterfaceInterfaceInterfaceInterface,,,,MIDIMIDIMIDIMIDI)是用于在音乐合成器()是用于在音乐合成器()是用于在音乐合成器()是用于在音乐合成器(Music Music Music Music SynthesizersSynthesizersSynthesizersSynthesizers)、乐器()、乐器()、乐器()、乐器(Musical InstrumentsMusical InstrumentsMusical InstrumentsMusical Instruments))))和计算机之间交换音乐信息,播放和录制音乐的和计算机之间交换音乐信息,播放和录制音乐的和计算机之间交换音乐信息,播放和录制音乐的和计算机之间交换音乐信息,播放和录制音乐的一种标准协议。

      一种标准协议一种标准协议一种标准协议46 ØØ2.2.32.2.3音频文件格式音频文件格式3 3 3 3....MP3MP3MP3MP3压缩格式压缩格式压缩格式压缩格式 MP3MP3MP3MP3全称是全称是全称是全称是MPEG-1 Layer 3MPEG-1 Layer 3MPEG-1 Layer 3MPEG-1 Layer 3音频文件音频文件音频文件音频文件,是,是,是,是MPEG-1MPEG-1MPEG-1MPEG-1标准标准标准标准中的声音部分,也叫中的声音部分,也叫中的声音部分,也叫中的声音部分,也叫MPEGMPEGMPEGMPEG音频层MPEGMPEGMPEGMPEG音频层根据压缩质量和编码复杂程度划分为三音频层根据压缩质量和编码复杂程度划分为三音频层根据压缩质量和编码复杂程度划分为三音频层根据压缩质量和编码复杂程度划分为三层,即层,即层,即层,即Layer 1Layer 1Layer 1Layer 1、、、、Layer 2Layer 2Layer 2Layer 2、、、、Layer 3Layer 3Layer 3Layer 3,分别对应,分别对应,分别对应,分别对应MP1MP1MP1MP1、、、、MP2MP2MP2MP2、、、、MP3MP3MP3MP3这三种声音文件。

      这三种声音文件这三种声音文件这三种声音文件47 ØØ2.2.32.2.3音频文件格式音频文件格式4 4 4 4.几种流式音频格式.几种流式音频格式.几种流式音频格式.几种流式音频格式现在使用最普遍的流格式类型是现在使用最普遍的流格式类型是现在使用最普遍的流格式类型是现在使用最普遍的流格式类型是RealNetworksRealNetworksRealNetworksRealNetworks公司公司公司公司发明的支持网络流媒体技术的实时音频格式,发明的支持网络流媒体技术的实时音频格式,发明的支持网络流媒体技术的实时音频格式,发明的支持网络流媒体技术的实时音频格式,RARARARA、、、、RMARMARMARMA这两个文件类型就是这两个文件类型就是这两个文件类型就是这两个文件类型就是Real MediaReal MediaReal MediaReal Media的音频格式的音频格式的音频格式的音频格式48 第二章第二章 音频处理技术音频处理技术n n2.32.3音频处理软件音频处理软件AuditionØØ2.3.12.3.1功能介绍功能介绍ØØ2.3.22.3.2编辑环境编辑环境ØØ2.3.32.3.3基本操作基本操作49 AuditionAuditionAuditionAudition软件是软件是软件是软件是AdobeAdobeAdobeAdobe公司推出的一款完整的、应用公司推出的一款完整的、应用公司推出的一款完整的、应用公司推出的一款完整的、应用于于于于WindowsWindowsWindowsWindows系统的系统的系统的系统的PCPCPCPC上的多音轨音频工作站。

      该软上的多音轨音频工作站该软上的多音轨音频工作站该软上的多音轨音频工作站该软件前身称为件前身称为件前身称为件前身称为Cool EditCool EditCool EditCool Edit,,,,AdobeAdobeAdobeAdobe公司在公司在公司在公司在2003200320032003年年年年5 5 5 5月从月从月从月从Syntrillium SoftwareSyntrillium SoftwareSyntrillium SoftwareSyntrillium Software公司成功购买后将其更名公司成功购买后将其更名公司成功购买后将其更名公司成功购买后将其更名为为为为AuditionAuditionAuditionAudition￿50 ØØ2.3.12.3.1功能介绍功能介绍Adobe Audition 3.0Adobe Audition 3.0Adobe Audition 3.0Adobe Audition 3.0是一款功能强大的、专业级的是一款功能强大的、专业级的是一款功能强大的、专业级的是一款功能强大的、专业级的音音音音乐编辑软件乐编辑软件乐编辑软件乐编辑软件,能高质量地完成高级混音、编辑、控,能高质量地完成高级混音、编辑、控,能高质量地完成高级混音、编辑、控,能高质量地完成高级混音、编辑、控制、合成和特效处理,允许用户编辑个性化的音频制、合成和特效处理,允许用户编辑个性化的音频制、合成和特效处理,允许用户编辑个性化的音频制、合成和特效处理,允许用户编辑个性化的音频文件,创建循环,引进了文件,创建循环,引进了文件,创建循环,引进了文件,创建循环,引进了45454545个以上的个以上的个以上的个以上的DSPDSPDSPDSP特效以及特效以及特效以及特效以及高达高达高达高达128128128128个音轨。

      个音轨Adobe AuditionAdobe AuditionAdobe AuditionAdobe Audition拥有集成的多音轨和编辑视图、实时拥有集成的多音轨和编辑视图、实时拥有集成的多音轨和编辑视图、实时拥有集成的多音轨和编辑视图、实时特效、环绕支持、分析工具、恢复特性和视频支持特效、环绕支持、分析工具、恢复特性和视频支持特效、环绕支持、分析工具、恢复特性和视频支持特效、环绕支持、分析工具、恢复特性和视频支持等功能,为音乐、视频、音频和声音设计专业人员等功能,为音乐、视频、音频和声音设计专业人员等功能,为音乐、视频、音频和声音设计专业人员等功能,为音乐、视频、音频和声音设计专业人员提供全面集成的提供全面集成的提供全面集成的提供全面集成的音频编辑音频编辑音频编辑音频编辑和和和和混音混音混音混音解决方案解决方案解决方案解决方案Adobe AuditionAdobe AuditionAdobe AuditionAdobe Audition提供了直觉的、客户化的提供了直觉的、客户化的提供了直觉的、客户化的提供了直觉的、客户化的界面界面界面界面,允许,允许,允许,允许用户删减和调整窗口的大小,创建一个高效率的音用户删减和调整窗口的大小,创建一个高效率的音用户删减和调整窗口的大小,创建一个高效率的音用户删减和调整窗口的大小,创建一个高效率的音频工作范围。

      频工作范围频工作范围频工作范围￿ ￿51 ØØ2.3.22.3.2编辑环境编辑环境AuditionAuditionAuditionAudition提供了三种专业的工作视图界面,包括提供了三种专业的工作视图界面,包括提供了三种专业的工作视图界面,包括提供了三种专业的工作视图界面,包括: : : :编辑视图(编辑视图(编辑视图(编辑视图(Edit ViewEdit ViewEdit ViewEdit View))))多轨视图(多轨视图(多轨视图(多轨视图(MultitrackMultitrackMultitrackMultitrack View View View View))))CDCDCDCD视图(视图(视图(视图(CD ViewCD ViewCD ViewCD View))))52 图图2-16 2-16 多轨视图界面多轨视图界面 53 图图2-17 2-17 单轨视图界面单轨视图界面 54 图图2-23 CD2-23 CD视图视图 55 ØØ2.3.32.3.3基本操作基本操作1 1 1 1.单轨视图.单轨视图.单轨视图.单轨视图 ((((1 1 1 1)打开或创建一个音频文件)打开或创建一个音频文件)打开或创建一个音频文件)打开或创建一个音频文件 ((((2 2 2 2)编辑音频)编辑音频)编辑音频)编辑音频 ((((3 3 3 3)保存更改)保存更改)保存更改)保存更改￿56 ØØ2.3.32.3.3基本操作基本操作2 2 2 2.多轨视图.多轨视图.多轨视图.多轨视图 ((((1 1 1 1)打开或创建一个音频文件)打开或创建一个音频文件)打开或创建一个音频文件)打开或创建一个音频文件 ((((2 2 2 2)插入或录制音频文件)插入或录制音频文件)插入或录制音频文件)插入或录制音频文件 ((((3 3 3 3)施加效果)施加效果)施加效果)施加效果 ((((4 4 4 4)混合轨道)混合轨道)混合轨道)混合轨道 ((((5 5 5 5)输出)输出)输出)输出￿57 第二章第二章 音频处理技术音频处理技术n n2.4 音频实验音频实验ØØ2.4.1音频处理实验音频处理实验ØØ2.4.2录制歌曲实验录制歌曲实验58 ØØ2.4.12.4.1音频处理实验音频处理实验音频处理实验音频处理实验1 1 1 1.实验目的.实验目的.实验目的.实验目的① ① ① ① 掌握掌握掌握掌握Audition 3.0Audition 3.0Audition 3.0Audition 3.0音频处理软件;音频处理软件;音频处理软件;音频处理软件;② ② ② ② 掌握声音处理的方法。

      掌握声音处理的方法掌握声音处理的方法掌握声音处理的方法2 2 2 2.实验内容.实验内容.实验内容.实验内容① ① ① ① 掌握掌握掌握掌握Audition 3.0Audition 3.0Audition 3.0Audition 3.0音频处理软件的启动、退出;音频处理软件的启动、退出;音频处理软件的启动、退出;音频处理软件的启动、退出;② ② ② ② 熟悉熟悉熟悉熟悉Audition 3.0Audition 3.0Audition 3.0Audition 3.0音频处理软件的主界面;音频处理软件的主界面;音频处理软件的主界面;音频处理软件的主界面;③ ③ ③ ③ 熟练掌握不同音频格式文件的导入(最好是同一音频文件的不同格式)熟练掌握不同音频格式文件的导入(最好是同一音频文件的不同格式)熟练掌握不同音频格式文件的导入(最好是同一音频文件的不同格式)熟练掌握不同音频格式文件的导入(最好是同一音频文件的不同格式),并分别播放;,并分别播放;,并分别播放;,并分别播放;④ ④ ④ ④ 对不同格式的音频文件进行转换;对不同格式的音频文件进行转换;对不同格式的音频文件进行转换;对不同格式的音频文件进行转换;⑤ ⑤ ⑤ ⑤ 对音频文件进行编辑处理;对音频文件进行编辑处理;对音频文件进行编辑处理;对音频文件进行编辑处理;⑥ ⑥ ⑥ ⑥ 对音频文件进行淡入对音频文件进行淡入对音频文件进行淡入对音频文件进行淡入/ / / /淡出的处理。

      淡出的处理淡出的处理淡出的处理59 ØØ2.4.2录制歌曲实验录制歌曲实验1 1 1 1.实验目的.实验目的.实验目的.实验目的① ① ① ① 熟练掌握熟练掌握熟练掌握熟练掌握Audition 3.0Audition 3.0Audition 3.0Audition 3.0音频处理软件;音频处理软件;音频处理软件;音频处理软件;② ② ② ② 掌握声音的录制方法掌握声音的录制方法掌握声音的录制方法掌握声音的录制方法2 2 2 2.实验内容.实验内容.实验内容.实验内容① ① ① ① 根据任务需要,选择相应的功能属性进行参数设置;根据任务需要,选择相应的功能属性进行参数设置;根据任务需要,选择相应的功能属性进行参数设置;根据任务需要,选择相应的功能属性进行参数设置;② ② ② ② 熟练掌握音频文件导入的几种方式;熟练掌握音频文件导入的几种方式;熟练掌握音频文件导入的几种方式;熟练掌握音频文件导入的几种方式;③ ③ ③ ③ 在文件列表中,用鼠标选择一个文件播放;在文件列表中,用鼠标选择一个文件播放;在文件列表中,用鼠标选择一个文件播放;在文件列表中,用鼠标选择一个文件播放;④ ④ ④ ④ 熟练掌握录音方法。

      熟练掌握录音方法熟练掌握录音方法熟练掌握录音方法。

      点击阅读更多内容
      相关文档
      2025国开山东开大《土质学与土力学》形成性考核123答案+终结性考核答案.docx 中学综合素质知识点梳理【中学教师资格证】.docx 2025国开山东开大《特许经营概论》形成性考核123答案+终结性考核答案.doc 2025年高考英语全国一卷真题(含答案).docx 2025国开山东《农民专业合作社创建与管理》形成性考核123答案+终结性考核答案.docx 2025国开山东开大《自然现象探秘》形成性考核123答案+终结性考核答案.docx 2025国开山东《消费心理学》形成性考核123答案+终结性考核答案.doc 2025国开山东《小微企业管理》形成性考核123答案+终结性考核答案.doc 2025国开山东开大《资本经营》形成性考核123答案+终结性考试答案.docx 2025国开山东《小学生心理健康教育》形考123答案+终结性考试答案.docx 2025国开《视频策划与制作》形考任务1-4答案.docx 2025国开《亲子关系与亲子沟通》形考任务234答案+期末大作业答案.docx 2025国开电大《煤矿地质》形成性考核123答案.docx 2025国开电大《冶金原理》形考任务1234答案.docx 2025国开《在线学习项目运营与管理》形考任务1234答案.doc 2025国开电大《在线教育的理论与实践》阶段测验1-4答案.docx 2024 年注册环保工程师《专业基础考试》真题及答案解析【完整版】.docx 环保工程师---2023 年注册环保工程师《专业基础考试》真题及答案解析【完整版】.docx 2025国开《液压与气压传动》形考任务一参考答案.docx 2025年春江苏开放大学教育研究方法060616计分:形成性作业2、3答案.docx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.