您所在位置：网站首页 > 办公文档 > PPT模板库 > PPT素材/模板数字声音基础

数字声音基础

43页

卖家[上传人]：F****n

文档编号：88220078

上传时间：2019-04-21

文档格式：PPT

文档大小：4.34MB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

25 金贝

/ 43 举报版权申诉马上下载

文本预览

下载提示

常见问题

1、第三章数字声音基础,多媒体技术基础,3.1 声音特性,3.1.1.声音是什么声音是听觉器官对声波的感知，而声波是通过空气或其他媒体传播的连续振动。声音的强弱体现在声波压力的大小上，音调的高低体现在声音的频率上。声音用电表示时，声音信号在时间和幅度上都是连续的模拟信号，声音具有普通波所具有的特性，如反射、折射、衍射等。,声音是一种连续的波,3.1 声音特性,3.1.2 声音的频率范围描述声音的两个基本参数是频率和幅度。声音信号由许多频率不同的信号组成，这类信号称为复合信号，而单一频率的信号称为分量信号。信号的频率是指信号每秒钟变化的次数，用Hz来表示。人们把小于20Hz的信号称为亚音信号，或称为次音信号；频率为20-20000Hz的信号称为音频信号；虽然人的发音器官发出的声音频率大约是80-3400Hz，但男人说话的信号频率通常为300-3000Hz，女人说话的信号频率通常为300-3400Hz，因此人们把这种频率范围的信号称为话音信号；信号频率高于20000Hz的信号称为超音信号或超声波，这种信号具有很强的方向性。,3.1 声音特性,人是否能听到声音信号主要取决于各个人的年

2、龄和耳朵的特性。一般来说人的听觉器官能感知的声音频率大约在20-20000Hz之间，在这种频率范围内感知的声音幅度大约在0-120dB之间。除此之外，人的听觉器官对声音的感知还有一些重要特性。,3.1 声音特性,声音三要素音调：与声音的频率有关,频率高则声音高,频率低则声音低。音强：又称响度，取决于声音的幅度。也即振幅决定声音的大小和强弱。音色：由混入基音的泛音所决定的。每个基音都有其固有频率和不同音强的泛音，因此使得每个声音具有特殊的音色效果。,纯音:振幅和周期均为常数的声音称为纯音。复音:不同频率和不同振幅的声波组合起来的称为为复音。基音:复音中的最低频率称为复音的基音，是决定声音音调的基本因素，它通常是常数。泛音:复音中的其它频率称为谐音（泛音）。基音和谐音组合起来决定了特定声音的音色（音质）。,3.1 声音特性,3.1.3 声音信号数字化 1.模拟信号与数字信号话音信号是典型的连续信号，不仅在时间上是连续的，而且在幅度上也是连续的。在时间上“连续”是指在一个指定的时间范围里声音信号的幅值有无穷多个，在幅度上“连续”是指幅度的数值有无穷多个。我们把在时间和幅度上

3、都是连续的信号称为模拟信号。时间和幅度都用离散的数字表示的信号就称为数字信号。,例如，假设输入电压的范围是00.7V，并假设它的取值只限定在0、0.1、0.2，0.7共8个值。如果采样得到的幅度值是0.123V，它的取值就应算作0.1V，如果采样得到的幅度值是0.26V，它的取值就算作0.3，这种数值就称为离散数值。,3.1 声音特性,在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling)，由这些特定时刻采样得到的信号称为离散时间信号。采样得到的幅值是无穷多个实数值中的一个，因此幅度还是连续的。如果把信号幅度取值的数目加以限定，这种由有限个数值组成的信号就称为离散幅度信号。,3.1 声音特性,2.声音数字化的过程,采样,量化,编码,声音数字化需要回答两个问题（1）每秒钟需要采集多少个声音样本，也就是采样频率fs是多少；（2）每个声音样本的位数是多少，也就是量化精度是多少,3.1 声音特性,采样频率采样就是使音频信号在时间轴上离散化。采样频率的高低是根据奈奎斯特和声音信号本身的最高频率决定的。奈奎斯特理论指出，采样频率不应低于声音最高频率的两倍，这样就能把以数字表达的声

4、音还原成原来的声音，这叫做无损数字化。采样定律用公式表示为：,fs2f 或者 TsT/2,f为被采样信号的最高频率,3.1 声音特性,采样精度量化是对采样后的离散音频信号幅度值样本进行离散化处理。样本大小是用每个声音样本的位数表示的，它反映度量声音波形幅度的精度。样本位数的大小影响到声音的质量，位数越多，声音质量越高，所需存储空间也越多；位数越少，声音质量就越高，所需存储空间也就越少。,3.1 声音特性,量化过程：先将整个幅度划分称有限个小幅度（量化阶距）的集合，把落入某个阶距内的样值归为一类，并赋予相同的量化值。量化方法分为两类：,3.1 声音特性,均匀量化：采用相同间隔对采样得到的信号做量化，也成为线性量化。,3.1 声音特性,非均匀量化：对输入信号进行量化时，大的输入信号采用大的量化间隔，小的输入信号采用小的量化间隔。,3.1 声音特性,采样精度的另一种表示方法是信号噪声比，简称为信噪比(signal-to-noise ratio，SNR)，并用下式计算： SNR 10 lg (Vsignal)2 / (Vnoise)220 lg (Vsignal / Vnoise) 其中，

5、Vsignal表示信号电压，Vnoise表示噪声电压（即模拟信号的采样值和它最终接近的数字数值之间的差值）；SNR的单位为分贝(dB),3.1 声音特性,例如：信号电压Vsignal=0.7V，如果采样精度是16位，则最大的量化噪声电压为Vnoise=0.71/(216)V,带入上式计算得到的信噪比SNR96（dB）假设采样精度的位数为n位，信噪比可写成： SNR20 lg (Vsignal / Vnoise) 20lg(Vsignal / Vsignal(1/2n) 20lg(2n) 6.02n 所以，采样精度每增加1位，信噪比就增加6dB。,3.1 声音特性,单声道，计算数字声音文件大小的公式为 S=RD(r/8)*1 S：文件大小，单位B R：采样频率，KHz D：录音时间，S r：分辨率，b 1：对应单声道,3.1 声音特性,3.1.4 声音质量的度量,目前有3种方法衡量声音的质量：,1.用声音的带宽衡量声音的质量声音信号的一个重要参数就是带宽，它用来描述组成复合信号的频率范围，同时它也可以用来衡量声音的质量。一般来说，频率范围越宽，声音质量就越高。,3.1 声音特性,3.

6、1 声音特性,根据声音的频带，通常把声音的质量分为5个等级，由低到高分别是电话（telephone）、调幅（amplitude modulation，AM）广播声音，调频（frequency modulation，FM）广播声音、激光唱盘（CD-Audio）声音和数字录音带（digital audio tape，DAT）声音。,3.1 声音特性,3.1 声音特性,2.声音质量的客观度量声音客观质量的度量主要是用信噪比来度量。它指音源产生最大不失真声音信号强度与同时发出噪音强度之间的比率。,3.声音质量的主观度量与用SNR客观质量度量相比，可以说人的感觉更具有决定意义，感觉上的、主观上的测试应该成为评价声音和图像质量不可缺少的部分。有的学者认为，在语音和图像信号编码中使用主观质量度量比使用客观质量度量更加恰当，更有意义。,3.1 声音特性,主观度量声音质量的方法类似“评委打分”。召集若干实验者，由他们对声音质量的好坏进行评分，求出平均值作为声音质量的评价。这种方法称为主观判分法，所得的分数称为主观平均分（mean option score,MOS)。,声音质量MOS评分标准,期中考试

7、安排,考试时间：4月29号3，4节考试形式：待定考试内容：已学的章节,3.2 常用音频处理软件,3.2.1 数字音频的优势,1.便于存储不宜损坏存储容量大,2.后期处理方便,3.传输和复制无失真,3.2 常用音频处理软件,3.2.3 “录音机”的使用,控制音频数字化采集质量的关键 1.保证在好的声学环境中进行声音录制 2.采用合适的拾音器件 3.选用高质量的声卡 4.合理控制音频数字化参数和其他各项参数,3.2 常用音频处理软件,录音声学环境的质量控制 1.噪音低 2.混响时间合适混响时间是从声音发出至声音强度衰减60分贝（衰减至原来强度的百万分之一）所持续的时间混响时间过短，声音“干”，单薄枯燥混响时间过长，声音“空”，混浊不清混响时间合适，声音清晰明亮，丰满浑厚，感染力强 3.选用高质量的声卡 4.合理控制音频数字化参数和其他各项参数,3.2 常用音频处理软件, 设备间的信号连接,(1) 鼠标左键双击任务栏右侧图标,(2) 检查“波形”是否被选择 ,(4) 选择“录音”选项,(5) 检查: 录音控制线路输入麦克风应有 ,(3) 选择“选项属性”,(6) 单击

8、确定按钮,录音失败的处理, 操作步骤,教学进程,(2) 选择“文件打开”,(1) 选择“程序附件娱乐录音机”,(3) 选择需转换的音频文件,(4) 单击打开按钮,(6) 单击开始转换按钮,(7) 选择属性(采样频率),(3) 选择“文件另存为”菜单，保存文件,(5) 选择“文件属性”,(8) 单击确定按钮,转换采样频率, 操作步骤,国际互联网 (语音、简单乐曲),要求,11,025 Hz,8 bit,22,050 Hz,8 bit,11,025 Hz,8 bit,11,025 Hz,8 bit,22,050 Hz,8 bit,44,30 Hz,16 bit,采样频率,数据长度,游戏 (效果音、效果音乐),多媒体自学读物 (提示音),电子教案 (语音、效果音),多媒体宝典、大全 (乐曲、语音),多媒体音乐鉴赏 (音乐、解说),应用场合,3.2 常用音频处理软件,3.2.4 Cool Edit Pro2.0的使用,Cool Edit Pro2.0 既具有专业音频处理软件的全方位功能，又比其他专业软件更容易掌握。它拥有强大的音频文件裁剪、编辑、录制、混音、音效制作功能。,3.2 常用

9、音频处理软件,Cool Edit Pro2.0的安装,3.2 常用音频处理软件,Cool Edit Pro2.0的基本界面,3.2 常用音频处理软件,录制自己的音乐 1.如何获得伴奏 (1)网上下载。如 (2)消除音频文件中的原音（如果是视频里面的音频可以从视频从先抽取音频）效果波形振幅声道重混缩Vocal Cut,3.2 常用音频处理软件,2.录音方法一轨伴奏，一轨录音,注意：（1）注意调整录音电平（2）录好以后最好把原始的人声素材保留一份，存为wav格式,3.2 常用音频处理软件,3.处理方法,录音之前先调整录音电平，标准是“最大且不失真” （1）降噪降噪器去除本底噪音手动消除特殊噪音（2）高音激励增强声音的频率动态，提高清晰度、亮度、音量、温暖感和厚重感，使声音更有张力。 BBE SonicMaximizer效果器,3.2 常用音频处理软件,（3）压限是压缩/限制效果处理的简称。让声音变化幅度小（振幅太大的时候，自动将音量提上去；而当振幅过大的时候，自动将音量降下来）这样能使声音在整体上更均衡一些，不至于忽大忽小，忽高忽低，保证各种信号强度的均衡。 WaveC4压限效果器,3.2 常用音频处理软件,（4）混响当声源停止发声后，声波在室内要经过多次反射和吸收，最后才消失，人就感觉到声源停止发声后声音还继续一段时间，这种现象叫做混响，这段时间叫做混响时间。混响时间是室内声音达到稳定状态,声源停止发声后残余声音在房间内反复经吸声材料吸收,平均声能密度自原始值衰变到百万分之一(声能密度衰减60dB)所需的时间。 Reverb R3效果器,低音切点和高音切点可以设置你要处理混响的频段范围。早期反射（PREDELAY）：预延迟的时间，就是直达声与前反射声的时间距离。以毫秒计算。空间广度（room size）：设置空间大小，混响房间的尺寸大小，一般房间较大混响较长，小房间声音则比较清晰、干涩。扩散程度（diffusion）：我们知道早反射就是一组比较明显的反射声。这些反射声的相互接近程度，就是扩散程度。墙壁

《数字声音基础》由会员F****n分享，可在线阅读，更多相关《数字声音基础》请在金锄头文库上搜索。

点击阅读更多内容

TA的资源