
歌唱发音质量评估论述.docx
13页歌唱发音质量评估论述 作者:苗雨 单位:江苏师范大学 一、歌唱声音质量客观评价研究历史追溯 歌唱声音质量客观评价的研究是以声乐艺术科学化研究为前提的,这种科学化的研究始于欧洲,它的研究历史最早可以追溯到18世纪 (一)轻缓起步阶段 早在1703年,法国医生杜达(Dydart)发表了《发声原理的研究报告》(MemoiresSurlacausedelavoix)一书,提出了"旋涡"(Vortex)理论,从生理学的角度对歌唱发音的科学性进行了开创性的研究①1854年,西班牙著名声乐教育家和理论家玛努埃尔•加尔西亚(M.P.R.Garcia,1805-1906)发明了喉镜,促进了人们对嗓音生理学的研究,同时也开创了以人体发声机理作指导的新的教学方法(机理教学法),使人类声乐发展史进入了一个崭新时代1863年德国海德堡大学教授亥姆霍兹(HermannVonHelmholtz,1821-1894)发表了近代世界声学史上划时代的巨著《作为音乐理论生理基础的音的感觉》(又译《声音感觉论》),将基础生理学及解剖学的研究和数学与物理学分析结合起来,驱使吸引人们运用声学的普遍原理去解释歌唱发音的现象,在声乐界产生了强烈反响。
经过一个半世纪的发展,对声乐演唱和教学领域的研究,终于从纯粹的以人的主观意识为主的经验主义进入了以生理学和物理学原理为基础的客观科学主义研究的新高度 (二)快速发展阶段 自20世纪20年代苏联国立莫斯科大学物理学教授尔谢夫金(SergeyNikolayevitchRzhevkin)和卡赞斯基(VladimirSergeyevitchKazansky)发现歌手共振峰以来,西方学者对歌唱声音质量进行实证性评价研究进入快速发展的阶段美国的巴索洛缪(WilmerT.Bartholomew),威廉•范纳德(WilliamVennard),瑞典的桑德柏格(JohanEmilFredrikSundberg)等是这一研究领域的代表我国自20世纪80年代开始,包紫薇(1981)、王士谦(1986)、韩宝强(1996)、吴静(2007)、于善英(2010)等学者相继在此研究领域取得了一系列的成果他们的研究主要是运用频谱分析等技术,为歌唱声音的不同形态找到相对应的声学评价参数,并探索在歌唱评价和声乐教学中的应用价值这一时期,王建群(2005)、刘加林(2006)等学者还从基频、标准化噪声能量、声强等方面研究影响歌唱发声质量评价的相关参数。
以上相关研究为基于人工智能技术的歌唱发声质量客观评价研究奠定了基础 (三)纵深拓展阶段 21世纪以来,计算机信息处理技术与神经生理学、非线性动力学、模糊数学等学科的快速发展,为基于人工智能技术的歌唱声音质量评价研究提供了更为丰富的研究手段我国有关基于人工智能技术的歌唱声音质量评价研究始于2007年,迄今成果单薄,其中代表性的成果有:王修信等(2007)、罗兰娥(2008)、李文娟等(2009)、袁剑(2010、2011)这类研究或利用语音分析技术对艺术嗓音进行声音样本提取,并与标准化声音或专业评委的主观评价进行比较;或制定涉及多项评价标准的评价方案,然后利用计算机、人工智能、模糊数学等知识原理对不同声音评价参数进行分析,最后在此基础上建立歌唱发声质量客观评价机制以下本文将以主流研究中的两种体系——————基于歌唱声音评价参数提取的和基于主观评价标准量化的客观评价机制为研究对象,分别以研究思路和方法、研究内容、研究结果、存在问题等方面对其研究成果作出归纳梳理和评价 二、基于人工智能技术的两种评价体系 之所以确定为两大体系,是因为前者的研究基础是歌唱声音,后者是建立在主观评价标准量化指标的基础之上的;之所以都确定为客观评价体系,是因为二者均运用了人工智能技术。
(一)基于歌唱声音评价参数提取的客观评价研究 直接以歌唱声音本身作为评价参数的客观研究目前主要采用两种方法——————神经网络研究方法和特征匹配研究方法 1.利用神经网络方法建立评价机制的研究 此种研究方法以广西师范大学计算机科学与信息工程学院的王修信、物理与电子工程学院的罗兰娥为代表1)研究思路与内容王修信等先后发表了《几种声学参数在艺术嗓音客观评价中的应用》(2007)、《艺术嗓音歌声客观评价初探》(2007)两篇文章,提取歌声平均能量(表征相同环境下歌声信号的相对大小)、平均频率误差(判别测试者的歌声频率与标准频率中心是否对准)、平均音域误差(表征测试者音域与曲谱音域的偏离程度)作为客观评价的3个声学参数在MATLAB计算机培养编写程序②环境下,使用BP(backpropaga-tion)神经网络方法③客观评价艺术嗓音歌声质量后篇文章较前篇文章有所深化,将声源分析样本从36人增加到48人,明确了性别比例(其中女31名,男18名);在分析方法上增加了多元线性回归方法研究认为,使用BP神经网络方法和多元线性回归方法基本都能正确客观评价歌声质量,且与资深专业教师的主观评价一致。
BP神经网络方法误差在4%之内,线性回归方法误差在6%之内,BP神经网络方法(模型)客观评价效果较优罗兰娥与王修信为师承关系,其研究以王修信的研究为基础因此,罗兰娥在研究方法和观点上与王修信有不少相似之处,包括如录音环境、录音设备(软件、硬件)、声音样本提取标准、存储格式、MATLAB分析程序的选择等方面相对于王修信等的研究,该文的创新之处在于:①明确了歌唱声音信号采集的类型,使该研究与歌唱实践更加契合;②声音评价提取的参数由原有研究的3项增加到8项,对被评价声音的反映更加全面;③评价网络建立所依据的类型增加了评价精度更高的小波神经网络研究认为,神经网络方法能正确客观地评价歌声质量,评价分数最高的歌唱者声学参数呈规律变化;小波神经网络方法较BP神经网络方法评价精度更高;声学参数对评价结果影响度排序依次为第三共振峰、第一共振峰、音域、基频、平均能量、第三共振峰微扰、第一共振峰微扰、基频微扰等2)评价及存在问题王修信等的研究在歌唱声音采样时对于录音环境、录音设备(软件、硬件)、声音样本提取标准、存储格式、被录制对象的年龄、人数、唱法等方面都有明确的界定,在规范性和严谨性方面达到了较高的要求。
该研究对被录制对象的性别和声部在(2007)中不明确,在(2007)中区分了男女性别,对歌唱者的声部依然未见说明遗憾的是,两项研究对歌声信号采集类型(单音、练声曲、歌曲片段)及演唱音域未作说明,在歌唱艺术实践中,以上内容都是对歌唱发音评价产生影响的重要因素罗兰娥(2008)中涉及到一些与音乐相关的概念值得商榷分析结果中有:"1号歌唱者E、F、G三种调试的第一共振峰均接近450Hz,第三共振峰均接近2500Hz,音域3.5个八度左右,明显宽于其他歌唱者"这里存在两个问题首先,这句话中提及到两个音乐概念——————"调试"和"音域"在音乐术语中没有"调试"这个概念,结合多次提到"调试"的上下文可以推断,作者指的应该是"调式"但"调"和"调式"的概念在乐理中的含义是不同的一般来说,孤立的一个音或毫无逻辑关系的若干个音无法构成音乐语言,只有把若干个音按照一定的关系组织起来才能塑造音乐形象,表达思想感情主音与它构成一定的关系(主要是倾向性关系,音程关系与和弦关系)的若干个音所结合成的音的体系叫做"调式""调"主要是指主音的音高,亦即整个调式的音高④作者在文中实际要表达的意思应是用E、F、G三种不同的调来演唱歌曲。
其次,此句提到歌唱者的"音域3.5个八度左右"这个3.5个八度如何解释?以男高音声部为例,理论上说,男高音音域的应用范围一般在C1-C3的两个八度之间歌唱实践中,因为嗓音条件和高音技术原因,能达到这个音域范围的男高音也并不多见罗兰娥(2008)的研究中,歌唱声音样本录制对象为音乐学院声乐专业19名21岁-25岁的本科大学生,就国内的声乐教学现状分析,这些学生的演唱音域如果能达到两个八度已经进入优秀的行列了,而结果显示1号歌唱者的音域达到3.5个八度左右是不可能存在的p#分页标题#e# 2.利用特征匹配方法建立评价机制的研究 此种研究方法以上海大学影视学院李文娟等为代表1)研究思路与内容李文娟等(2009)提出包含3个步骤的研究方案:①提取测试声音样本和相应原声的音强(参数1)、音高(参数2)、气息(参数3)等特征参数;②采用特征匹配方法对各参数进行比较;③由评分机制根据其相似程度给出客观评分实际操作程序是:在特征提取环节,通过音量强度曲线分析提取参数1,通过对比基频(比对演唱者声音和原声的音高)提取参数2,通过计算测试声音波形的标准差提取参数3;在特征匹配环节,运用动态时间规整法⑤,对被评价的演唱声音与一个标准声音分别进行预处理,提取相应的特征参数进行特征匹配;在给出评分环节,通过公式计算出音强、音高、气息的最佳权值,在Matlab6.5上进行仿真实验,找到计算机和人工评分的最佳映射关系,最后通过评分测试验证评价机制的准确性。
此种研究的评分测试主要针对技能训练性练习曲,这类练习曲是声乐演唱训练中最常用的练声曲,主要围绕特定母音、语音音节和技巧性发声进行针对性训练在实验仿真中,选取了最常见的5个母音(a,e,i,o,u)和男声闭口哼鸣练声曲进行测试分析研究认为,这种基于特征比较的声乐评价方法算法复杂度较低,其评分结果接近人工评分,较符合人的主观感受;通过分析显示出演唱者声音的波形,以直观方式展示演唱者的不足,可以改善多媒体声乐教学现状2)评价及存在问题相对于王修信、罗兰娥等对艺术嗓音歌唱声音质量评价的研究,李文娟等(2009)将研究重点放在评价歌唱者对乐曲旋律把握程度方面,运用a,e,i,o,u5个母音和练声曲作为声音测试形态,这就与声乐演唱和教学的实际更加贴合但该研究对于被测试声音在特征参数提取环节中涉及的录音环境、设备、采样标准以及被提取对象的唱法、声部类型未作出明确说明;对于"标准声音资料"的概念不明确,标准资料选用的方法和标准交待不清;评价样本测试环节中仅选用两位测试者,并且两位测试者的演唱程度差异很大这些问题都直接影响到研究结果的准确性和说服力 (二)基于主观评价标准量化的客观评价机制研究 此种评价机制的研究代表是西安音乐学院计算机教研室的袁剑。
1.研究思路与内容 袁剑在(2010、2011)中,拟订"声乐评价标准方案",通过专家打分,运用BP神经网络的研究方法,模拟一个稳定的专家打分系统,构建评价模型传统的声乐评分方法通常采用的是线性分类数学解析表达式,在多个分值中去掉最高、最低分,最终以平均分作为实际得分该文对传统的评分方法提出质疑,认为传统的声乐评分方法忽视了各评价指标和演唱效果之间的非线性关系,带有强主观性,不能很好地、真实地反映演唱者的水平研究者首先制订了一套"客观性"的、对声乐评价进行量化表述的标准方案,分为技术、艺术、风格三个大的类别,每个类别中又分成若干子项目袁剑(2010)中共设有17个子项目,包括技巧8项(歌唱姿势、呼吸的运用、气息支持与稳定程度、音域范围、吐字清晰度、音调准确度、节奏的准确度、曲目难度)、艺术6项(舞台形象、音色的表现、声音自然程度、流畅程度、圆润程度、对旋律的把握)、风格3项(对歌曲情感的表达、情感到位程度、独创性)在袁剑(2011)中,研究者将具体评价项目上由17项减少到7项,包括技巧3项(气息控制、准确度、曲目难度)、艺术2项(形象、音质)、风格2项(情感的表达、独创性)。
其次,聘请声乐专家按照上述评价体系对同一评价样本分别打出分项成绩和总成绩将分项成绩输入BP神经网络,以总分为参照样本,对网络进行训练、调整,使BP神经网络以调整各层权值的方式学习专家经验。
