
MOS 语音高质量评测指标地介绍.docx
11页MOS语音质量评测指标的介绍NOKIA- 目录 -1 前言 错误!未定义书签2 语音质量测量和量化标准的发展史 错误!未定义书签3 MOS 语音质量量化的定义 错误!未定义书签For personal use only in study and research; not for commercial use4 PESQ 评估方法的介绍 错误!未定义书签4.1 PESQ 的基本原理 错误!未定义书签4.2 PESQ 的应用 错误!未定义书签For personal use only in study and research; not for commercial use5 MOS 的测试方法 错误!未定义书签5.1 NEMO Outdoor 错误!未定义书签5.1.1 测试系统的要求 错误!未定义书签For personal use only in study and research; not for commercial use5.1.2 测试系统的解决方案 错误!未定义书签5.2 NetQual 错误!未定义书签5.2.1 测试系统的组成 错误!未定义书签。
5.2.2 语音质量的测试 错误!未定义书签5.3 TEMS INVESTIGATION 错误!未定义书签6 MOS 测量的优化建议 错误!未定义书签/ 、叫、•1 前言直到现在,GSM网络的最主要基本业务仍然是语音业务,语音质量的好坏直接影响 用户对于运营商的选择;另外,随着移动网络发展的日趋成熟,客户对网络的性能质量 要求逐渐提高因此,根据电信网络服务质量(QoS)的要求,建立一套客观评估标准,如 何更好地对网络的语音服务质量进行定量分析和测量就逐步摆在了网络运营商的面前语音服务质量的测量与通常移动网络的信号质量测量有很大的区别在GSM网络中, 对无线质量的评价是通过RxQual来实现的但是语音在GSM网络中是经过信道及信源 编码的,而RxQual只能描述空中接口的传输质量,并不能给出终端用户对无线网络的实 际感受,语音服务质量的测量将更好地反映用户对网络的真实感受情况本文将就语音 QoS 的测量方法进行较深入地讨论2 语音质量测量和量化标准的发展史目前语音 QOS 测试方法主要有主观测试方法和客观测试方法两种, ITU-TP.800 定 义了 MOS的主观测试方法,客观测试方法主要有:PSQM、PSQM+、PESQ等。
其中ITU- TP.862 (PESQ)是目前ITU推荐用于端对端网络语音质量测试的方法早期语音质量的评测主要采用主观评分的方式:调查用户被要求按照 1-5分对接收到 的语音质量进行评分(5表示最好,1表示最差)这种主观判断评测法由ITU组织 在1996年8月制定为标准,其P.800标准详细定义了这种MOS评测法(Mean Opinion Score)但是,这个主观方法存在的最大问题就是,在现实中,让一组人接听语音和评 价语音的质量实现起来是非常困难和昂贵的,因此人们在不断的探索能进行客观测量的 方法MOS方法是一种模糊的评估方法,因此ITU-T在建议P. 861中又提出了 PSQM (Perceptual Speech Quality Measurement)方法根据 P. 861 提出的 PSQM方法,语 音质量的测试开始摆脱原始的人类主观评估,而开始使用计算机产生的波型文件(Wave File),通过比较其通过通信网络传输前后的变化计算出PSQM中相对应的级别及好坏程 度ITU 组织在 2001 年 2 月发布了新的语音传输质量测量标准: P.862 —PESQ (Perceptual Evaluation of Speech Quality)。
PESQ是评价各类端对端网络条件和语音 编码与解码的最新标准PESQ可以根据一些感知标准来客观地评价语音信号的质量,从 而提供可以完全量化的语音质量衡量方法,而这些衡量标准又是与人类对语音质量的感 受完全吻合的PESQ由荷兰的KPN公司和英国电信公司协作开发的,比其前身PSQM (Perceptual Speech Quality Measureme nt, ITU-T P.861)有了长足的进展下面的介绍将主要针对PESQ测量方法进行更多详细的阐述实用文档3 MOS 语音质量量化的定义发明开始,语音质量的测量方式是凭主观的,人们摘起一个,然后由人耳 来感知语音的好坏,这个方法是被广泛认同的基于该主观评测,人类接听和感知语音 质量的行为被调研和量化,接听何种级别质量的语音,得到多少平均主观值MOS,人类 将起主要的反映作用采用MOS (平均主观评分)方法评价语音质量,评测方法在ITU — TP.800中定义MOS值的定义如下表所示:级别M0S值MOS值用户满意度优4.0〜5.0很好,听得清楚,延迟很小,交流流畅良3. 5〜4.0稍差,听得清楚,延迟小,交流欠缺顺畅,有点杂音中3.0 〜3.5还可以,听不太清,有一定延迟,可以交流。
差1.5 〜3.0勉强,听不太清,延迟较大,交流重复多次劣0〜1.5劣0〜1.5极差,听不懂,延迟大,交流不通畅一个平均主观值MOS是4或更高,被认为是比较好的语音质量,而若平均主观值 MOS 低于 3.6,则大部分接听者不能满意这个语音质量平均主观值MOS是广泛认同的语音质量量化标准;因此,无论采用何种方法所有测 量方法都必须将它们的结果最终对应到平均主观值MOS,如实际中采用到的PESQ (语音 质量的知觉评估)客观测试方法4 PESQ 评估方法的介绍PSEQ 工具是用来计算语音样本的 MOS-LQO (Mean Opinion Score -ListeningQuality Objective)值,PESQ把在信号传输通过设备时提取的输出信号与参照信号进行 比较计算出差异值一般情况下,输出信号和参照信号的差异性越大,计算出的MOS参 数值就越低实验证明其计算结果和主观评分结果是基本一致的4.1 PESQ 的基本原理下图是PESQ模型的结构图:世别失间JV如图所示,开始时两个信号都通过电平调整,再用输入滤波器模拟标准听筒进 行滤波(FFT)然后对这两个信号进行时间上的校准,并通过听觉变换,这个变换包括对系统中线性滤波和增益变化的补偿和均衡。
为了获得主观和客观之间的较高关联性,再 输入到认知模型,最后得到质量评分电平调整:各个待测系统的增益一般差别比较大,而且对参考信号没有确定的校准 电平,所以有必要将二者调整到统一、恒定的电平上来输入滤波:感知模型必须考虑人听到的实际声音,在 PESQ 中使用了滤波器,起到一 个模拟手柄的作用时间调整和校准:假设系统的时延是分段恒定的,在静默期间和说话期间时延可以 改变,对每一段话语都给出延时估计,然后得出听觉变换要用的一帧一帧的延时PESQ 中的听觉变换是一个生理声学模型,它对信号进行时间-频率映射,以及频率和 强度偏差处理,变化成时-频可感知的响度表达扰动处理:计算参考信号与失真信号间的绝对差值计算PESQ的得分:处理的结果经认知模型,最终给出了客观语音质量的评估得分 PESQ的值一般落在1.0和4.5之间,在失真情况严重时,得分可能会低于1.0,但这种情 况很少见4.2 PESQ 的应用PSQM 只用在窄带编解码测量中,并且对某些类型的编解码、背景噪声和端到端的影 响,比如滤波和时延变化不能给出精确的预测值而PESQ关注到端对端的行为影响,并 包括滤波和变化时延造成的影响PESQ能提供比PSQM与主观意见更好的相关性,它能 在很广范的条件下对主观质量给出了很精确的预测,包括背景噪声、模拟滤波、和时延 变化等。
ITU-T相关的资料已证明PESQ是能够给出精确的预测值的PESQ适用于目前所知的 所有移动通信技术,如GSM、CDMA、3G等,以及编码器语音质量的测量,如AMR5 MOS 的测试方法现阶段,许多主流测试仪器厂商先后推出了支持PESQ测量算法的测试系统,下面将 主要介绍几个厂家的 MOS 测量相关解决方案5.1 NEMO OutdoorNEMO Outdoor测试系统通过增加简单的语音模块,可以支持最新的PESQ语音质量 测量NEMO的语音模块实现发送和接收测试样本,并完成测试终端间相互同步的需求5.1.1 测试系统的要求测试终端方面,要求测试应该有一个模拟音频接口,刚开始时仅NOKIA6650手 机支持,但如果其他DKU-2类型的测试软件能将音频信号连接到底部的连接端,那么这些也将支持语音质量的测试另外,接下来Sagem OT290和Nokia DKU- 5 类型也将支持语音质量的分析手提电脑方面,对内存、电源的要求跟其他Nemo Outdoor系统一样;多任务操作要 求便携的性能要好;除非安装了 MMAC2设备,否则每个Nemo Audio Module(语音模 块)要求一个RS232接口,以及额外的一个USB端口。
其他如Nemo Audio Module、适配的音频/信令跟踪数据线等5.1.2 测试系统的解决方案♦一的测量serial trace and powerTEST LAPTOP Nemo Outdoorserial trace and powerserial trace and powerUSB语音质量测试中,终端可以单独连接到电脑,也可以通过MMAC2设备连接当有多 个测试终端需要同时连接时,就要用到 MMAC2 设备语音模块单元需要安装在 MMAC2 设备最上面的槽位,这样它们才能取得电源供应当然语音模块也可以单独使用,这时 需要其他外部电源给它供电,或使用最近的USB端口给它供电这种情况下的测试流程如下:1. 将一个参考样本更新到每个语音模块中2. A测试呼叫B测试机,连接建立好后,A开始发送参考样本,而B 开始接收3. 一旦接收端接收到所有的样本,立即计算出PESQ的得分4. 然后,根据测试模式,A继续发送样本(单一 TX发送模式),或者A 随后变成接收方(双向模式)就这样不断重复发送和接收直到测试结束♦ 一固网的测量Test TerminalNemo Audio Test ServerTEST LAPTOPNemo Outdoorine in terraces trace这种情况下的测试流程如下:1. 语音模块的参考样本更新2. 测试呼叫Nemo Audio Test Server (音频测试服务器)其中一个固定号码。
连接建立后,服务器开始发送测试样本,端则开始接收3. 当一个完整的样本接收好后,Nemo Outdoor将计算PESQ的得分4. 以上测试步骤将不但重复,直到测试结束♦一固话的测量-固话的测试方法跟固话-的测试方法类似,不同的是音频测试服务器将 作为接收端,并评估PESQ的得分这些结果是上行质量的得分,所以应该在后台处 理时插入无线端的终端测量文档,或者在测试时实时。












