摘 要 本文介绍了新的语音质量测量方法E-model(ITU-T G.107)[1],探讨了VoIP在现有网络实施时的语音质量问题。基于VoIP语音特性对网络性能的要求,对比传统的以及现在常用的语音质量测量的多种方法,E-model克服了传统语音质量评测方法用于数据网络测量中的不足。在E-model的基本算法公式的基础上,文章对影响E-model评测值R的因素进行了分析,并给出了R值与主观评测MOS值的映射关系,最后讨论了E-model用于实时VoIP网络测量时的实际测量解决方案。
关键词 语音质量 IP网络 测量 损伤因素
1 引言
近年来,随着IP网络技术的广泛应用,关于IP网络所能提供的业务的服务质量问题受到研究者们越来越多的关注,如何来对服务质量进行科学可靠的测量与评价是网络测量与网络规划设计中相当关键的问题。VoIP作为下一代基于分组传输的汇聚业务网络的先驱,其语音质量的测量将为未来网络的服务质量测量提供参考与经验。
2 VoIP语音特性对网络性能的要求
语音在IP网络上的传送,不同于传统PSTN语音传输,它是采用语音编码方式,将模拟话音数字化并打包后采用尽力投送的IP包传送机制,通过IP网络传送到接收端,接收端收集数据包后语音解码得到模拟话音。此外VoIP也与传统的网络应用有许多的不同,例如,像FTP文件传输方式尽可能地占用网络带宽去快速地传送文件;而ERP应用程序则发送较少的数据,但是却在发送者和接收者之间频繁地交互数据流。相反,VoIP只占用很少的网络带宽,但是它不能容忍网络的延时和变化。即使VoIP业务和传统数据业务在同一网络中实现,语音流和数据流也不能被同一方式处理,因为:
(1)它们有不同的数据包大小
(2)它们按照不同速率发送数据包
(3)它们以不同的方式缓存和传送数据包到目的地
(4)它们必须满足不同的用户期望
目前,大部分网络并没有准备好为端到端的VoIP实施提供像PSTN一样的语音质量和可靠性。现存的VoIP网络主要实现了IP中继,提供两个远距离的PSTN的廉价长途连接。以下的两个主要VoIP的语音特性反映对网络性能的具体需求:
第一,VoIP利用RTP实时传输协议传送数据。RTP是一个基于无连接UDP的应用协议,UDP是无连接的,它不会对数据包的传送提供应答和跟踪,这样RTP也不会重新传送网络的丢包,这就要求网络传输中应尽可能减少数据包的丢失;此外,按照TCP的应用协议,RTP也没有直接的碰撞控制,以致于因为发送者发送太多太快的数据包,接收者将被淹没。为了克服这个问题,RTP应用程序总是以固定速率发送数据包,这就要求网络能够尽量以固定的速率传输数据包。
第二,交互式会话不能容忍过大的延时。一个典型的电话会话依赖于发起者和接听者之间的大量的交互,交互得越多,在会谈中所能承受的延时则越小。这就要求数据包通过网络的延时尽可能的小。
由此可见语音在IP网络上的传输需要考虑许多不同于传统电话网络和传统数据网络的因素,所有这些特性因素都将制约到VoIP的语音质量。
3 VoIP的语音质量评价标准
怎样评判VoIP的语音质量是好或是坏?当然希望VoIP语音质量与PSTN的一样好,这也称为Toll 级别,它是非常好的,但是事实并不一定是这样的。在实施VoIP以前或以后,必须知道网络能够有怎样的语音质量,因此我们需要一些语音质量的测量标准。从发明电话开始,语音质量的测量方式是主观的,人们摘起一个电话,然后由人耳来感知语音的好坏,这个方法是被广泛认同的。在完善之后,这个主观的语音质量测量方法就是现在的平均主观值MOS方法,定义在ITU-T P.800中。基于该主观评测,人类接听和感知语音质量的行为被调研和量化,接听何种级别质量的语音,得到多少平均主观值MOS,人类将起主要的反映作用。这个语音质量和平均主观值的对应关系为网络的配置、基准和监视提供了标准依据。
一个平均主观值MOS是4或更高,被认为是比较好的语音质量,而若平均主观值MOS低于3.6,则大部分接听者不能满意这个语音质量。虽然平均主观测试准确有效,但是,这个主观方法存在的最大问题就是,在现实中,让一组人接听语音和评价语音的质量实现起来是非常困难和昂贵的,因此人们在不断的探索能进行客观测量的方法。
现在许多客观的测量方法已经出现并被应用,诸如,PSQM /PSQM+感知通话质量测量[2],PESQ感知评估通话质量测量[3],PAMS(英国电信)感知分析测量等。PSQM和PAMS测量方法都需要发送一个语音参考信号通过电话网络,在网络的另一端采用数字信号处理的方式比较样本信号和接收到的信号,进而估算出网络的语音质量。PESQ结合了PSQM和PAMS的优势,针对VoIP和混合的端到端应用作了改进,并针对MOS和MOS-LQ计算方法做了修改。最开始这些方法被用于测量编码算法,后来也逐渐应用到VoIP网络系统的测量中,著名的测量仪器生产厂商Agilent的语音质量测量仪器VQT即是代表。此外,有必要指出,平均主观值MOS是广泛认同的语音质量标准,因此,无论采用何种方法所有测量方法都必须对应它们的结果对应到最终的平均主观值MOS,以上各种方法均可以最终以MOS值表示。
4 E-model测量方法的提出
以上介绍的测量方法在实验室能够很好地应用于分析个别设备的问题,例如,利用PSQM和PESQ分析话机的质量。但是这些测量方法不适用于在数据网络上分析语音质量,是基于传统的电话网络。它们的缺点主要是,测量不是基于数据网络的,不能反映诸如延时、抖动和丢包等数据网络特有的问题,没有考虑网络故障对用户感觉造成的影响,单纯的从收发信号差异的角度分析网络语音问题。为了克服这些缺点,国际电联的G.107标准提出了E-model,它关注数据全面的网络损伤因素,很好地适应在数据网络中语音质量的评估。
E-model的前提是假设语音质量损伤因素总是物理附加的,简单说来就是,如果诸如噪声、回音、延时、编码器性能、抖动等网络损伤因素能够被灵活的加入,那么网络的一个全面客观的质量等级或称为“呼叫者体验”的因素就能够被估计。
转载地址:http://www.voipchina.cn/technology/2004-09-15/37996.shtml