IP电话的关键技术
  传统的IP网络主要是用来传输数据业务,采用的是尽力而为的、无连接的技术,因此没有服务质量保证,存在分组丢失、失序到达和时延抖动等情况。数据业务对此要求不高,但话音属于实时业务,对时序、时延等有严格的要求。因此必须采取特殊措施来保障一定的业务质量。IP电话的关键技术包括:信令技术、编码技术、实时传输技术、服务质量(QoS)保证技术、以及网络传输技术等。
  
  1.信令技术
  
  信令技术保证电话呼叫的顺利实现和话音质量,目前被广泛接受的VoIP控制信令体系包括ITU-T的H.323系列和IETF的会话初始化协议SIP。
  
  ITU的H.323系列建议定义了在无业务质量保证的因特网或其它分组网络上多媒体通信的协议及其规程。H.323标准是局域网、广域网、INTRANET和Internet上的多媒体提供技术基础保障。H.323是ITU-T有关多媒体通信的一个协议集,包括用于ISDN的H.320,用于B-ISDN的H.321和用于PSTN终端的H.324等建议。其编码机制,协议范围和基本操作类似于ISDN的Q.931信令协议的简化版本,并采用了比较传统的电路交换的方法。相关的协议包括用于控制的H.245,用于建立连接的H.225.0,用于大型会议的H.332,用于补充业务的H.450.1、H.450.2和H.450.3,有关安全的H.235,与电路交换业务互操作的H.246等。H.323提供设备之间、高层应用之间和提供商之间的互操作性。它不依赖于网络结构,独立于操作系统和硬件平台,支持多点功能、组播和带宽管理。H.323具备相当的灵活性,支持包含不同功能的节点之间的会议和不同网络之间的会议。H.323建议的多媒体会议系统中的信息流包括音频、视频、数据和控制信息。信息流采用H.225.0建议方式来打包和传送。

H.323呼叫建立过程涉及到三种信令:RAS信令(R=注册:Registration、A=许可:Admission和S=状态:Status),H.225.0呼叫信令和H.245控制信令。其中RAS信令用来完成终端与网守之间的登记注册、授权许可、带宽改变、状态和脱离解除等过程;H.225.0呼叫信令用来建立两个终端之间的连接,这个信令使用Q.931消息来控制呼叫的建立和拆除,当系统中没有网守时,呼叫信令信道在呼叫涉及的两个终端之间打开;当系统中包括一个网守时,由网守决定在终端与网守之间或是在两个终端之间开辟呼叫信令信道;H.245控制信令用来传送终端到终端的控制消息,包括主从判别、能力交换、打开和关闭逻辑信道、模式参数请求、流控消息和通用命令与指令等。H.245控制信令信道建立于两个终端之间,或是一个终端与一个网守之间。
  
  虽然H.323提供了窄带多媒体通信所需要的所有子协议,但H.323的控制协议非常复杂。此外,H.323不支持多点发送(Multicast)协议,只能采用多点控制单元(MCU)构成多点会议,因而同时只能支持有限的多点用户。H.323也不支持呼叫转移,且建立呼叫的时间比较长。与H.323相反,SIP是一种比较简单的会话初始化协议。它不像H.323那样提供所有的通信协议,而是只提供会话或呼叫的建立与控制功能。SIP可以应用于多媒体会议、远程教学及Internet电话等领域。SIP既支持单点发送(Unicast)也支持多点发送,会话参加者和媒体种类可以随时加入一个已存在的会议。SIP可以用来呼叫人或机器设备,如呼叫一个媒体存储设备记录一个会议,或呼叫一个点播电视服务器向会议播放视频信号。
  
  SIP是一种应用层协议,可以用UDP或TCP作为其传输协议。与H.323不同的是:SIP

1 IP电话网络语音质量的特殊问题
     与普通电话网比较,IP电话网采用了语音压缩编码算法,将话音用数据包的形式在分组交换网上传递,因此其对传输线路的时空利用率都有大幅度的提高。但IP电话也遇到了传统电话不太关注的语音质量问题。事实上,目前IP电话的用户都会感觉到通话过程中随时会出现令人难以忍受的语音畸变和频繁的断话现象。引起语音质量恶化的原因主要是IP电话网延时、丢包(包括数据包丢失和数据包排序溢出)、沿切割和抖动,其中延时问题尤为明显。
     IP电话网中,网关或路由器内部的语音编码器(Vocoders)对带内音频信号进行打包和重组。这些器件对确认接收和有效数据包接收的顺序进行纠错检查,一旦发现错误,将命令重发,而重发相关数据包则不可避免地造成传输上的延时。网关或路由器上的另一个重要组成部分——缓存器(Buffer)即为容纳这些延时的数据包而设置。一般地讲,缓存器的容量越大,数据包被损坏的机率就越小,但同时延时却会增大。这是一对矛盾,需要系统设计和管理者来综合平衡,选择最佳的配置。图1示出了IP电话网络中延时的分布情况。
    
     
IP电话语音质量的测试
 
     非常明显,在IP电话网中影响语音质量的因素是由其结构决定的特殊问题,而且各因素之间存在着此消彼长的制约关系。因此,根据电信网络服务质量(QoS)的要求,建立一套客观评估标准,并对IP电话网的语音服务质量进行定量分析和测量就摆在了从事这项工作的人们面前。
     为了便于下文进行的关于测试方案的介绍,现就IP电话有关的术语解释如下。
     (1) 回音抑制(Echo Cancellation Algorithm)
     其定义由ITU-T建议G.168给出。回音抑制的功能是用相位补偿的方法抵消串入远端发送信号中的远端接收信号。其目标是消除延时超过45ms的回声,因为当回音超过45ms时,发话方就能够听到反射回来、滞后的自己的声音。
     (2) 语音活动检测器(VAD,Voice Activation Detector)
     该器件在信号电平低于某一特定的门限值时,将限制数据包的传输,此时其提供空闲(idle)或者“舒适噪音”(Comfort noise)以避免电话用户感到“断线”(dead air),VAD是当线路状态从空闲变成传递信号时产生“前沿切割”(“Leading edge clipping”)和当线路状态从传递信号变成空闲时产生“后沿拖尾”(“trailing edge clipping”)的根源。
     (3) 语音编码器(Voice Coder - decoder,Vocder)
     该器件应用一种对人类语音有特殊功效的压缩算法,将模拟语音转换成数字比特流。语音编码器工作时仅需<64kb/s的带宽。这种算法不仅适用于语音的压缩,在增加专门应用软件条件下,它亦可支持调制解调器和传真的应用。语音编码器是在IP电话网中上产生延时的一个重要因素。
     (4) 语音压缩算法(Voice Compression Algorithm)
     人类语音交流过程中,通常有50%的时间为静音(Silent)。为了节约带宽,就必须压缩静音。同时还要使用不同的算法来对普通电话呼叫中的人类语音及其中所含的诸如DTMF等特殊的控制音调转换的指令进行压缩打包,并将其送达接收端。
     (5) 缓存器(Buffer)
     缓存器用于管理信息,使其按顺序从点到点依次通过。在诸如网关这样的器件中,缓存器的功能是处理两个方向的信息流。即语音编码器与分组交换网之间的发送信息流和分组交换网与语音编码器之间的接收信息流。缓存器通常按需要来设置其容量,而缓存器的溢出和冗余均是导致丢包、延时和抖动的重要因素。
     2 IP电话语音质量的测试
     2.1 测试参数
     IP电话网中的语音质量问题是普通电话网中不存在的特殊问题,能否对其进行定量的分析测量,并依据测量结果对IP电话网中各器件进行调整,使其达到最佳的语音质量,已成为决定IP电话生存发展的必要条件。 衡量语音质量有4个重要参数,即:
     · 延时(Delays),包括单向延时(One Way delays)和回路延时(Round - trip delays);
     · 丢包(Dropped - out);
     · 抖动(Jitter);
     · 沿切割(Clipping)。
     根据测试经验和理论分析,若使IP电话的语音质量接近普通电话,单向延时的指标最好<100ms,最大不能超过250ms(见图1),而丢包率不能超过5%。
     2.2 原有的测试方法
     随着IP电话技术的发展,人们不断寻求测试方法,以便能规范IP电话设备的技术标准。最初ITU-T建议P.800提出了MOS(Mean Objection Score)的方法。即请40 ~ 60 位有代表性的人士来听一段相同的语音样本,然后对该样本经过IP电话传输后的语音质量进行投票评价。随着语音因语言、年龄、性别的变化,得分亦被赋予不同的意义。这是一种纯粹主观的定性测量。ITU-T选取在非常宽的听觉范围内,不同年龄、性别和语言组别的相同得分,作出语音质量的判别标准:5:最佳 4:好(4.5 - 4.0 =可收费电信级) 3:中级(4.0 - 3.5 =可通话通信级) 2:较差(3.5 - 2.5 =可建立连接级) 1:差 很显然,MOS方法是一种模糊的评估方法,其测试结果很难对IP电话系统的改进和不同IP电话设备之间性能的比较作出有实际意义的判别。因此ITU-T在建议P.861中又提出了PSQM(Perceptual Speech Quality Measurement)方法。
     PSQM仍以MOS的5个级别作为客观标准,所不同的是其对每一个级别都以百分比的方式作出了差/最差(%PoW,Percent Poor or Worse )和好/最好(%GoB,Percent Good or Better)的进一步描述。根据P.861提出的PSQM方法,IP电话的测试开始摆脱原始的人类主观评估,而开始使用计算机产生的波型文件(Wave File),通过比较其通过IP电话网传输前后的变化计算出PSQM中相对应的级别及好坏程度。
     PSQM无疑比MOS前进了一步,但其实质仍然是一种定性评估的方法,不能准确给出影响IP电话网语音质量的诸因素的量值,而且波形文件不能完全代表各种不同年龄、性别、语言的人类语音通过IP电话网时的真实情况,同时在具体测试中必须令波形文件信号返回方可进行比较,这样就无法测量网络端到端的单向延时,这些都是PSQM的局限和缺憾。
     显然IP电话技术的发展迫切需要一种能定量分析测量其影响语音质量的4个参数的方法和相应仪器设备。
     3 Ameritec的测试方案
     针对IP电话网的特点和对其语音质量测试的要求,Ameritec在长期从事电路交换语音测试和模拟语音传输损耗测试(TIMS)研究的理论上,开发了用于分组交换系统测试的专利技术——“ Golden Voice ”。
     “Golden Voice”是一个复合音调发生器,其产生的复合音调信号可以确保其作为测试音信号可靠地通过所有现在的语音编码器和译码器(如G.711,G.728,G.729,GSM,CDMA 等)。
     “Golden Voice”可以配置在Ameritec的任何型号的大话务量呼叫发生器上,因此利用Ameritec的大话务量呼叫发生器可以随时为用户提供各种物理接口用于IP电话测试,如模拟用户线、随路信令 (CAS)数字中继(E1/T1),No.7信令(CCS)数字中继(E1/T1)和ISDN(BRI/PRI)等。图2所示为测试的连接。