视讯会议基本原理
一、 H.323协议栈
最新的视频会议,主要基于H.323协议栈,是一个工作在分组交换网络上的无需QoS的协议栈,内容包括终端,网关,网守,MCU,MC,MP等
1、 终端,负责多媒体或数据信息的接收和发送(当然也包括音视频的解码和编码),常见的是我们的会议终端,比如华为viewpoint 9036。另外一台装有特定软件的PC机或者IP电话等等也都可以算作终端。
2、 网关,GW,负责与非H.323的终端进行连接,和数据及信令的转换。
3、 网守,也就是GK(gatekeeper),顾名思义,主要负责终端的注册、准入及断开。另外,还具有名称和地址翻译的功能(类似DNS),特殊需求中的计费功能(我理解为类似网吧那种管理软件)。GK是一个逻辑功能体,并非一个物理体。它可以集成在MCU或终端内部,也可以运行在一台服务器中,也有专门的GK设备。
4、MCU,多点控制单元。可以看做是视频会议中的一个核心级高性能交换机,负责大量音视频信息和数据信息的吞吐。另外,具有对信息交换过程的控制功能。高端MCU的各个功能模块都有冗余备份。即使会议当中出现了问题,也会立即切换,而对用户来说完全透明。
5、MC和MP,同样是两个逻辑功能体,并非物理体。可以集成在MCU中,也可以集成在终端中,MC同MP可以在一起也可以分开。MC是多点控制器,负责信息交换过程中的动作控制。MP是多点处理,负责音视频及数据信息的交换。
6、RM。在PPT中看到过RM, 是resource management,资源管理,可以理解为进行会议控制的服务器及相关软件。
以集中式会议为例,工作模式是这样。
1、GK扫描全局发现终端和它们的工作状态。需要参加会议的终端向GK发出连接请求,如果身份合法,GK将通过其验证请求,并让终端和MCU进行连接,然后分配一个合理的带宽。终端和GK之间的控制信令遵循RAS(registration admission status)协议并采用UDP方式传输,我想采用UDP的原因和DNS请求采用UDP应该类似。RAS属于H.225呼叫信令协议。
2、非H.323的与会终端,通过网关,再通过GK的验证和分配,然后连接到MCU。
3、集中式会议中的MC和MP集成在MCU中。此时,MC开始工作。(插入一点对比,视讯会议中有两种控制信令,用于呼叫控制的H.225和用于多媒体传输控制的H.245。而数通部分的传输是基于相对独立的T.120。很显然,MC肯定是基于H.245了。为提高安全性,各种H.323中的信令都可以采用H.235进行加密)。
MC主要工作过程
(1),能力交换。MC会让发送数据的终端知道接收方终端的性能和处理能力,以便发送合适的数据保证正常会议。否则9039给8033发送1080P就难搞了。
(2),通信信道的建立和关闭,是由MC来管理。这里的“信道”也是逻辑概念,如果带宽够大,一条物理线路上可有多个信道。
(3),假如环境中包含2个以上MC,它们会根据特定规则确定一个MC当老大。这个选举过程大致为,先看哪个MC所在设备性能强,谁就当老大。如果大家一样强,则根据一个随机状态号来决定,类似于猜拳。
(4),华为的IRC智能调速功能,我想应该也属于MC来实现。
MP主要工作内容
MP作为多点处理,就是实现大量实时音视频数据流的交换。顺便提一下,因为会议要求时延非常低,完整性要求并不高(就算最古老的CIF也有10万像素,稍微丢千把个像素没啥影响,何况华为还有SEC技术),所以音视频数据采用UDP传输。而基于T.120的数据传输,刚好相反,要求完整性很高,丢一点东西或许整个文件就打不开了,而晚几秒传到目的地影响也不大,所以采用TCP方式。同样的,实时音视频数据采用RTP封装(UDP),而控制信令则采用RTCP封装(TCP)。
一、关于音视频的编码
(1)视频。
从古老到前沿,视频分辨率经历了CIF(352x288),4CIF,9CIF和20CIF。而720P(D4)或1080i(D3)为目前的主流高清标准,1080P(D5)面向专业需求,价格还较高。
关于编码,主要有两个技术联盟在开发。国际电联(ITU-T,也是H.323的制定组织)的H.26X系列,和ISO的MPEG系列。然而,目前最优秀的H.264,却是双方合作产生的一个高清标准。具有视频效果好,压缩比高(也就是数据小)的优点,而且是开放的。
采集设备常见的有索尼D70(标清),HD1(1080P),和华为自家的C500.
(2)音频。
从古老到前沿,音频编码经历如下几类标准。
G.711,主要用于PSTN,也就是普通电话的电路交换网络上,音质较低。
G.722,音质好是好了,但是带宽要求很高。G.728,延时小,但是编码却很复杂,它们注定不够实用。
AAC-LD:CD级的音质,而且编码简单延时低,是华为设备主要采用的标准。
另外,好的会议系统麦克风应具有全方位双声道(采用阵列式实现),ANS(噪声抑制),AGC(自动增益),AEC(回声消除)等功能
二、双流
双流,基于H.239,就是在一条线路上,双方可以同时的、双向的传递两路视频信号。这样,就可以一边看到PPT,一边看到与会现场。而且可以做到高清(720P)。而华为相关设备的双流功能都是最全面的,而且内置。轻松实现动态视频加1280x1024的计算机桌面视频。
但是,H.239属于H.323的附加协议,只能运行在H.323系统之上。
关于SIP和H.323的理解
SIP是类似于HTTP,SMTP等面向所有大众的协议,通过在PC机上运行相关程序,将来每个普通网民都可以简单的实现视频通话,而无需专门的投入很多成本。类似现在的QQ视频聊天。
但是H.323是面向专业级视讯会议,具有更高的质量和可靠性、可管理性。
一般H.323设备,也同时支持SIP协议。