一、影像视频格式
人们日常生活中接触较多的VCD(Video CD:数字小型视频光盘)、S-VCD(Super VCD:极好的数字小型视频光盘)、DVD(Digital Versatile Disk:高密度数字视频光盘)和多媒体光盘中的动画等等,这些都是影像文件。影像文件不仅包含了大量图像信息,同时还容纳大量音频信息。所以,影像文件的数据容量往往不可小看,小到几MB,大到几十MB。目前常用的影像文件格式有AVI、MOV和 MPEG等格式,具体如下。

1、AVI格式

AVI(Audio Video Interleaved)的专业的名字叫做音/视频交错格式。是由Microsoft公司开发的一种数字音频和视频文件格式,原先仅仅用于微软的视窗视频操作环境(VFW ,Microsoft Video For Windows),而现而今已被大多数PC机操作系统直接支持。

AVI格式,一般用于保存电影、电视等各种影像信息,有时它也出没于Internet中,主要用于让用户欣赏新影片的精彩片段。常用的AVI播放驱动程序,主要有Microsoft Video for Windows或Windows 95/98中的Video 1,以及Intel公司的Indeo Video等等。

在多媒体光盘中,人们常常可以发现它的踪影,如果你是一名游戏爱好者,就会注意到许多游戏的片首动画都是AVI格式。如《仙剑奇侠传》的片首那段,我国传统的古装色彩(青山、绿水、白鹭)的动画就是采用的AVI格式。

AVI格式允许视频和音频交错在一起同步播放,但由于AVI文件没有限定压缩标准,由此就造就了AVI文件格式不具有兼容性。不同压缩标准生成的AVI文件,就必须使用相应的解压缩“算法”见文后注解1,才能将之播放出来。

2、MOV格式(Quick Time)

Quick Time格式大家可能不怎么熟悉,因为它是Apple公司开发的一种音频和视频文件格式。Quick Time用于保存音频和视频信息,现在它被包括Apple Mac OS、Microsoft Windows 95/98/NT在内的所有主流PC机平台支持。Quick Time文件格式支持25位彩色,支持领先的集成压缩技术,提供150多种视频效果,并配有提供了200多种MIDI兼容音响和设备的声音装置。

新版的Quick Time进一步扩展了原有功能,包含了基于Internet应用的关键特性。Quick Time因具有跨平台、存储空间要求小等技术特点,得到业界的广泛认可,事实上它已成为目前数字媒体软件技术领域的工业标准。

3、MPEG格式

MPEG(Moving Pictures Experts Group:动态图像专家组)是由ISO(International Standards Organization:国际标准化组织)和IEC(International Electronic Committee:国际电工委员会)于1988年联合成立,专门致力于运动图像(MPEG视频)及其伴音编码(MPEG音频)标准化工作。MPEG是运动图像压缩算法的国际标准,现已被几乎所有的PC机平台共同支持。

MPEG和前面某些视频格式不同,是采用有损压缩“算法”,来减少运动图像中的冗余信息的,从而达到高压缩比的目的,当然这些是在保证影像质量的基础上进行的。MPEG压缩标准是针对运动图像而设计的,其基本方法是:在单位时间内采集并保存第一帧信息,然后只存储其余帧相对第一帧发生变化的部分,从而达到压缩的目的。

MPEG家族中包括了MPEG-1、MPEG-2和MPEG-4等在内的多种视频格式。平均压缩比为50比1,最高可达200比1,压缩效率之高由此可见一斑。同时图像和音响的质量也非常好,并且在计算机上有统一的标准格式,兼容性相当好。

MPEG标准包括MPEG视频、MPEG音频和MPEG系统(视频、音频同步)三个部分,MP3音频文件就是MPEG音频的一个典型应用,而VCD、S-VCD、DVD则是全面采用MPEG技术所产生出来的新型消费类电子产品。

当你在电脑上打开VCD和DVD光盘文件时,你会发现其中有一个MPEG的文件夹。实际上已经告诉你,VCD光盘压缩就是采用MPEG这种文件格式,具体地讲,是用MPEG-1格式压缩的,使用MPEG-1的压缩算法,可以把一部120分钟长的电影压缩到1.2GB左右。MPEG-2则应用在DVD的制作(压缩)方面,同时在一些HDTV(高清晰电视广播)和一些高要求视频编辑、处理上也有相当的应用。使用MPEG-2的压缩算法可以把一部120分钟长的电影压缩到4到8GB左右。

二、流式视频格式

当今,许多视/音频数据是通过Internet来进行实时传输的,其传输方式有两种,一是媒体以文件形式存储,“先传输后播放”,用FTB下载或E-mail传输,这样对于比较小的文件是可行的,比如MP3音乐。但是对于电影电视,由于文件容量非常“宽大”,相对现有的网络带宽来讲是十分“窄小”。若仍然采用“先传输后收看”,则需要很长的传输时间,人们将感到厌烦。对于远程会议和远程监控等图像信息,人们需求的是“一边传输一边收看”的“流媒体”传输格式,即先从服务器上下载一部分视频文件,形成视频流缓冲区后实时播放,同时继续下载,为接下来的播放做好准备。这种“边传边播”的方法克服了用户必须等待整个文件从Internet上全部下载完毕后方能观看的缺点。到目前为止,Internet上使用较多的流式视频格式,常见的有以下几种。

1、RM格式

RM格式即Real Media是由Real Networks公司开发的一种能够在低速率的网上实时传输视/音频信息的视/音频压缩规范的流式视/音频文件格式,可以根据网络数据传输速率的不同制定了不同的压缩比率,从而实现在低速率的广域网上进行影像数据的实时传送和实时播放。是目前Internet上最流行的跨平台的客户/服务器结构流媒体应用格式。

RM格式的魔下共有三员大将,即Real Audio、Real Video和Real Flash三类文件。Real Audio用来传输接近CD音质的音频数据,Real Video用来传输连续视频数据,而Real Flash则是Real Networks公司与Macromedia公司新近合作推出的一种高压缩比的动画格式。

Real Video文件除了可以以普通的视频文件形式播放之外,还可以与Real Server服务器相配合,首先由Real Encoder负责将已有的视频文件实时转换成Real Media格式,Real Server则负责广播Real Media视频文件。在数据传输过程中可以边下载边由Real Player播放视频影像,而不必像大多数视频文件那样,必须先下载然后才能播放。目前,Internet上已有不少网站利用Real Video技术文件,进行重大事件的实况转播。

Real Player是在网上收听收看这些实时视/音频和Flash的最佳工具。只要用户的线路允许,使用Real Player可以不必下载视/音频内容就能实现网络在线播放,更快捷地上网查找和收听、收看各种广播、电视节目。Real Video(RA、RAM)格式一开始就是定位在视频流应用方面的,也可以说是视频流传输技术的始创者。它可以在用56K Modem拨号上网的条件下实现不间断的视频播放,网络连接速率不同,客户端所获得的视/音频质量也不尽相同,以声音为例:对于14.4Kbps的网络连接,可获得调幅(AM)质量的音质,对于28.8Kbps的连接,可以达到广播级的音频质量。

2、MOV格式(Quick Time)

MOV(Movie digital video technology)是由全球另一大类微机—Apple公司推出的流媒体视频格式,即,相应的视频应用软件为Apple's Quick Time for Macintosh。由于Apple公司推出了适用于PC机的视频应用软件Apple's Quick Time for Windows,因此在PC机上也可以播放MOV视频文件。

MOV也可以作为一种流媒体文件格式。Quick Time能够通过Internet提供实时的数字化信息流、工作流与文件回放功能,为了适应这一网络多媒体的应用,Quick Time为多种流行的浏览器软件提供了相应的Quick Time Viewer插件(Plug-in),能够在浏览器中实现多媒体数据的实时回放。该插件的“Fast Start(快速启动)”功能,可以令用户几乎能在发出请求的同时便收看到第一帧视频画面。而且,该插件可以在视频数据下载的同时就开始播放视频图像,用户不需要等到全部下载完毕就能进行欣赏。此外,Quick Time还提供了自动速率选择功能,当用户通过调用插件来播放Quick Time多媒体文件时,能够选择不同的连接速率下载并播放影像,当然,不同的速率对应着不同的图像质量。此外,Quick Time还采用了一种称为Quick Time的VR(VR:Virtual Reality即虚拟现实)技术,用户只需通过鼠标或键盘,就可以观察某一地点周围360度的景象,或者从空间任何角度观察某一物体。

MOV格式的视频文件可以采用不压缩或压缩的方式,其压缩算法包括Cinepak、Intel Indeo Video R3.2和Video编码。经过几年的发展,现在Quick Time已经在“视频流”技术方面取得了不少的成果,最新发表的Quick Time4是第一个基于工业标准RTP和RTSP协议的非专有技术,能在Internet上播放相当清晰的视频/音频流的节目。

Quick Time是一种跨平台的软件产品,无论是Mac的用户,还是Windows的用户,都可以毫无顾忌地享受Quick Time所能带来的愉悦。利用Quick Time4播放器,能够很轻松地通过Internet观赏到以较高视频/音频质量传输的电影、电视和实况转播的体育赛事节目。

3、ASF格式

ASF(Advanced Streaming Format:高级流格式)是Microsoft公司推出的,也是一个在Internet上实时传播多媒体的技术标准,Microsoft公司的野心很大,为了与现在的Real Media竞争,开发了一种可以直接在网上观看视频节目的视频文件压缩格式。它的视频部分采用了先进的MPEG-4压缩“算法”见文后注解1,音频部分采用了微软新发表的一种比MP3还要好的压缩格式WMA。希图用ASF取代Quick Time之类的技术标准。

ASF的主要优点包括:本地或网络回放、可扩充的媒体类型、部件下载、以及扩展性等。

ASF的压缩率和图像质量都很不错,因为ASF是以一个可以在网络上即时观赏的“视频流”格式存在的,所以它的图像质量比VCD差一点点,但比同是“视频流”格式的RAM格式要好。

ASF应用的主要部件是NetShow服务器和NetShow播放器,有独立的编码器将媒体信息编译成ASF流,然后发送到NetShow服务器,再由NetShow服务器将ASF流发送给网络上的所有Net Show播放器,从而实现单路广播或多路广播。这和Real系统的实时转播则是大同小异。

4、WMV格式

WMV格式,也是一种独立于编码方式的在Internet上实时传播多媒体的技术标准,Microsoft公司希望用其取代Quick Time之类的技术标准以及WAV、AVI之类的文件扩展名。

WMV的主要优点包括:本地或网络回放、可扩充的媒体类型、部件下载、可伸缩的媒体类型、流的优先级化、多语言支持、环境独立性、丰富的流间关系以及扩展性等。

5、DivX格式

DivX是目前MPEG最新的视频压缩、解压技术,DivX是一种对DVD造成最大威胁的新生的视频压缩格式。这是因为,DivX是为了打破ASF的种种协定而发展出来的,是由Microsoft MPEG-4 v3改进而来,同样使用了MPEG-4的压缩“算法”。

由于MPEG-4是集合并支持不同性质的对象和不同来源的素材(如:自然视频、图形、文字等)用于不同应用(如:Internet、视觉编辑、消费视频、专业视频、2D/3D计算机图形、移动通信等)的、考虑了各类网络性能很大差异性的、允许多媒体信息“通用接入”的、第一个使用户视听方式由被动转为主动(不再只是观看,而是允许用户加入其中的交互观看)的动态图像标准。

另外,MPEG-4在较低的数据率下,还有着相当高的视频图像质量,提供了比 MPEG-1和MPEG-2编码过程中所需要更好更强的“算法”,实现了低比特率下的多媒体交互应用中“AV对象”见文后注解2的综合。

实际上MPEG-4主要是针对多媒体交互应用,采用按照具有一定时间关系(同步)和空间关系(对于视频而言是在屏幕上,对于音频而言是在房间内)的“AV对象”进行压缩处理,利用形状编码、Sprite编码、时间空间伸缩编码等技术,用较小的数据量达到了MPEG-2相同的视频分辨率和相同的图像质量。

用MPEG-4压缩一部DVD大片只需要2张CD-ROM。这样就意味着用户不需要额外购买DVD光驱可以得到和它差不多的视频质量。而且播放DivX这种编码,对机器的要求也不高,CPU主频只要求在300MHz以上,而且在CPU类型的选择方面,不论你的芯片是PII、CELERON还是PIII、AMDK6/2、AMDK6III、ATHALON,就是CYRIXx86也可以。在配置为64兆内存和一个8兆显存的显卡上,DivX便可以流畅地播放了。

文中注解

1、算法:MPEG蓝本中明确“算法”是用以完成一项或多项要求的有组织的工具集合。“算法”自身可由工具和(或)算法组成。如:码激励线性预测、DCT图像编码、里德所罗门编码、语音驱动图像编码。

2、AV对象:MPEG蓝本中明确“AV对象”是对可以用声音和(或)视觉的形式来表达的现实或虚拟对象的一种表示方法。AV对象通常是具有层次性的,即它们可以由其它AV对象的组合来定义,用于构成组合的对象称为子对象。由于子对象的组合构成的AV对象称为复合AV对象。而所有其它的AV对象称为基AV对象。不能被分解为子对象AV对象称为基AV对象。