5.1 数字媒体技术概述
以数字媒体、网络技术与文化产业相融合而产生的数字媒体产业,正在世界各地快速成长。数字媒体产业的迅猛发展,得益于数字媒体技术不断突破产生的引领和支持。数字媒体技术融合了数字信息处理技术、计算机技术、数字通信技术和网络技术等交叉学科和技术领域,它的形成和发展,不仅引起计算机工业的一次革命,也影响人类社会发生了一次巨大的变革。
本节学习的任务:了解数字媒体和数字媒体技术的概念、数据压缩的技术。
5.1.1 数字媒体与数字媒体技术
1. 数字媒体的概念
(1)媒体
媒体(Media)是指信息表示和传播的载体。在计算机领域,媒体主要有如下五种:
①感觉媒体。直接作用于人的感官,使人能直接产生感觉的信息载体称作感觉媒体。例如,人类的语言、播放的音乐、自然界的声音、运动或静止的图像等,计算机系统中的文件、数据和文字,也是感觉媒体。
②表示媒体。表示媒体是指各种编码,如汉字输入法编码、字符的字形编码、图像编码等。这是为了加工、处理和传播感觉媒体而人为地进行研究、构造出来的一种编码。
③表现媒体。表现媒体是人与计算机之间的界面,一般指输入输出设备,如键盘、显示器、触摸屏、摄像机、打印机、话筒等。
④存储媒体。存储媒体用来存放表示媒体,是存储信息的实体。例如,内存条、U盘、硬盘、光盘、SD卡、TF卡等。
⑤传输媒体。传输媒体是用来将媒体从一处传送到另一处的物理载体,如双绞线、同轴电缆、光纤等。
(2)多媒体
媒体从形式上又分为文字、声音、图形、图像、动画和视频等。多媒体是多种媒体形式的综合。
(3)数字媒体
数字媒体是指以二进制数据的形式获取、记录、处理和传播信息的载体,其传播形式采用数字化。
数字媒体以信息技术为主导,以大众传播理论为依据,以现代艺术为指导,将信息传播技术应用到广告、文化、艺术、贸易、教育和管理等领域,已经成为继语言、文字和电子技术之后新的信息载体。
2. 数字媒体技术
数字媒体技术是通过现代计算机技术和通信手段,综合处理文字、声音、图形、图像、动画和视频等多种形式的数字媒体,使之建立逻辑联接,从而集成人机交互系统的技术。
数字媒体技术主要研究与数字媒体信息的获取、处理、存储、传播、管理、安全、输出等相关的理论、方法、技术与系统。数字媒体技术包括了计算机技术、通信技术、网络技术和信息处理技术等综合应用技术。
数字媒体技术的关键技术包括数据压缩技术、专用芯片、大容量存储器、网络通信技术和流媒体技术。
(1)数据压缩技术。视频信号和音频信号数字化后的数据量非常大,如果不经过数据压缩,将会占用大量的存储空间。以视频信号为例,视频每秒连续播放30幅左右的图像,每幅图像称为一帧。一帧中等分辨率(640×480)真彩色(24位/像素)视频图像约占900KB的存储空间,一张650MB的光盘,只能存放24秒视频信号。因此,数据压缩技术自然成为了数字媒体技术的核心技术。
(2)专用芯片。由于要进行大量的数字信号处理、图像处理、压缩和解压缩等运算,需要使用专用的数字信号处理芯片(DSP),这种芯片可以运行一条指令就完成普通计算机上需要多条指令才能完成的处理。超大规模集成电路制造技术降低了数字信号处理芯片的生产成本,为数字媒体技术的应用与普及创造了条件。
(3)大容量存储器。经过压缩处理的数字媒体保存在计算机里仍然会占用很大的存储空间,因此高效快速的大容量存储器是数字媒体系统的基本部件之一。目前,DVD光盘、大容量的硬盘是主要的大容量存储器。
(4)网络通信技术。20世纪90年代以来,计算机技术以网络技术为中心得到迅速发展,要充分发挥数字媒体技术,还必须与网络技术、通信技术相结合。计算机用户如果不借助网络,将无法获得更加丰富的、实时的数字媒体信息。在可视电话、电视会议、视频点播、远程教育等领域,现代网络通信技术为数字媒体技术的发展提供了有力的保障。数字媒体技术和网络技术、通信技术的结合突破了计算机、通信、电子等传统领域的行业界限,把计算机技术的交互性、网络通信技术的分布性和数字媒体技术的综合性融为一体,提供了全新的信息服务,从而对人类的生活和工作方式产生深远的影响。
(5)流媒体技术。流媒体是指在Internet上采用流式传输技术的连续媒体。流媒体技术是一种使音频、视频或其他数字媒体在Internet上以实时的、无需下载等待的方式进行播放的技术。单击某个Internet链接打开流媒体文件时,媒体播放软件将该文件下载并存储在缓冲区内,然后开始播放。随着数据的不断流入,播放器在播放之前不断地将信息存储在缓冲区中。这时如果网络信息中断,暂时不会出现播放时停顿的现象。但是当缓冲区中的数据用完,播放就会停止。
流媒体常见的文件格式有SWF、ASF、WMV、RM等。
5.1.2 数据压缩技术
1. 数字化图像技术
(1)矢量图
矢量图使用直线和曲线来描述图形,这些图形的元素是一些点、线、矩形、多边形、圆和弧线等。例如,图5-1的矢量图形是由线段形成外框轮廓,由外框的颜色以及外框所封闭的颜色决定图形所显示的颜色。
矢量图只能通过计算机软件生成,其特点是存储量小,大小变换时不失真,自由、方便填充色彩,但不能表现色彩层次丰富的逼真图像效果。Adobe公司的Illustrator和Corel公司的CorelDraw软件均能制作与编辑矢量图。
(2)图像
图像是一种位图、点阵图像。位图是用像素点来描述一幅图像,它的基本元素是像素或像素点。
位图图像文件一般存储量大,适合于表现含有大量细节的画面。在Windows附件中的画图软件生成的BMP文件就是属于位图图像格式的文件。
与矢量图相比,位图放大时,放大的是其中的每个像素点,所以有时看到的是失真的模糊图片。
描述图像的参数主要有分辨率、颜色深度和存储容量。
①分辨率。分辨率是指图像在水平与垂直方向上的像素点个数。如1024×768的图像指该图像水平方向上有1024个像素点,垂直方向上有768个像素点。图像分辨率越高,图像越清晰,但图像文件在电脑中所占的存储空间也越大。
②颜色深度。图像的颜色深度又称为灰度级。位图图像中每个像素点的颜色信息用若干位的二进制数来表示,这种数据的位数称为图像的颜色深度,代表图像可以显示的颜色数量。如:颜色深度为n,则颜色总数为2n;颜色深度为1则颜色总数为2(=21),即只有全黑和全白两种颜色,这样显示几何体时的空间显现能力非常差;颜色深度为3则颜色总数为8(=23),即在全黑和全白之间还有6位不同亮度的灰色,通过灰度就可以提高画面中物体的立体感,这就是灰度级概念的来源;在彩色图像中,颜色深度还有4位、8位、16位、24位、32位等。颜色深度值越大,图像显示的效果越逼真,但是图像文件在电脑中所占的存储空间也将越大。当前图像的颜色深度值并没有无限增大,BMP格式图像支持红、绿、蓝各256种,总共24位,可显示1667万种颜色,已经超出人眼所能识别的色彩总数,被称为“真彩色”,PNG格式图像除了支持24位的颜色外,还添加了8位alpha通道用于控制透明度,所以总共是32位。
③存储容量。图像数据容量大小的计算公式是:水平像素点数×垂直像素点数×颜色深度/8B。例如一幅1024×768的分辨率、24位真彩色的图像数据容量为1024×768×24/8/1024/1024=2.25(MB)
数字图像技术的过程包括输入、数字化处理和输出。输入又包括即图像采集和数字化,是对模拟图像进行抽样、量化得到数字图像,并存储到计算机中以待进一步处理。数字化处理是按一定要求对数字图像进行诸如滤波、锐化、矫正等处理,以提取图像中的主要信息。输出则是将处理后的数字图像显示、打印或以其他方式表现出来。
2. 数据压缩技术
经过数字化处理后的图片、声音、视频等数字媒体的数据量非常大。为了解决存储、处理和传输大容量数据的问题,除了提高计算机本身的性能以及通信信道的带宽外,更重要的则是对数据进行的压缩。
(1)数据冗余
媒体数据压缩是要在不影响或少影响媒体质量的前提下,尽量设法减少媒体数据中的数据量。其中首要任务,就是去除各种媒体数据中的冗余数据。在一个数据集合中重复的数据称为数据冗余。媒体中的冗余数据主要有以下几类。
空间冗余:静态图像在进行数字化处理生成点阵图后,很多的相邻像素点的数据是一样或十分接近的,这些完全一样或非常接近的数据可以进行帧内压缩,这种冗余就称为空间冗余。
时间冗余:动态图像多帧连续画面中,图像序列中两幅相邻的图像有很多部分是相同的或十分接近的,这部分数据可以采用帧间压缩,这种图像之间的相关性冗余称为时间冗余;
听觉冗余:人所能听到的声音信号频率在20~20000Hz之间,在这个频率以外的声音可以压缩去掉,这种冗余称为听觉冗余。
编码冗余:对于文本数据和程序来说,数据的信息量常常少于数据本身,例如有这样一个字母序列AABBBCCCCDDDDDDDD,可以用压缩编码2A3B4C8D来表示,原来17个字符变成了8个,这种冗余就是编码冗余。
数据冗余的种类还有很多,如不能为视觉感知变化的信息称为视觉冗余等等,在此不一一列举。
(2)数据压缩
数据压缩的基本流程:先根据媒体数据冗余的特点,确定相应的压缩算法(即建立数学函数模型),然后通过硬件或软件(即编码器)来进行复杂的数学变换运算得到压缩的数据编码。需要用到媒体数据时,则通过解码器对压缩的数据进行解压后再现。
可见,数据压缩过程一般有二个步骤,即编码过程和解码过程,编码过程就是将原始数据经过编码进行压缩,以便于存储与传输;解码过程是对压缩的编码数据进行解码,还原为可以使用的数据。
数据压缩分为有损压缩与无损压缩。无损压缩一般用于文本数据的压缩,它能保证完全恢复出原始数据,一个很常见的例子就是磁盘文件的压缩。无损压缩的“压缩比”较低,并不适合对数字媒体进行压缩。有损压缩会减少信息量,损失的信息不能再恢复,因此是不可逆的,由于允许一定程度的失真,适用于重建信号不一定非要和原始信号完全相同的场合,如图像、声音、视频等数据就可采用有损压缩,以获得较高的压缩比。
衡量数据压缩技术的指标主要有三方面:(1)压缩比要大;(2)压缩算法要简单,压缩和解压的速度快;(3)恢复效果要好。这三方面往往相互制约,如压缩比大,往往恢复效果会差一些,因此要根据媒体特性来选择压缩技术,在保证恢复效果的前提下提高压缩比。
3. 静止图像压缩编码标准(JPEG)
数字化的点阵图像可以把图像看作一个矩阵,其行和列的交叉处就是图像中的一个点。如果相邻像素相同或相似就存在空间冗余,可以进行压缩。
国际标准化组织(ISO)和国际电报电话咨询委员会(CCITT)联合成立“联合图像专家组”(JPEG),制定出《多灰度静止图像的数字压缩编码》国际标准,这是一个适用于彩色和单色多灰度或连续色调静止数字图像的压缩标准。
JPEG有两种基本的压缩算法:一种是采用以预测技术为基础的无损压缩算法;另一种是采用以离散余弦变化为基础的有损压缩算法。目前应用较多的主要算法是有损压缩,该算法主要存储颜色变化,尤其是亮度变化,因为人眼对亮度变化要比对颜色变化更为敏感,只要重建的图像与原始图像在亮度和颜色上相似,在人眼看来就是相同的图像。JPEG的原理不是重建原始画面,而是丢掉那些未被注意的颜色,生成与原始画面类似的图像,因此,具有较大的压缩比。JPEG格式是目前应用最广的图像格式。
4. 动态图像压缩编码标准(MPEG)
MPEG(运动图像专家小组)标准包括三部分内容:MPEG视频、MPEG音频、MPEG系统(视音频同步)。MPEG视频压缩技术是针对运动图像的数据压缩技术,在保证图像质量的前提下,运行高压缩比的压缩算法,采用帧内图像数据压缩和帧间图像数据压缩技术,用于减少空间和时间冗余信息。
MPEG组织制定了一系列标准,每个标准都有不同的目标和应用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21标准。下面主要介绍MPEG-1和MPEG-2。
MPEG-1是MPEG组织制定的第一个视频和音频有损压缩标准,是为CD光盘介质定制的视频和音频压缩格式,主要应用于视频信号的数字化压缩存储,压缩比大约为100∶1,传输速率为1.5Mbps,允许超过70分钟的视频和音频存储在一张CD-ROM光盘上。MPEG-1的特点是:清晰度不够高,存储容量还是过大,网络传输慢,尤其是在低带宽网络上无法实现远程视频传输。VCD采用就是MPEG-1标准。
MPEG-2是数字电视(DTV)、高清晰度电视(HDTV)和数字视盘DVD数据的压缩标准。它克服了MPEG-1的许多缺陷,传输速率为3~10Mbps。MPEG-2让数字电视最终完全取代模拟电视。
MPEG-4标准主要应用于视频电话、视频电子邮件和电子新闻等,其压缩比更高,所以对网络的传输速度要求相对较低。
5.1.3 数字媒体技术的应用领域
数字媒体技术是当今信息技术领域发展最快、最活跃的技术,广泛应用于咨询服务、电子图书出版、教育、通信、军事、金融、医疗、游戏与娱乐等众多行业,并潜移默化地改变着我们的生活面貌。
1.远程教育
基于网络的远程教育依靠现代通信技术和数字媒体技术的发展,大幅度地提高了教育传播的范围和时效,使教育传播不受时间、地点、国界和气候的影响。新兴的远程教育,真正打破了校园的围墙界限,改变了传统“课堂教学”的概念,突破了时空的限制,学生可以接受到来自不同国家、教师的指导,可获得更丰富、直观的数字媒体教学信息,共享教学资源。远程教育可以按学习者的思维方式来组织教学内容,也可以由学习者自行控制和检测,使传统的教学由单向转向双向,实现了远程教学中师生之间、学生与学生之间的双向交流。
2.可视电话
可视电话是利用通信线路实时传送人的语音和图像的一种通信方式,是一种点到点的视频通信。由于可视电话能收到面对面交流的效果,实现人们通话时既闻其声、又见其人的梦想,因此自从概念提出后就受到普遍的好评。
3.视频会议
视频会议系统是一种实时分布式数字媒体软件应用的实例,它通过实时音频和视频这种富有现场感的媒体,可以点对点通信,也可以多点对多点的通信,而且还充分利用其它媒体信息,如图形标注、静态图像、文本等信息进行交流,对数字化的文本、视频及音频等数据进行实时传输,利用计算机系统良好的交互功能和管理功能,建立“面对面”的虚拟会议环境。视频会议融汇计算机的交互性、通信的分布性和视频投影的真实性为一体,具有明显的优越性,是一种快速高效、日益增长、广泛应用的新业务。
4.交互式电视与视频点播
交互式电视(ITV)与视频点播(VOD)是一种根据用户要求播放节目的数字媒体技术应用系统,具有提供给单个用户对大量的影片、视频节目、游戏、信息等进行同时访问的能力。对于用户而言,只需配备电脑终端或者一台电视机、机顶盒和一个视频点播遥控器,“想看什么就看什么,想什么时候看就什么时候看”,用户和被访问资源之间高度的交互性使它区别于传统视频节目的接收方式。它是融合了计算机技术、通信技术和电视技术的一门综合技术。
ITV和VOD的应用是视频信息技术领域的一场革命,具有巨大的潜在市场,在VOD应用技术的支持和推动下,以在线视频、在线音乐、网上直播为主要项目的网上休闲娱乐、新闻传播等服务得到了迅猛发展,各大电视台、广播媒体和娱乐业公司纷纷推出其网上节目,受到了越来越多用户的青睐。
5.虚拟现实技术(VR)
虚拟现实技术的发展是在模式识别、全息图像、自然语言理解(语音识别与合成)和新的传感技术(手写输入、数据手套、电子气味合成器)等基础上,利用人的多种感觉通道和动作通道(如语音、书写、表情、姿势、视线、动作和嗅觉等),通过数据手套跟踪手语信息,提取面部特征合成面部动作和表情,以并行方式与计算机系统进行交互,实现三维虚拟现实。
6.数字图书馆
数字图书馆是将有价值的文本、语言、影像、影视、软件和科学数据等信息进行采集,组织规范性的加工和压缩处理,进行高质量保存和管理,并提供在网上高速横向跨库连接的电子存取服务。数字图书馆所涉及的数据类型有文本、图像、语音、视频等,数据存储容量庞大,需要大规模的数据库来存储和处理。
7.数字监控
数字监控系统由视频采集、视频传输、控制中心等组成,支持有线、无线多种传输介质,集视频切换、智能控制、远程传输、布防报警等功能于一身。数字监控以数字视频处理技术为核心,结合网络技术、数字媒体技术,克服了模拟监控的缺点。数字媒体技术应用于远程数字监控是安防领域的巨大突破,能有效克服其他传输方式存在的局限性,提供高质量音频和视频,用户不必等信息传输完毕即可实时、连续播放。
5.1.4 数字媒体产品的开发
随着数字媒体技术的迅猛发展,数字媒体的创作也蒸蒸日上,丰富多彩的数字媒体作品几乎每天都在上市,其中动感的影像、美妙的音乐、精致的图像等总是令人耳目一新。
数字媒体作品是由多种应用领域的专家和开发人员利用数字媒体编程语言或数字媒体创作工具编制的最终软件产品,主要包括教学软件、培训软件、电子图书、演示系统、游戏等。
数字媒体作品实质上是一种特殊的计算机应用产品,因此,计算机应用系统的开发与设计的基本思想、方法与原则,也同样适合于数字媒体应用系统的开发与设计。但是,与一般计算机软件应用系统不同之处是数字媒体作品更加强调人性化和视听美,需要开发者具备多方面的知识和能力,也有自己独特的工程化设计特点,既需要创意,更强调表现方法的运用。
1. 数字媒体的开发原则
(1)采用非线性超文本结构
超链接技术是一种按信息之间关系非线性地存储、组织、管理和浏览信息的计算机技术,超文本是用超链接的方法,将各种不同空间的文字信息组织在一起的成网状结构文本。网状结构是由节点和表达节点之间关系的链组成的网络,用户可以沿着链对网络节点中的数据进行浏览、查询和注释等操作。随着计算机技术的发展,网络节点中的数据不仅是文字,还可以是图形、图像、声音、动画和视频等媒体,这就形成了超媒体的概念。
超文本结构类似于人类的联想记忆结构,它采用非线性的网状结构,各信息块很容易按照人们的“联想”关系加以组织。采用超文本结构创作数字媒体作品时,创作人员可以将相关素材规划成不同层次、不同关系的单元,再利用不同的编辑工具生成图、文、声、像等各种媒体素材,最后利用创作工具生成节点并用链来连接形成信息网络。用户可以用不同的方式对信息网络进行浏览和查询。采用非线性超文本结构可以高效地表达、管理和使用数字媒体信息,是应用数字媒体的有效途径。
(2)选择合适的创作工具
创作工具软件是指能够对文本、图形、图像、视频、动画、声音等数字媒体信息进行集成处理、统一管理并制作生成数字媒体作品的编辑工具。
数字媒体创作工具为创作人员提供了一个有效控制图、文、声、像等各种媒体的综合环境,创作人员可以利用这个环境进行创建、编辑、采集和输出各种媒体素材,并且把它们整合成一个交互性好、图文声并茂的数字媒体作品。这类软件具有表现能力强,使用效果好的特点。
创作工具软件可分为四类:①以页为基础的创作工具(如PowerPoint、Iebook电子杂志等);②以图标和流程图为基础的创作工具(如思维导图);③以时间为基础的创作工具(如Director、Flash等);④以程序语言为基础的创作工具(如Visual Basic、Visual C++等)。
一个合适的数字媒体创作工具,可以使高质量的数字媒体作品创作变得相对简单,将作品创作人员从复杂的工作中解脱出来,致力于数字媒体作品脚本的创作,以提高数字媒体作品的层次水平。选择创作工具时,应主要考虑以下四个方面:
①编辑环境。这是创作人员导入、编辑、合成和预览作品的工作平台,选择创作工具软件应考虑它对各种媒体信息的控制能力。
②剧本语言。它可以帮助作者控制各种媒体数据的播放,实现超文本链接功能。
③应用连接。创作工具软件在当前运行状态下,应能够激活其他的应用软件编辑有关媒体素材,编辑完毕后再返回创作工具软件中来,以此弥补创作工具软件自身的不足。
④使用素材。创作工具软件的特长在于对媒体或数据的编辑整合功能,在制作高质量的媒体素材方面不如专用工具软件,所以创作工具软件一般使用专用工具软件加工制作好的数字媒体素材。
(3)开发友好的人机交互界面
数字媒体作品能推广普及并取得良好的使用效果,在很大程度上取决于作品的人机交互界面是否友好,使用是否简单方便。一个高质量的数字媒体作品,从用户使用的角度考虑,应该是一个典型的“傻瓜”系统,不需要专门学习其操作方法,就能灵活自如地运用。系统应为用户提供“导航”,在屏幕上显示有关操作的提示信息,详细地告诉用户执行下步操作需要做什么,在任何时候都能为用户提供简单明了的帮助信息,避免因作品本身使用上的困难给用户造成操作上的负担,导致作品应用效果降低。
2. 数字媒体的创作流程
计算机软件的设计与开发遵循“需求分析——设计——编码——测试——发布”的一般过程,数字媒体作品的创作流程与此类似,同时又与影视作品的创作程序相似,许多术语(如脚本、编号、剪接、发行等)都是直接从影视传媒行业借鉴过来使用。
一般而言,数字媒体作品的创作流程包括以下步骤:
(1)策划选题。这是创作数字媒体作品的第一阶段,也是产品生命周期的一个重要阶段。本阶段的任务就是对整个作品进行定位,明确使用范围和制作内容,形成框架,制订计划。作品的内容往往来源于某种想法或应用需求,所以本阶段的重要工作是需求分析,对想法和需求进行评估,确定用户对作品的设计目标和具体要求,
数字媒体作品的开发是一个系统工程,涉及多学科知识,需要组织众多不同领域的专家合作完成。如何组织团队以及人员的分工和项目的管理等都是重要的策划内容。
(2)编写脚本。根据用户对数字媒体作品的需求,组织相关开发人员对项目进行讨论,研究整体框架和风格,然后编写出相应的脚本文件。
(3)整理素材。根据脚本文件的内容,进行相关素材的前期准备工作。例如:拍摄图片和视频、录制声音、制作字幕和片花、编写对白文本等等。
(4)后期制作。选择适宜的创作工具来完成数字媒体作品的编辑、加工与合成工作。
(5)调试发布。在发布作品之前需要进行测试工作,查看作品中是否存在缺陷。作品测试全部成功后进行打包并发布。
5.2 数字媒体技术应用
图形、图像、音频、视频、动画等媒体形式的处理和显示是数字媒体技术应用领域的重要方向,如欣赏照片、录制声音、拍摄视频等。当代文化越来越重要的特征就是技术与想象力的结合,处理和创造图像与视音频改变了人们之间展示信息、交流思想和抒发情感的方式。
本节学习的任务:了解数字媒体中色彩、电视制式等基本知识;视音频的数字化和采集;了解数字媒体技术的应用领域;了解数字媒体产品的开发过程;了解动画制作的基础知识。
5.2.1 图形图像处理
图形图像处理是对图形图像做各种变换,如放大、缩小、旋转、倾斜、镜像、透视等,也可进行复制、去除斑点、修补、修饰图像的残损,还可以对图像的颜色进行明暗、色偏的调整和校正。
在图形图像处理时,创建、复制完美的色彩是非常重要的。计算机处理色彩的原理与生活中调配颜色略有不同。
1. 色彩的三要素
人们在日常生活中看到的各种各样的色彩依赖于三个条件:光线、人眼和被观察的物体,三者缺一不可。比如看到一朵红花,这是因为太阳光照射到花朵上,光线中的红色光被反射到人眼中,而其他颜色的光则被花朵吸收了。这时如果三个条件中的任何一个发生变化,如光线变为蓝色,那么所看到的结果就不同了。自然界中的颜色有千万种之多,比如一片树林就具有非常多深浅不同的绿色,如何去描述它呢?
为了研究色彩,1931年国际照明委员会(CIE)对色彩的描述进行了规定。根据CIE的规定,任何一种色彩都具有三个要素:色相、纯度、明度。实际上这种描述方式是基于人对色彩的感觉而定的。
(1)色相(Hue)。色相指色彩的名称,是色彩最重要、最基本的特征,如黄色、红色。
(2)纯度(Saturation)。也称饱和度,纯度用于描述色彩的鲜浊程度。它取决于一种颜色的单一程度,色彩的纯度越高,色彩越鲜艳。
(3)明度(Brightness)。也称亮度,明度用于描述色彩的明暗程度。色彩的明度越高,人眼感觉越亮。在无彩色中,明度最高的颜色为白色,明度最低的颜色为黑色;在有彩色中,黄色为明度最高的颜色,紫色是明度最低的颜色。
2. 色彩空间
在色彩学中,人们建立了多种色彩模型,以一维、二维、三维甚至四维空间坐标来表示某一色彩,这种坐标系统所能定义的色彩范围即称为色域、色彩空间或颜色空间。常用的色彩空间主要有RGB、CMYK、Lab等。
现代科学证明,红、绿、蓝三种色光可以混合得到人眼所能看到的绝大多数色彩,因此将红(Red)、绿(Green)、蓝(Blue)称为色光三原色。它们按照不同的比例混合将得到不同的色彩,电视机、计算机显示器都是用这种原理生成色彩的。人们将由色光组成的色彩总和称为RGB色域。
人们在印刷实践中发现,大多数的色彩可以由青色、品红、黄色三种颜色的油墨(颜料)混合印刷得到,因此将青色(Cyan)、品红(Magenta)、黄色(Yellow)称为色料三原色。但是在实际的印刷中,青色、品红、黄色等量混合无法得到纯黑色,因此又加入了黑色(Black)。人们将由这四种色料混合所表现的色彩总和称为CMYK色域。
在自然界中存在着千万种色彩,人类的视觉可以感知到绝大多数色彩。Lab色域是一种与设备无关的颜色系统,也是一种基于人的生理特性的颜色系统。在Lab色域中,一种颜色由L(亮度)、a颜色、b颜色三种参数表征。L表示照度(Luminosity),相当于亮度,L取值为0~100(纯黑~纯白)。a表示从红色至绿色的范围,取值为+127~-128(洋红~绿)。b表示从黄色至蓝色的范围,取值为+127~-128(黄--蓝)、正为暖色,负为冷色。
RGB色域和CMYK色域都只能表示Lab色域的一部分色彩,为了更充分地表现自然界中所有的色彩,CIE规定了直接色彩空间,它是自然界可见光的颜色。它们之间关系如下图所示。
自然界中所有的颜色组成了最大的色域,该色域中包含了人眼所能见到的所有颜色。从图中可以看到,最外面马蹄形色域是直接色彩空间,再往里是Lab色域,其次是RGB色域,最小的是CMYK色域,RGB与CMYK两个色域既有相同部分又有不同部分,它们都包含在Lab色域内。在RGB、CMYK和Lab色域中编辑图像,其本质的不同是在不同的色域中工作。
图5-2 色域关系图
3. 色彩模式
色彩模式(又称颜色模式)是指将某种颜色表示为数字形式的模型,或者说是一种记录和表示颜色的方式。前面所说的色域是指所有根据某种色彩模式所表现的颜色的总和,而色彩模式是色域的表示方式。
在计算机图像处理中,不同的色彩模式会影响图像的质量。常用的色彩模式有:位图色彩模式(Bitmap)、灰度色彩模式(Grayscale)、RGB色彩模式、CMYK色彩模式、Lab色彩模式、HSB色彩模式等。在计算机图形图像处理软件中,不同的色彩模式之间可以进行转换,但是在转换中可能会出现色彩损失。比如,RGB模式与CMYK模式转换,两个色域重叠区域之外的颜色将会丢失。所以在实际图像处理中一定要谨慎操作,避免随意进行模式转换。
以下是常用的几种色彩模式:
(1)RGB色彩模式
RGB色彩模式是一种基于色光的颜色模式。它广泛用于日常的生活中,如电视机、计算机显示屏、幻灯片等都是利用色光来呈色。RGB色彩模式是一种加色法模式。
RGB色彩模式定义颜色时R、G、B三种成分的取值范围是0~255,可以组合出1670万(256×256×256)种颜色,几乎包括了人类视力所能感知的所有颜色,所以称为真彩色。0表示没有刺激量,255表示刺激量达最大值。RGB(255,0,0)表示红色;RGB(0,255,0)表示绿色;RGB(0,0,255)表示蓝色;R、G、B均为255时就合成了白色,即RGB(255,255,255)表示白色;R、G、B均为0时就形成了黑色,即RGB(0,0,0)表示黑色。在计算机显示器屏幕、彩色电视机、彩色监控器、手机屏幕上、数码相机屏幕显示颜色或进行颜色定义时,都采用这种模式。
(2)CMYK色彩模式
CMYK色彩模式是一种应用在印刷工业和打印机领域的色彩模式。对从事印刷业的人员来说,CMYK是最熟悉不过了。它是一种减色法模式,遵循减色法混合规律。
CMYK色彩模式实质指的是再现颜色时印刷的C、M、Y、K的数值,范围为0~100%。C的植:0 M:0 Y: 0 K0%表示白色,C100% M100% Y100% K100%表示黑色。
(3)Lab色彩模式
Lab色彩模式是接近人类视觉的色彩空间的表示方式,它是基于人对颜色感觉的一种模式。Lab中的数值描述正常视力的人能够看到的所有颜色。因为Lab描述的是颜色的显示方式,与设备(如显示器、打印机或数码相机)无关。
从色域关系图中可以看出,Lab色彩模式是颜色范围非常广的一种色彩模式,其颜色范围包含了RGB色域和CMYK色域的所有颜色。如把其他色彩模式的图像转换为Lab色彩模式的图像时不会因色彩损失而失真,因此在RGB色彩模式与CMYK色彩模式之间转换时,都要用到Lab色彩模式作为中介。
(4)HSB色彩模式
HSB色彩模式即色相、纯度、明度模式。它采用颜色的三属性来表色,即将色彩的三要素进行了量化。纯度和明度是以百分比值表示的,色相是以角度表示的,H从0~360度取值。在色彩轮上,纯红色定义为0度,位于色轮相当于时钟3点的位置上,黄色位于从纯红色算起逆时针60度的地方,绿色位于从纯红色算起逆时针120度的地方;纯度S用0~100%的百分数表示,0%表示灰色,100%表示完全饱和;明度B用0~100%(由白到黑)的百分数表示。
不同色彩模式所能表现的色彩范围是不同的,当一副图片以位图色彩模式显示时,图像中每一个像素所表现的颜色为两种,即黑、白,因此位图即黑白图;灰度色彩模式图的每一个像素所能表达的色彩则为2,它比位图模式能表现出图像更多的明暗层次;RGB模式可以用色彩表现更加丰富的层次感,颜色数达到1670万。CMYK色彩模式的颜色总数理论上可以达到1亿,但由于CMYK色彩模式是通过控制青、洋红、黄、黑四色油墨在纸张上的相叠印刷来产生色彩的,它的颜色范围小于RGB色彩模式,另外不能输出亮丽鲜艳的颜色,颜色饱满度不如RGB色彩模式。
在实际的图像处理中,必须根据图像的实际情况来选择色彩模式。在制作黑白图案画效果时可以选择位图色彩模式;当制作类似于具有阶调的黑白图像时,就要选择灰度色彩模式;而当图像准备用于彩色屏幕显示时,就要采用RGB色彩模式;如果图像将用于打印输出或印刷输出时就必须使用CMYK色彩模式。
5.2.2 视音频处理
1. 视音频的数字化
1.模拟信号和数字信号
(1)模拟信号。模拟信号是指在时间和幅度上都是连续的信号,其信号的幅度、频率或相位随时间连续变化。模拟信号如下图5-3所示。
(2)数字信号。数字信号是指在时间和幅度上都是离散的信号,其特点是幅度值被限制在有限的数值之内。数字信号如下图5-4所示。
图5-3 模拟信号 图5-4 数字信号
计算机不能直接处理模拟信号,因此,要计算机能对声音进行处理,必须先将模拟信号转化为数字信号,即声音信号的数字化。
2.声音信号的数字化
(1)声音信号的数字化过程。声音信号的数字化需要三个步骤:采样、量化和编码。采样是指用每隔一定时间的信号样值序列来代替原来在时间上连续的信号,也就是在时间上将模拟信号离散化。量化是用有限个幅度值近似原来连续变化的幅度值,把模拟信号的连续幅度变为有限数量的有一定间隔的离散值。编码则是按照一定的规律,把量化后的值用二进制数字表示,转换数字信号,最终形成二进制编码的声音文件。声音信号的数字化如下图5-5和图5-6所示。
图5-5 声音的采样和量化
图5-6 声音的数字化过程
(2)数字音频技术指标
①采样频率。采样频率是指一秒钟采样的次数,采样频率值越大,声音保真度越好。采样频率应不低于声音信号最高频率的两倍。人耳能听到声音的频率范围大约为20Hz~20kHz。在数字音频处理过程中,采样频率通常有三种:11.025 kHz(话音效果)、22.05 kHz(音乐效果)、44.1 kHz (高保真效果)。通常CD唱片采样频率为44.1 kHZ。
②量化位数。量化位数也叫采样精度或采样位数,是对模拟音频信号和幅度轴进行数字化所采用的数据位数,决定了数字音频的动态范围。量化位数越多,音效也就越好,一般有8位、16位和32位等。
③声道数。声道数一般有单声道、双声道(立体声)、多声道等。双声道又称为立体声,使用两条信号线路,音效好,真实感强,但立体声数字化后所占空间比单声道多1倍。多声道有杜比环绕声AC-3系统、数码声场重建系统(三维立体声系统)等。
(3)音频文件大小的计算
音频文件大小(B)=采样频率(Hz)×采样位数(位)×声道数×时间/8
例如,以16位采样位数、双声道抓取一张60分钟的CD唱片保存为WAV波形文件时,所需要的存储空间为:44.1K Hz×16位×2声道×3600秒/8 /1024=620MB。
3. 视频信号的数字化
视频数字化就是将模拟视频信号经过视频采集卡转换成数字视频文件保存在存储设备中。在使用时,将数字视频文件从存储设备中读出,再还原成为电视图像加以输出。视频数字化的概念是出现在模拟视频占主角的时代,现在通过数字摄像机摄录的信号本身已是数字信号,只需要从数字摄像机中转存到计算机硬盘中。视频信号的采集需要很大的存储空间和数据传输速度,需要在采集和播放过程中对图像进行压缩和解压缩处理。
数字视频的来源很多,有来自于摄像机、录像机、影碟机等视频源的信号,包括从家用级到专业级、广播级的多种素材,还有计算机软件生成的图形、图像和动画等。高质量的原始素材是获得高质量最终视频产品的基础。视频信号数字化首先需要提供模拟视频输出的设备,如录像机、电视机、电视卡等;然后是可以对模拟视频信号进行采集、量化和编码的设备,这一般都由专门的视频采集卡来完成;最后,由计算机接收和记录编码后的数字视频数据。在这一过程中起主要作用的是视频采集卡,它不仅提供接口以连接模拟视频设备和计算机,而且具有把模拟信号转换成数字数据的功能。
2. 视音频素材的采集
视音频是数字媒体素材资源中最具有表现力的媒体,也是最难获取和处理的媒体。传统的电视、电影、录像、CD唱片等都是视音频,但是它们是模拟信号,而计算机中使用的是数字信号,即数字视音频,模拟信号转化成数字信号需要通过采集。
1.声卡
声音媒体是较早引入计算机系统的数字媒体信息之一,从早期的利用PC机内置喇叭发声,发展到网络电话,声音一直是重要的媒体信息。在数字媒体作品中使用数字化声音是数字媒体技术应用中最基本、最常用的技术。
数字媒体计算机上都装有声卡,声卡具有对信号滤波、放大及采样保持、模/数(A/D)和数/模(D/A)转换等功能。将话筒输入声卡的输入插孔,利用声卡进行A/D转换,可实现对声音信号的采集,因此话筒、声卡配合相应软件可以搭建简单的声音信号采集系统。声卡与外部设备连接如下图5-7所示。
声卡的功能主要有:①音乐合成发音功能;②混音功能和数字声音处理功能;③模拟声音信号和数字音频信号转换(A/D、D/A转换)功能。声卡性能主要由最高采样频率和量化位数来衡量。根据量化位数,声卡可分为8位、16位、32位、64位和128位声卡等。
图5-7 声卡与外部设备连接示意图
2.电视制式
由于世界各国在开办彩色电视广播时,都要考虑到与黑白电视兼容的问题,彩色电视制式是在满足黑白电视技术标准的前提下研制的。
(1)NTSC制。NTSC制又称恩制,是美国国家电视制定委员会制定的彩色电视广播标准。美国、加拿大、日本、韩国、菲律宾等国家和我国台湾地区采用的是这种制式。NTSC制的优点是电视接收机电路简单,缺点是容易产生偏色。NTSC制电视的供电频率为60Hz,场频为每秒60场,帧频为每秒30帧,扫描线为525行,图像信号带宽为6.2MHz。
(2)PAL制。PAL制又称为帕尔制。由前联邦德国在综合NTSC制的技术成就基础上研制出来的一种改进方案。PAL制对相位失真不敏感,图像色彩误差较小,与黑白电视的兼容也好,但PAL制的编码器和解码器都比NTSC制的复杂,信号处理也较麻烦,接收机的造价也高。PAL制电视的供电频率为50Hz,场频为每秒50场,帧频为每秒25帧,扫描线为625行,图像信号带宽分别为4.2、5.5、5.6MHz等。采用PAL制的国家较多,如中国大陆、德国、新加坡、澳大利亚等。
3.采集卡
视频采集卡又称视频捕捉卡,对于视频素材的采集主要借助视频采集卡,视频采集卡性能的好坏直接影响视频的采集质量。
视频采集卡根据视频信号源和采集卡的接口可分为两大类,即模拟采集卡和数字采集卡。模拟采集卡视频信号源主要来自模拟摄像机、电视信号、模拟录像机等。数字采集卡通过IEEE1394数字接口,以数字对数字的形式,将数字视频信号无损地采集到计算机中,其视频信号源主要来自DV(数码摄像机)及其它一些数字化设备。使用数字采集卡,在采集过程中视频信号没有损失,可以保证得到与原始视频源一样的效果,而使用模拟采集卡得到的视频信号会有一定程度的损失。
视频采集卡有多种外部接口,可以直接连接录像机、摄像机等输入设备将信号输入到计算机。对于具备视频输出接口的采集卡,可以直接外接电视机或监视器等输出设备来观察压缩后的视频效果。
4.摄像机
数码摄像机简称DV,其基本工作原理就是光—电—数字信号的转变与传输。即通过感光元件将光信号转变成电信号,再将模拟的电信号转变成数字信号。当前,数码摄像机是最常用的视频源。
摄像机质量档级分类:
(1) 广播级摄像机:广播级摄像机一般用于电视台和节目制作中心,其质量要求较高,如清晰度700-800线,信噪比60分贝(dB)以上,从镜头到摄像器件,使用的电子材料等都是优等的。
(2) 业务级摄像机:业务级摄像机常用于电化教育、工业监视等系统中,其性能指标也比较优良,价格相对于广播级较低。
(3) 家用级摄像机:这个档级的摄像机种类繁多,主要特点是体积小,重量轻,功能多,使用操作简便,价格低廉。其质量等级比不上广播级或业务级,多为单片CCD摄录一体机。
5.2.3 动画制作
动画是数字媒体六种表现形式之一,与视频有很大的区别,一般来说视频是基于拍摄的媒体表现形式,是动态的图像,而动画是基于绘制的媒体表现,是动态的图形。另外,由于数字媒体技术后期合成与特效制作的发展,出现了动画与视频的交叉,即视频中可以有动画,动画中可以有视频,总之,动画是数字媒体技术的重要领域,在影视行业的地位与视频一致。
动画的发明可以追溯到19世纪20年代,英国人通过旋转轮子的狭缝观看到世界上第一部动画。事实上,要观看到动画并不是一件难事,例如快速翻阅连环画或者卡通画册,就能够看到活动的图像。动画采用夸张、拟人的手法将许许多多可爱的卡通形象搬上了银幕,它能够实现地客观不存在的或者无法人为实现的事物和现象。随着科学技术的发展,特别是计算机技术的飞速发展,动画的制作也进入了崭新的时代,动画场景越来真实,画面质量越来越精美,它在影视作品创作、广告设计、辅助教学、模拟仿真和工业设计等领域得到了广泛的应用。
动画是基于人的视觉原理在一定时间内连续播放一系列相关的静止画面让人产生运动错觉的动态图形。动画播放的每一幅画面称为一帧,由于人眼的视觉暂留特性,当这些画面以一定的速率播放时就形成了运动的视觉效果。
每秒钟播放的帧数称为帧速率(帧频),帧速率的单位为fps。只有达到一定的帧速率,才能形成动画效果。一般地,帧速率达到每秒10帧以上就会有运动感,帧速率太低会产生画面的抖动感,影响观看的效果。帧速率达到每秒15帧以上,播放画面就会比较平滑流畅。
计算机制作动画分为二维动画和三维动画。
(1) 二维动画
计算机二维动画是对传统手工动画的一个改进,可以实现对图像进行拷贝、粘贴、放大、缩小、任意移动等方便快捷的操作,还可以通过编程实现对画面元素运动变化的控制。由于二维动画中相邻帧之间的变化很小,这为二维动画的压缩存储创造了条件,使得二维动画文件容量一般都比较小,非常适合在网络上使用。目前,二维动画的文件输出形式主要有GIF动画、Flash动画以及HTML5动画等。
(2) 三维动画
计算机三维动画是对三维真实世界的模拟及再创造,它属于计算机生成动画。一般来说,制作一个专业级的作品至少要经过造型、动画和绘图三个步骤。三维动画需要计算机首先构造出角色、实物和景物的三维几何模型;其次设计运动方式,使各种造型运动起来,例如沿路径移动、旋转、变形、变色等等;最后,为几何模型表面赋予颜色和纹理,打上灯光,通过渲染输出生成了具有真实立体感的的三维画面。
制作三维动画需要大量时间,通常将任务进行项目化管理,组织团队分工协助完成。
思考与训练
一、选择题
1. 以下关于色彩模式的叙述中,正确的是。
A.RGB色彩模式的图像非常逼真,常用于屏幕显示图像和印刷图像的处理。
B. Lab色彩模式是颜色范围广泛的一种图像色彩模式,常用于不同色彩模式之间的转换。
C.位图色彩模式下只有黑和白两种颜色,制作黑白照片的效果可在此模式下进行操作。
D.不同色彩模式间可以相互转换,在转换中不会发生损失色彩的现象。
2. 色料三原色是指。
A.红、黄、蓝 B.红、绿、蓝 C.黑、白、灰 D.青、品红、黄
3. 关于RGB、CMYK、Lab三种色彩模式下的色域关系,正确的是。
A.RGB>CMYK>Lab B.Lab>RGB>CMYK C.CMYK>RGB>Lab D.Lab>CMYK>RGB
4. 在数字音频信息获取过程中,那种顺序是正确的。
A.采样、量化、压缩、存储 B.采样、压缩、量化、存储
C.采样、量化、存储、压缩 D.量化、采样、压缩、存储
5. 声卡是按分类的。
A.采样频率 B.存储速度 C.采样量化位数 D.压缩方式
6. 以下不属于数字音频技术指标的是。
A.采样频率 B.量化位数 C.声道数 D.时间
7. 我国的电视制式同于欧洲国家为PAL制,其帧频为。
A.每秒10帧 B.每秒15帧 C.每秒25帧 D.每秒30帧
8. 下列采样的波形声音质量最好的是。
A. 单声道、8位量化、22.05kHz采样频率
B. 双声道、8位量化、44.1kHz采样频率
C. 单声道、16位量化、22.05kHz采样频率
D. 双声道、16位量化、44.1kHz采样频率
9. 数字音频采样和量化过程中所用的主要硬件是。
A. 媒体播放器 B. 数字解码器
C. A/D(模/数)转换器 D. D/A(数/模)转换器
10. 某同学把一个WAV格式的文件a.wav转化为c.mp3格式,再把这个mp3文件转化回为wav格式的文件b.wav。a.wav、c.mp3、b.wav采样频率,采样位数,声道数,时间长度都一样,则。
A a.wav的音质跟b.wav的音质一样,文件大小相同
B a.wav的音质跟b.wav的音质一样,文件大小不一样
C a.wav的音质比b.wav的音质好,文件大小相同
D.a.wav的音质比b.wav的音质差,文件大小不相同
11. 某同学录制了10秒的一段wav音频文件,文件属性如下图所示,存储该音频文件需要的磁盘空间约为。
A. 0.84M B. 1.68M C. 13.46M D. 0.17M
12. 以下说法错误的是。
A. 声音的振幅越大,声音的容量就越大
B. 声音文件的存储容量大小与声音的采样频率有关
C. 声音文件的存储容量大小与声音的采样位数有关
D. CD音乐可由MP3格式的音乐录制而成
二、填空题
1.色光的三原色是指:、、。
2. 计算机中的彩色图像往往采用红(R)、绿(G)、蓝(B)三原色模式来表示,它们可以调出很多颜色,如:白色表示为RGB(255,255,255)、黑色表示为RGB(0,0,0),某同学通过研究发现黄色由红色和绿色混合而成,那么用RGB表示黄色的组合应该是。
3. 作为模拟信号的声音必须转换成,才能被计算机存储和加工处理。
4. 人耳所能听到声音的频率范围大约为—。
5. 常用的CD唱片所能用的采样频率为kHz。
6. 声卡的性能主要由和来衡量。
7. 声音信号的数字化需要三个步骤,即、、。
8. 在音频数字化时,根据人耳听到的不同声音的频率范围,使用不同的采样频率。语音的采样频率为,普通音乐的采样频率为,高保真音乐的采样频率为。
9. 量化位数决定模拟信号数字化以的动态范围。量化位数越(高或低),信号的动态范围越大,数字化后的音频信号就越可能接近原始信号,但所需要的存贮空间也越(大或小)。
10. 数码摄像机简称DV,其工作的基本原理就是——的转变与传输。
11. 世界上主要使用的电视广播制式有和。
三、简答题
1.如果采样频率为44.1kHz,量化位数为16位,双声道,录音10分钟的数据量是多少MB?
2.数字音频技术指标有哪些?
3.简述声卡的功能?
5.3 常见的数字媒体软件及文件类型
数字媒体素材与作品以文件的形式保存在电脑存储器中,在播放的时候需要相应的数字媒体软件打开文件。
本节任务是了解常用数字的媒体软件,理解常见数字媒体文件的存储类型。
5.3.1 常用数字媒体技术应用软件
1. ACDSee
加拿大ACD Systems公司研发的ACDSee是目前最流行的数字图像浏览与管理软件,广泛应用于图像的获取、整理、查看、修正以及分享。使用 ACDSee,可以从数码相机和扫描仪高效地获取图片,并进行便捷的查找、组织和预览。ACDSee软件以快速浏览图像、操作简便著称。随着软件版本的不断提升,ACDSee软件已经不再局限于简单的图像查看功能,一些常用的图像加工技术开始出现在高版本ACDSee中,如调整图像大小、裁剪图像、添加效果等。ACDSee 除了能够快速、高质量显示图像文件,还配有内置的音频播放器,可以制作和播放精彩的幻灯片,还能播放常见的视频文件。
2. Photoshop
Adobe Photoshop是由Adobe公司推出的图像处理软件,使用该软件就像利用画笔和颜料在纸上绘画一样,不但可以直接绘制出漂亮的作品,还可以对数码相机或扫描仪获取的图像进行编辑和再创作,然后打印输出。Photoshop功能非常强大,操作也非常灵活,在广告设计和艺术创作中得到了广泛的应用。Photoshop的推出,不但让设计师可以迅速地实现自己的创意,还可以创造出只有用计算机才能表现的设计内容,为设计师提供了更多的表现手法和制作技巧。
3. CorelDraw
CorelDRAW Graphics Suite是一款由世界顶尖软件公司之一的加拿大Corel公司开发的矢量图形制作工具软件,其非凡的设计能力广泛地应用于商标设计、标志制作、模型绘制、插图描画、排版及分色输出等诸多领域,用于商业设计和美术设计的PC电脑上几乎都安装了CorelDRAW。
4. Illustrator
Adobe Illustrator是全世界最出色的矢量图形绘制软件之一,几乎所有的大型图表、LOGO、海报、图书插图等都可以用它来制作。Illustrator拥有绘画功能,可以为图表添加渐变、美术字等效果,所以Illustrator制作的图表美观大方,深受数字媒体技术应用行业的欢迎
5. 录音机
“录音机”是微软Windows操作系统所带的可以录制和播放声音文件的小程序。数字媒体计算机利用声卡和“录音机”软件可以方便采集到音频素材。
6. Windows Media Player
Windows Media Player是Windows操作系统自带的数字媒体播放软件,也称为媒体播放器,它的主要功能是播放音频和视频,另外,它还具有音频翻录功能。
在计算机中,信息是以文件的形式保存在储存设备上的。而在CD光盘中,声音是以音轨的形式记录在光盘里,不能直接通过复制粘贴的方式获取CD光盘中的声音。将CD光盘中的音乐、歌曲等声音以音频文件格式保存到计算机中,也是采集音频素材的过程。Windows Media Player可以从CD采集音频素材,在Windows Media Player中称为翻录。
7.Realplayer
RealPlayer由Real NetWorks公司推出,是一款在Internet上通过流技术实现音视频实时传输、在线收听的工具软件。使用它不必等到完全下载音频或视频文件才能播放,只要有足够的带宽,就能完全实现网络在线播放,很方便在网上查找和收听、收看自己感兴趣的广播、视频及电视节目。
8.Winamp
Winamp由Nullsoft公司开发,是数字媒体播放的先驱,一直伴随着MP3的流行而发展,是大众化并广泛普及的MP3播放器。
9.暴风影音
暴风影音是暴风网际公司推出的一款国产视频播放器,该播放器兼容大多数的视频和音频格式,具有格式转换、片断截取及视频压缩等功能,是目前国内最受用户欢迎的数字媒体播放器之一。
10. GoldWave
GoldWave是一款功能强大的数字音乐编辑器,它集合音频文件制作、编辑、美化、裁剪于一身,具有多普勒、动态、回声、扩展器、倒转、机械化、混响、立体声、降噪等功能,通过该软件可以制作所需要的声音素材。
11. Windows Movie Maker软件
Windows Movie Maker 是一款面向家庭用户的视频制作软件,可以通过摄像机或其他视频源将音频和视频捕获到计算机上,也可以将现有的音频、视频或静止图片合成到视频中。通过 Windows Movie Maker软件,可以完成视频素材的采集、编辑、合成及输出。
12. Ulead GIF Animator
GIF Animator是一款Ulead(台湾友立)公司发布的一个GIF动画制作工具软件,它的原理是将许多幅不同的图片做为帧,不停地轮流显示,从而产生运动效果。Ulead GIF Animator内部含有许多现成的特效可以立即套用,还可以将AVI文件转成GIF动画文件。GIF是Ulead Gif Animator软件默认的文件格式,占用空间比较小,适合在网页中应用。
13. Flash软件
Flash是基于矢量图形标准实现动画制作的软件,Flash动画采用了“流式”的播放形式,用户不用等到动画文件完全下载,可以边下载边浏览动画。Flash文档的默认文件格式为FLA,导出的动画文件格式为SWF。由于文件文件体积小、功能强、交互能力好、可以实现无极放大和缩小、支持多个层和时间线程等特点,广泛应用于网页设计和动画制作等领域,普及程序很高,在Internet上动画文件中SWF格式占有很高的比例,客户端浏览器安装Flash播放插件即可播放。
14. 3D Studio MAX(3DSMAX)
3D Studio MAX是Autodesk公司旗下的面向个人和制作公司的三维动画制作软件。它是目前世界上应用最为广泛的三维建模、动画、渲染软件,完全满足制作高质量动画、游戏、设计等领域的需要,已经在建筑、广告、影视、游戏等众多领域得到了广泛的应用。3D Studio MAX的三维场景的默认文件格式为MAX格式,动画文件可以是AVI等格式。
15. Maya
Maya是Alias/Wavefront公司推出的3D动画制作软件,该软件已成为当前电脑动画设计与制作行业所关注的焦点之一。艺术大师们使用Maya制作出了很多影片中的特技、特效和扣人心弦的动画,例如《阿凡达》、《指环王》、《泰坦尼克》、《星球大战》、《最终幻想》、《骇客帝国》等等。这些影片中的很多场景和角色是使用Maya制作出来的,同时它在视频游戏和科学模拟等方面也有广泛的应用。
16. Premiere软件
Adobe公司推出的Premiere软件,是一款编辑画面质量好,有较好的兼容性,且可以与Adobe公司推出的其他软件相互协作,具有强大影视后期处理能力的视音频编辑软件。
17. After Effects软件
Adobe公司推出的After Effects软件一款视频处理软件,能够制作影视中常见的文字特效、粒子特效、光效、仿真特效、调色技法以及其它高级特效,适用于从事视频特技制作和数字媒体作品开发的机构,包括电视台、动画制作公司、个人后期制作工作室以及多媒体工作室。
After Effects与Premiere是两个关联的数字媒体后期制作软件,可以通过Adobe动态链接联动工作,满足复杂的视频制作需求。Premiere是一款视音频编辑软件,用于视频段落的剪辑,提供基本的特效与调色功能。After Effects以动态图形设计和特效合成为主要功能,比Premiere结构更宏大,操作更复杂,同时功能更强大,主要应用于影视包装和视觉特效领域。
5.3.2 数字媒体文件类型
数字媒体文件包括文档文件、图形图像文件、动画文件、音频文件、视频文件等,常见的数字媒体文件格式如下表格5-2所示。
表5-2 常见的数字媒体文件格式
类别 | 文件格式 |
文档文件 | txt、pdf、doc、wps等 |
图形图像文件 | bmp、jpg、gif(静态)等 |
动画文件 | gif(动态)、swf等 |
音频文件 | wav、mp3、mid等 |
视频文件 | avi、mpg、wmv、flv、rm、rmvb、asf等 |
1. 文档文件
文档文件是计算机系统中的电子档案文件,包括纯粹文字的文件、计算机办公的电子文件、电子图书等。
(1)TXT 格式
TXT格式是Windows操作系统中最基本的文本文件格式。一般的文字编辑软件都支持它,其中最简单的编辑软件是 Windows 操作系统自带的“记事本”编辑器。
(2)PDF 格式
PDF格式是一种在PostScript基础上发展而来的文件格式,它最大的优点是能独立于各种软件、硬件及操作系统,便于用户交换和浏览。PDF文件可以包含矢量图形、点阵图像和文本,并且可以插入超链接。PDF文件可以通过Adobe Acrobat Reader软件来阅读。PDF文件在桌面出版系统中,是跨平台交换最好的文件格式,可有效地解决跨平台交换文件时出现字体不对应问题。目前桌面出版领域的应用软件均可存储或输出PDF格式的文件。PDF文件格式是印刷品设计制作过程中应用最普遍的文件格式。2009年中国国家标准化管理委员会批准PDF为正式的国家标准,于2009年9月1日起正式实施。
2. 图形图像文件
(1)BMP文件。BMP文件是一种位图文件。它是一种与设备无关、格式最原始和最通用的静态图像文件。BMP文件一般作为原始素材图像资源,所以文件没有经过压缩处理,共存储量较大。BMP格式有1位(单色)、4位(16色)、8位(256色)和24(真彩色)。Windows中画图软件默认的文件格式就是BMP文件。
(2)JPG文件。JPG文件是采用JPEG静态图像压缩标准压缩的图像文件。JPEG图像文件质量较好,压缩比较高,其存储量较小,非常适合网上传输和浏览,在网页中很多图片采用JPG格式。由于JPG图像文件采用有损压缩,以牺牲图像中的一些信息为代价换取较高的压缩比,一般不适合用于存储原始图像素材。
(3)GIF文件。GIF格式文件全称是图形交换格式文件,是一种压缩的8位(256色)图像文件。GIF文件压缩比更高,其存储量更小,非常适合网络传输与浏览,在网页上很多对色彩要求不高的图形图像都使用GIF格式文件。GIF文件的不足之处是颜色数最多只有256种,不能用于存储真彩色图像,共图像质量比JPG格式文件差。一个GIF文件还可以由多个图形图像组成,在显示输出时根据设定的时间按照顺序循环播放,从而构成一种最简单的动画,这种GIF文件称为动态GIF文件,是动画文件的一种。目前网页上很多动画采用GIF格式文件。
(4)PNG文件。PNG格式文件全称是可移植网络图形格式文件。PNG文件是替代GIF的一种新的图像文件,它增加了一些GIF文件格式所不具备的特性,突破了GIF文件256色的限制。PNG用来存储灰度图像时,灰度图像的深度可多到16位;存储彩色图像时,彩色图像的深度可达到48位,并且还可存储多达16位的α通道数据,即PNG格式文件位数可以达到64位。PNG压缩比高,生成文件容量小。
(5)PSD文件。PSD是Photoshop Document的缩写,作为一种图像格式,PSD是Adobe公司的图像处理软件Photoshop的专用格式。这种格式可以存储Photoshop中所有的图层,通道、参考线、注解和颜色模式等信息。在保存图像时,若图像中包含有图层,则一般都用PSD格式文件保存。PSD格式在保存时会将文件压缩,以减少占用磁盘空间,但PSD格式所包含图像数据信息较多(如图层、通道、剪辑路径、参考线等),因此比其他格式的图像文件还是要大得多。
3. 音频文件
数字音频是数字化的声音,保存在磁盘上的文件称为音频文件。
(1)WAV文件。WAV文件是Microsoft公司开发的标准数字音频文件,称为波形文件。WAV文件来源于对声音模拟波形的采样而未经压缩的文件。WAV文件的特点是声音的还原性好、表现力强,支持的播放器多、文件存储容量大。
(2)MP3文件。MP3文件全称是MPEG Audio Layer 3。它是根据MPEG-1视频压缩标准中,对立体声伴音进行三层压缩的方法所得到的第三层数字音频文件。MPEG-1音频分三层,分别为MPEG-1 Layer1,MPEG-Layer2以及MPEG-Layer3,并且高层兼容低层,其中第三层协议简称为MP3,目前已经成为广泛流传的音频压缩技术。MP3音频文件的压缩是一种有损压缩,并具有很高的压缩率,标准的MP3的压缩比是10:1。一个三分钟长的音乐文件压缩成MP3后大约是4MB,而且对于大多数用户来说重放的音质没有明显的下降,适合于因特网上进行下载或实时播放。
(3)RA文件。RealAudio是Real Networks公司开发的一种音频文件格式,主要用于在低速率的广域网上实时传输音频信息。网络连接速率不同,客户端所获得的RA音频质量也不同。对于14.4Kb/s的网络连接,可获得调频(AM)质量的音质;对于28.8 Kb/s的网络连接,可以达到广播级的声音质量;如果拥有ISDN或更快的线路连接,则可获得CD 音质的声音。
(4)MID/MIDI 文件。MIDI是乐器数字接口的英文缩写,是数字音乐/电子合成乐器的统一国际标准,它定义了计算机音乐程序、合成器及其它电子设备交换音乐信号的方式,还规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议,可用于为不同乐器创建数字声音,可以模拟大提琴、小提琴、钢琴等常见乐器。在MIDI文件中,只包含产生某种声音的指令,计算机将这些指令发送给声卡、声卡按照指令将声音合成出来,相对于声音文件,MIDI文件尺寸小得多。
4. 视频文件
(1)ASF文件。ASF是高级流格式(Advanced Streaming Format)的缩写,它是Microsoft公司推出的一种可以直接在网上实时观看的视频文件压缩格式,属于Windows Media流媒体系统。ASF数据的传输过程是先从服务器上下载一部分视频文件,形成视频流缓冲区后播放,同时继续下载,为接下来的播放做好准备,“边传边播”是该文件传输特点。ASF采用了MPEG4的压缩算法,兼顾压缩比和画面质量要求。
(2)WMV文件。WMV是微软推出的一种流媒体格式,它是在微软的ASF格式升级延伸来的。在同等视频质量下,WMV格式的体积更小,因此很适合在网上传输和在线播放。WMV文件一般同时包含视频和音频部分。视频部分使用Windows Media Video编码,音频部分使用Windows Media Audio编码。
(3)AVI文件。AVI是音频视频交错的英文缩写,可以把视频信号和音频信号同时保存在文件中,在播放时,音频和视频同步播放。AVI视频文件在使用上非常方便。例如在Windows环境中,Windows Media Player能够轻松地播放AVI视频图像;微软公司Office系列中的幻灯片软件PowerPoint,也可以调入和播放AVI文件;在网页中也很容易加入AVI文件;高级程序设计语言也可以定义、调用和播放AVI文件。
AVI采用的压缩算法并无统一的标准,用不同压缩算法生成的AVI文件,必须使用相应的解压缩算法解码器才能播放出来。
(4)MPG/MPEG文件。MPG文件是按MPEG标准压缩的视频文件,是基于MPEG-1(VCD)或MPEG-2(DVD)中的任一压缩标准出现的。可以通过Windows Media Player或者Real Player进行播放,当然暴风影音也是个更好的选择。MPG格式和AVI格式相比所占磁盘空间比小得多。
(5)RM文件。RM是Real Media的缩写,由Real Networks公司开发的流媒体格式文件。它可以是一个离散的单个文件,也可以是一个视频流,它在压缩方面做得非常出色,生成的文件非常小,它已成为网上直播的常用格式,并且这种技术已相当成熟。
(6)RMVB文件。RMVB文件也是Real Networks公司开发的一种可改变比特率的视频流媒体文件,可以用RealPlayer、暴风影音等软件播放。
影片的静止画面和运动画面对压缩采样率的要求不同,如果始终保持固定的比特率,会对影片质量造成浪费。RMVB格式在保证平均压缩比的基础上,设定了一般为平均采样率两倍的最大采样率值,将较高的比特率用于复杂的动态画面(如歌舞、飞车、战争等),而在静态画面中则灵活地转为较低的采样率。由于合理利用了比特率资源,RMVB格式在牺牲少部分用户察觉不到的影片质量情况下,最大限度地压缩了影片的大小,最终拥有了接近于DVD品质的视听效果。
(7)FLV文件。FLV文件是Flash Video的简称,FLV流媒体格式文件是随着Flash的广泛应用而发展起来的动画文件,文件存储容量小、加载速度快,使得网络观看视频文件成为可能,它的出现有效地解决了Flash文件因导入视频后发布的SWF文件体积庞大的问题,已成为当前在线网络视频文件的常见格式。
(8)MP4文件。MP4是一种使用MPEG-4的数字媒体文件格式,MPEG-4比MPEG-2更先进的一个特点,就是不再使用宏区块做影像分析,而是以影像上个体变化为记录,因此当影像变化快、码率不足时,也不会出现方块画面。MP4以储存数字音频和数字视频为主,广泛应用于网上传输、光盘存储、语音发送、视频电话以及电视广播。
思考与训练
一、选择题
1. 以下不属于图形图像处理软件的是。
A.Photoshop B.GoldWave C.ACDSee D.CorelDraw
2. 以下软件以矢量图形设计与制作为主要功能。
A.Photoshop B.Maya C.ACDSee D.CorelDraw
3. 以下不是视音频常用播放软件。
A.Windows Media Player B.Realplay
C.Microsoft office D.暴风影音
4. 下列属于音频文件格式的是。
A.GIF文件 B.WAV文件 C.AVI文件 D.JPG文件
5. 以下不是视频文件格式的是。
A.AVI B.WMV C.MP4 D.MP3
6. 吴婷用图像处理软件美化一个人头像时,将眼睛、眉毛、鼻子、嘴巴分别放在四个图层修改,为使下次能继续在四个图层中单独修改,她在保存作品时应该选择的文件格式为。
A.JPEG B.GIF C.PSD D.BMP
7. 存储一幅颜色非常丰富的图像文件,考虑到网络的传输速率,应采用图像文件格式作为Internet网上的图片存储格式。
A.BMP B.GIF C.JPG D.PSD
二、填空题
1. Premiere软件是一款视音频软件,具有对视音频进行加工处理、添加特效、合成等功能。
2.格式是最基本的文本文件格式。
3.格式是电子图书的主要文件格式,可以包含矢量图形、点阵图像和文本,是跨平台交换最好的文件格式,可有效地解决跨平台交换文件时出现字体不对应问题。
4.文件称为波形文件,是来源于对声音模拟波形的采样而未经压缩的文件。
5.是乐器数字接口的缩写,是数字音乐/电子合成乐器的统一国际标准。
6.在保存图像时,若图像中包含有图层,则一般都用格式保存。
三、简答题
1. 简述目前网络上最常用的图像格式有哪几种?为什么它们会被广泛应用于网络上?
2.分别写出常见的音频文件格式和视频文件格式。