第七章多媒体技术.ppt
大学计算机基础,第七章 多媒体技术,第七章 多媒体技术,本章主要介绍:多媒体计算机硬件与软件方面的基本概念与基础知识 计算机中音频、图像等信息的获取与处理 多媒体数据压缩原理与方法,7.1.1 多媒体计算机的概念,7.1 多媒体计算机技术概述,在计算机或通讯领域,媒体是指信息的载体或者信息的存储实体。信息载体包括数字、文字、声音、图形、图像、视频;信息的存储实体包括磁盘、光盘、U盘等。而就多媒体计算机而言,媒体就是存储和传递信息的载体,媒体也是表述信息的逻辑载体。,根据国际电信联盟的定义,媒体可分为5种:感觉媒体 表示媒体 显示媒体 存储媒体 传输媒体,7.1.1 多媒体计算机的概念,7.1 多媒体计算机技术概述,媒体分类:,2.为传送和表达感觉媒体而人为研究出来的媒体(如ASCII、图像、声音、视频编码等),1.人类通过感观直接感知的信息(文字、声音、图像等),3.输入和输出信息的媒体(如键盘、鼠标、显示器、打印机等),4.存储表示媒体的介质(软盘、硬盘、光盘等),5.传输的物理载体(光纤、电缆等),7.1 多媒体计算机技术概述,什么是多媒体?将文本、音频、视频、图形、图像、动画的综合统称为“多媒体”。“多媒体”并不是多种媒体的简单收集,而是多种媒体在计算机统一管理下的有机结合,优于多种媒体单独存在的效果,“1+12”,7.1 多媒体计算机技术概述,什么是多媒体计算机技术?计算机综合处理多种媒体信息(文本、图形、图像、音频、视频和动画),使多种信息建立逻辑连接,集成为一个系统且具有交互性。,简单来说:多媒体计算机=高性能PC机+光盘驱动器+声卡,1984年,Apple公司推出Machintosh图形操作系统。,1985年,世界上第一台多媒体计算机问世。,1986年,推出光盘系统。,1990年,多媒体个人计算机协会制定MPC1标准。,1995年,Windows95操作系统问世。,Apple计算机(1984),Commodore Amiga系统,7.1 多媒体计算机技术概述,7.1.2 多媒体技术的发展历史,7.1 多媒体计算机技术概述,多媒体特点是:(1)多样性:多媒体不只处理一种媒体,而必须是综合处理多种媒体,包括图文声像信息。(2)集成性:多媒体不是多种媒体简单的收集,而必须是被有机地集成为系统。(3)交互性:多种媒体系统可以实现人机互动,用户可以根据需要来使用系统。,7.1.3 多媒体技术的特点和关键技术,关键技术,包括:音频视频等数据的输入输出技术 多媒体数据的压缩编码和解码技术 音频视频数据的存储技术 虚拟现实技术,7.1.4 多媒体技术的发展和应用,7.1 多媒体计算机技术概述,7.1 多媒体计算机技术概述,7.1.5 未来多媒体技术的发展,(1)多媒体技术智能化 即把人工智能领域某些研究课题和多媒体计算机技术很好地结合。(2)多媒体信息实时处理和压缩编码算法芯片化 把多媒体信息实时处理和压缩编码算法直接放置到CPU芯片中,从而大大改善多媒体计算机的性能指标。(3)虚拟现实技术 是指运用多种技术综合形成一种模拟现实环境的人造环境,用户在该环境中通过五官和大脑的亲自体验和活动参与到该人造的、虚拟的环境中,可以与之交互。让你感觉到如同置身于真实世界一样。它是多媒体技术的最高境界。,7.1 多媒体计算机技术概述,7.1.5 未来多媒体技术的发展,未来,在上述发展的基础上多媒体技术将进一步向三电合一(电信、电脑、电器通过多媒体数字化技术相互渗透融合,如信息家电、移动办公等)、三网合一(因特网、通信网、电视网合为一体形成综合数字业务网)等方面发展。,7.2.1 多媒体计算机硬件系统,7.2 多媒体计算机系统,7.2 多媒体计算机系统,(1)基本硬件设备:光盘存储器 光盘存储器由光盘和光盘驱动器构成。光盘用于存储数据,光盘驱动器用于读写光盘中的数据。音频卡 音频卡又名“声卡”,主要用于处理声音,是多媒体计算机的基本配置。不过,目前许多计算机的主板上都集成了声卡的功能,声卡不再以单独形式存在。,7.5 音频卡的基本原理,7.2 多媒体计算机系统,声卡的基本工作原理,7.2 多媒体计算机系统,音频卡的作用主要有:进行A/D(模/数)转换将作为模拟量的自然声音经过变换,转化成数字化的声音,然后以文件形式保存在计算机中,可以利用声音处理软件对其进行加工和处理。完成D/A(数/模)转换把数字化的声音转换成作为模拟量的自然声音。转换后的声音输出到声音还原设备(例如耳机、有源音箱、音箱放大器等)中。输入、输出功能利用声卡的输入端子和输出端子,可以将模拟信号引入声卡,然后转换成数字量;还可以将数字信号转换成模拟信号送到输出端子,驱动音响设备发出声音。,音频卡的主要接口总线(Bus)线路输入(Line in)话筒输入(Mic in)线路输出(Line out)扬声器输出(Speaker Out)游戏棒/MIDI(Joystick/MIDI),7.2 多媒体计算机系统,声卡与外部设备的连接示意图,7.2 多媒体计算机系统,7.2 多媒体计算机系统,(2)扩展设备:具有代表性的扩展设备有:触摸屏、视频卡、扫描仪、数码相机、数字摄像机、各种彩色打印机、彩色投影仪等。,触摸屏:属于输入设备,可通过手指直接在屏幕上指点及触及屏幕上的菜单、光标、接钮等。,系统主要由传感器、控制部件、驱动程序组成。,当用手指或其它设备触摸安装在计算机显示器前面的触摸屏时,所摸到的位置以坐标形式被触摸屏控制器检测到,并通过接口送到CPU,从而确定用户所输入的信息。,电缆,7.2 多媒体计算机系统,扫描仪工作原理:把原件面朝下放在扫描仪的玻璃台上,扫描仪内发出光照射原件,反射光线经光学镜面导向后,照射到CCD的光敏器件上。来自CCD的电量送到模数转换器中,电压转换成代表每个像素色调或颜色的数字值。步进电机驱动扫描头沿平台作微增量运动,每移动一步,即获得一行像素值。,7.2 多媒体计算机系统,扫描仪:是一种图形输入设备。配合适当的应用软件后,扫描仪还可以进行中、英文智能识别。,数码照相机 数码照相机是一种数字成像设备。数码相机采用CCD作为记录图像的光敏介质,CCD实际上是一块布满光敏元件即电荷耦合器的感光板,CCD是通过光照的不同引起的电荷分布的不同来记录被摄入的物体。它将光信号转换成电信号,然后电信号再转换成数字信号并进行编码、压缩等处理,最后把得到的压缩数字图像保存在存储器中。,7.2 多媒体计算机系统,CCD元件,数码相机的工作原理:用数码相机拍照时,进入照相机镜头的光线聚焦在CCD上。当照相机判定已经聚集了足够的电荷时,就“读出”在CCD单元中的电荷,并传送到模数转器中,把每一个模拟电压转换成二进制数字信息。从模数转换器输出的数据传送到数字信号理器中进行编码、压缩后存储在照相机的存储中。,7.2 多媒体计算机系统,7.2 多媒体计算机系统,1.光信号转换成电信号,2.电信号再转换成数字信号,3.编码、压缩等处理,4.保存压缩数字图像,数码摄像机 数码摄像机是将图像信号和音频信号进行模数转换压缩处理后再将这两路信号送给磁头完成记录的存储。存储介质主要有四种:DV带;DVD可擦写光盘;微型硬盘;大容量存储卡。目前,数码摄像机普遍趋于采用大容量存储卡做存储介质。,7.2 多媒体计算机系统,7.2 多媒体计算机系统,电子白板 交互式电子白板:与计算机相连,利用投影机将PC内容投影到大屏幕的白板上,并且可以利用定位笔在白板上交互式操作,比如对文件编辑、注释和保存,也可以运行应用程序,完成键鼠的任何操作。,视频卡:是一种专门用于对视频信号进行实时处理的设备。视频卡插在主机板的扩展槽内,可以对视频信号进行数字化转换、编辑和处理,以及保存数字化文件。,通常使用的视频采集卡可以接收来自视频输入端的模拟视频信号(录像机、电视机、LD影碟机等),对该信号进行数字化处理,然后压缩编码成数字视频。大多数视频卡都具备硬件压缩的功能。此外,还有一种比较流行的视频采集卡,我们称之为IEEE1394数字视频采集卡。它主要的作用是将DV视频数据从数码摄像机传送到电脑的硬盘中,和模拟采集不同,它在传送数据的过程中没有任何质量损失。,7.2 多媒体计算机系统,数字视频采集卡,7.2 多媒体计算机系统,数码摄像头 数码摄像头成像原理跟数码相机没有本质的区别,一般采用USB接口,不需要专门的硬件卡。,投影仪 投影仪是一种数字化设备,主要用于计算机信息的显示。常见的投影仪主要有LCD(液晶)投影仪、DLP(数字光处理)投影仪。,1.多媒体设备驱动程序,用于在启动操作系统时把设备的状态、型号、工作模式等信息提供给操作系统,并驻留在内存储器,供系统调用。2.多媒体产品制作软件,主要包括图像、视频、音频的编辑制作。3.多媒体平台软件,用于多媒体素材的组合。4.工具软件,用于加工和处理数据,如压缩、加密等。5.应用软件包括,Windows系统提供的多媒体软件、动画播放软件、声音播放软件、光盘刻录软件等。,7.2 多媒体计算机系统,7.2.2 多媒体计算机软件系统,上层,底层,7.2 多媒体计算机系统,7.2.2 多媒体计算机软件系统,用于在启动操作系统时把设备的状态、型号、工作模式等信息提供给操作系统,并驻留在内存中供系统调用。,媒体制作软件:主要包括图像、视频、音频的编辑制作。媒体平台软件:用于多媒体素材的组合。工具软件:用于加工和处理数据,如压缩、加密等。,应用软件。包括Windows系统提供的多媒体软件、动画播放软件、声音播放软件、光盘刻录软件等。,7.2 多媒体计算机系统,7.2.2 多媒体计算机软件系统,书上P192的图7.9,声音的两个重要特性:,振幅波的高低幅度,表示声音的强弱,用分贝dB表示频率每秒钟振动的次数,以Hz为单位(周期两个相邻波之间的时间长度)频率和周期互为倒数关系,7.3.1 数字音频基本概念,7.3 音频信息的获取和处理,7.3.1 数字音频基本概念,7.3 音频信息的获取和处理,声音是机械振动。振动越强,声音越大,话筒把机械振动转换成电信号,模拟音频技术中是以模拟电压的幅度表示声音强弱。,7.3 音频信息的获取和处理,按照带宽可将声音质量分为4级:数字激光唱盘CD-DA。属于音质的最高等级。调频无线电广播,简称FM质量。音质其次。调幅无线电广播,简称AM质量。音质较差。电话质量。话音带宽加上一定的保护带,音质最低等级。,7.3.1 数字音频基本概念,7.3 音频信息的获取和处理,模拟音频信号:声音波形在时间和幅度上都是连续的。一般用不同的电压表示。模拟音频信息是个连续的量,不能由计算机直接处理,必须将其数字化处理。,数字音频信号:把表示声音强弱的模拟电压用数字表示。计算机只能处理时间和幅度都离散的二进制数字信号。,7.3.2 音频信息的数字化,7.3 音频信息的获取和处理,数字音频信号是由模拟声音经采样、量化和编码得来的。其信号在时间和幅度上都用离散的数字序列表示。,7.3 音频信息的获取和处理,其过程是每隔一个时间间隔在模拟声音的波形上取一个幅度值,把时间上的连续信号变成时间上的离散信号。采样频率是指计算机每秒钟采集多少个声音样本。,(1)采样 时间上的离散,7.3 音频信息的获取和处理,提高采样频率,单位时间所得到的振幅值就会更多,对于原声音曲线的模拟就越精确。,采样频率声音信号最高频率 2,奈奎斯特(Nyquist)采样定理:,什么是“声音信号最高频率”?,7.3 音频信息的获取和处理,当今主流声卡的采样频率一般可分为22.05KHz、44.1KHz、48KHz三个等级。8KHz只能得到电话的声音品质,22.05KHz能达到FM广播的声音品质,44.1KHz则是理论上的CD音质界限,48KHz则更加精确一些。如果采用更高的采样频率,还可以做出DVD的音质。,不同的应用需求对声音有不同的采样率,像是以Net Meeting之类的应用就不要使用高的采样率,否则在传递这些声音数据时会是一件十分痛苦的事。,7.3 音频信息的获取和处理,量化的过程是将采样后的信号按整个声波的幅度划分成有限个区段(量化间距),然后把落入某个间距内的值归为一类,并赋予相同的量化值。,(2)量化 幅度上的离散,7.3 音频信息的获取和处理,量化的精度越高,越能反映音量的不同。如果每个声音样本用8位表示,就能表示256种不同的幅度值;每个声音样本用16位表示,就能表示65536种不同的幅度值。,书上P195 图7.13,7.3 音频信息的获取和处理,采样频率越高,声音效果也越好;量化位数越高,音幅也就越精确,自然声效也越好。但是,得到的数字音频信号的数据量也越大。,7.3 音频信息的获取和处理,失真在采样过程中是不可避免的,如何减少失真呢?可以直观地看出,当我们采用更高的采样频率,增加量化精度,就可以减少失真的程度。但由此得到的数字音频信号数据量也就越大。,7.3 音频信息的获取和处理,由于经采样和量化后的音频信号数据量很大,所以一般要先对数字化的音频信息进行压缩和编码后在计算机内传输和存储。在播放这些声音时,需要经解码器将二进制编码恢复成原来的声音信号播放。,(3)编码,常用音频编码有:脉冲编码调制(PCM,无压缩)、自适应差分脉冲编码调制(ADPCM,有损压缩)、MPEG Layer3(MP3,有损压缩)。,7.3 音频信息的获取和处理,(1)WAV文件格式:Microsoft公司的波形音频文件格式。来源于对声音模拟波形采样,量化、编码。这种文件最大的缺点是占用存储空间大。适用领域:音频原始素材保存。该格式是通用音频格式。,7.3.3 数字音频文件格式,未压缩的波形音频文件WAV和CD音频光盘的存储容量计算如下:存储量=采样频率采样量化位数声道数时间/8,举例:采样频率为44.1KHz,采样数据量化位数(或称采样精度)为16位、双声道,一张60分钟的CD唱片所占存储容量为:44.110001626060/8=635040000(B)606(M),7.3 音频信息的获取和处理,(2)MP3文件格式:采用1:101:20压缩率制作的数字音频文件。必须经过解压缩才能播放,数据量小。,(3)RA文件格式:最早的因特网流媒体音频,音质相对较差。特点是可在低的带宽下在网上实时播放。,(4)WMA文件格式:因特网流媒体音频,用于在互联网上播放的压缩音频文件。质量优于RA。,(5)MID文件格式:多媒体计算机产生声音的特殊方式,记录有限乐器的音序组合。是一种通过电子乐器弹奏,数字化合成的音频文件,占用空间很小。,7.3 音频信息的获取和处理,(6)APE文件格式:是一种音频无损压缩格式,APE文件大小可压缩到传统无损格式 WAV 文件的一半;而在音质上超越一般的 MP3,达到和 CD 相同的音质。,(7)AIF文件格式:Apple计算机的波形音频文件格式。,另外,还有一种音频文件cda,指的是CD音轨。这只是一个索引信息,不包含真正的声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。,7.3 音频信息的获取和处理,(1)数字声音的获取:录制、分离视频中的声音、网上下载数字声音的编辑:音频编辑软件:Windows附件中的“录音机”,Cool Edit等。这些软件可以用来录音、声音的编辑处理、特殊效果、文件格式转换功能等。,7.3.4 数字音频的采集和编辑,7.4.1 图像与图形的区别,7.4 图像信息的获取和处理,图像由像点构成,是组成图像最基本的元素,每个像点用若干个二进制位进行描述。图像通常用于表现自然景观、人物、动物、植物和一切引起人类视觉感受的事物。,也称“位图”位图占据存储空间大 缩放时会模糊和产生锯齿现象 一般图像要数据压缩,7.4.1 图像与图形的区别,7.4 图像信息的获取和处理,图形指经过计算机运算而形成的抽象化结果,由具有方向和长度的矢量线段构成。图形使用坐标、运算关系以及颜色数据进行描述,因此把图形叫做“矢量图”。由于图形无须保存每个像素的颜色值,而仅仅保存一些数学参数,因而数据量小。图形常用于表现直线、曲线、复杂运算曲线以及由各种线段围成的图形,不适于描述色彩丰富、复杂的自然影像。放大和缩小图形时,也是根据参数的缩放重新描绘图形,不会像位图那样产生锯齿现象。,7.4.1 图像与图形的区别,7.4 图像信息的获取和处理,原位图,原矢量图,扩大五倍的位图,扩大五倍的矢量图,7.4.2 颜色的基本概念,7.4 图像信息的获取和处理,(1)颜色的基本描述,7.4.2 颜色的基本概念,7.4 图像信息的获取和处理,(1)颜色的基本描述彩色可用亮度、色调和饱和度来描述,人眼看到任意彩色光都是这三个特性的综合效果。亮度是光作用于人眼时所引起的明亮程度的感觉;色调是反映的是颜色的种类;饱和度是指颜色的纯度,饱和度越深颜色越鲜明。,7.3 图像信息的获取和处理,自然界常见的各种彩色光都可以由红(R)、绿(G)、蓝(B)三种颜色光按不同比例相配而成。同样,绝大多数颜色也可以分解成红、绿、蓝三种色光,这就是色彩学中最基本的原理三基色原理。,RGB相加混色原理:把三种基色光按不同比例相加,称之为相加混色。对于发出的光,可有红、绿、蓝三个主要光波,当以不同比例结合时便产生一个完整的光谱,包含所有的色彩。,7.3 图像信息的获取和处理,(2)颜色模型,RGB色彩模型:由红、绿、蓝3种颜色光按不同比例相配而成。主要用于计算机显示。,CMY色彩模型三基色是青、品红和黄,简称为CMY。适用于彩色印刷或彩色打印。,颜色通常用三个独立的属性来描述,三个独立的变量综合就构成了一个空间坐标。颜色模型可分为两大类:基色颜色模型(RGB、CMY等)和色亮分离颜色模型(YUV、HSL等)。,7.3 图像信息的获取和处理,YUV和YIQ色彩模型:彩色电视系统中常采用的颜色空间表示,其中Y表示亮度信号,UV表示色差信号。美国、日本采用YIQ彩色系统,Y仍为亮度信号,IQ表示色差信号。,HSL色彩模型:H表示色调,S表示颜色的饱和度,L表示光的强度。,PAL彩色电视制式中采用YUV模型来表示彩色图像,7.4.3 图像信息的数字化,7.4 图像信息的获取和处理,(1)采样:图像采样就是将二维空间上模拟的连续亮度或彩色信息转化为一系列有限的离散数值来表示。具体的做法就是对图像在水平方向和垂直方向上等间隔地分割成矩形网状结构,每个矩形网格称为像素点。像素总数就是图像的分辨率。,7.4 图像信息的获取和处理,(2)量化:量化是对采样的每个离散点的像素的灰度或颜色样本进行数字化,是将采样值划分成各种等级,用一定位数的二进制数来表示采样的值。量化位数越大,则越能真实地反映原有图像的颜色。但得到的数字图像的容量也越大。在量化时表示量化的色彩值(或灰度值)所需的二进制位数称为量化字长。一般可用8位、16位、24位或更高的量化字长来表示图像的颜色。,7.4 图像信息的获取和处理,(3)编码:图像编码是按一定的规则,将量化后的数据用二进制数据存储在文件中。,7.4 图像信息的获取和处理,(1)图像分辨率 图像由像点构成,数字图像水平和垂直方向的像素点数,用点的“列数行数”表示。像点的密度决定了分辨率的高低。分辨率的单位是为每英寸显示的像点数。,7.4.4 图像的属性,扫描分辩率:采样时,每英寸长度取得的像素点数,反映了数字图像对原连续图像的分辩能力。,打印分辩率:如果将图像打印在纸上,单位尺寸上打印的点数反映图像的分辩能力。,屏幕分辨率:以显示器的水平和垂直像素表示。,7.4 图像信息的获取和处理,7.4.4 图像的属性,(2)颜色数量和颜色深度 颜色深度是指在某一颜色系统中每个颜色所使用的二进制位数,而颜色数量是指该颜色系统中共有多少种颜色。,7.4 图像信息的获取和处理,32级灰度,16级灰度,8级灰度,4级灰度,2级灰度,32级灰度,16级灰度,32级灰度,16级灰度,7.4 图像信息的获取和处理,颜色深度为24位的图像(1677万种颜色),颜色深度为8位的图像(256种颜色),7.4 图像信息的获取和处理,24位位图,256色位图,16色位图,单色位图,7.4 图像信息的获取和处理,两个概念:(1)真彩色(2)索引色,7.4 图像信息的获取和处理,当某个图像的颜色深度达到或高于24bit时,其颜色数量已经足够多,且图像的色彩和表现力非常强,基本上还原了自然影像,习惯上把这种图像叫做“真彩色图像”。真彩色的每个像素的颜色由RGB基色分量的数值直接决定。每个基色分量占一个字节,共有3个字节即24bit,可生成的颜色数为224=16777216,即1600万种颜色。而32位真彩色是用其中的24位描述颜色部分,另外8位记录256级灰度,用以加强真彩色的质量。,7.4 图像信息的获取和处理,真彩色模式使用超过1600万种颜色,而许多应用程序不需要如此大的颜色范围。索引色模式仅使用其中一小部分。索引色模式中,每个应用程序从大的色彩集中选择一些颜色(通常256种)并对其建立索引。如书P205的图7.25所示。,7.3 图像信息的获取和处理,对于同一幅数字图像,采用不同的文件格式保存时,其图像数据量、色彩数量和表现力会有不同。,7.4.5 数字图像的文件格式与数据量,(1)图像文件的格式,7.3 图像信息的获取和处理,7.4.5 数字图像的文件格式与数据量,(1)图像文件的格式,动画GIF格式:Boy_run.gif,静态GIF格式:Boy.gif,JPEG压缩的图像文件一般的扩展名是:*.jpeg、*.jfif、*.jpg、*.JPG、或是*.JPE。,最初的GIF只是简单地用来存储单幅静止图像(称为GIF87a),后来可以同时存储若干幅静止图象进而形成连续的动画(称为GIF89a)。,7.3 图像信息的获取和处理,图像文件数据量的单位是字节,数据量大是图像文件的显著特点,即使采用数据压缩算法进行处理,其数据量也是非常可观的。一幅未经压缩的数字图像的数据量大小计算如下:图像数据量大小=像素总数图像颜色深度8 例如:一幅 640480,256 色图像为 64048088=307200(字节),(2)图像文件的数据量,像素点个数,256=28个不同的色彩,用 8位表示,位转换为字节,7.4.6 图像信息的获取方法,7.4 图像信息的获取和处理,扫描样张,光电转换器,数字信号输出,(1)使用数码相机拍照,利用数码相机或者数码摄像机直接拍摄自然影像,中间环节少,是最简单的获取图像的手段。,(2)使用扫描仪扫描,在扫描图像时,应根据图像的使用场合,选择合适的扫描分辨率进行。分辨率的数值越大,图像的细节部分月清晰,但是图像的数据量会越大。,(3)使用现成图像,可以从正式出版的图片库光盘上获得或从互联网络上获得。,(4)使用图像处理软件来绘制,7.5.1 动画的概念和发展历史,7.5 动画与视频信息,扫描样张,光电转换器,数字信号输出,动画由多幅画面组成,当画面快速连续地播放时,由于人类眼睛存在“视觉滞留效应”而产生动感。所谓“视觉滞留效应”是指当被观察的物体消失后,物体仍在大脑视觉神经中停留短暂的时间。人类的视觉滞留时间约为1/24s。换言之,如果每秒快速更换24个画面或更多的画面,那么,前一个画面在脑海中消失之前,下一个画面已经映入眼帘,大脑感受的影像是连续的。,7.5.2 电脑动画,7.5 动画与视频信息,扫描样张,光电转换器,数字信号输出,电脑动画有两大类,一类是帧动画,另一类是矢量动画。帧动画以帧作为动画构成的基本单位,很多帧组成一部动画片。帧动画借鉴传统动画的概念,一帧对应一个画面,每帧的内容不同。当连续演播时,形成动画视觉效果。矢量动画是经过电脑计算而生成的动画,其画面只有一帧,主要表现变化的图形、线条、文字和图案。矢量动画通常采用编程方式和某些矢量动画制作软件来完成。,7.5.3 制作动画的设备和软件,7.5 动画与视频信息,扫描样张,光电转换器,数字信号输出,制作动画需要一台多媒体电脑,性能指标没有特殊要求,应尽可能采用高速CPU,足够大的内存容量,以及大量的硬盘空间。动画制作软件具备大量用于绘制动画的编辑工具和效果工具,还有用于自动生成动画、产生运动模式的自动动画功能。Flash网页动画软件。3D Studio Max三维造型和动画软件。,7.5.4 视频处理,7.5 动画与视频信息,扫描样张,光电转换器,数字信号输出,视频和动画没有本质的区别,只是二者的表现内容和使用场合有所不同。视频来自于数字摄像机、数字化的模拟摄像资料、视频素材库等,常用于表现真实场景。动画则借助于编程或动画制作软件生成一系列景物画面。对于数字化的视频信息,则需要专门的工具软件进行编辑和处理。视频信息具有实时性强、数据量大、对计算机的处理能力要求高等特点。常用的视频编辑软件:Premiere视频编辑软件。绘声绘影视频编辑软件。,7.5.4 动画和视频信息常见的文件格式,7.5 动画与视频信息,扫描样张,光电转换器,数字信号输出,(1)GIF格式 用于网页的帧动画文件格式。GIF格式由两种类型,一种是固定画面的图像文件,256色,分辨率固定为96dpi;另一种是多画面动画文件,同样采用256色,96dpi。(2)SWF格式 使用Flash软件制作的动画文件格式。该格式的动画主要在网络上演播,特点是数据量小,动画流畅,但不能进行修改和加工。(3)AVI格式(标准)通用的视频文件格式。该视频格式兼容好、调用方便、图像质量好,但缺点是文件体积过于庞大。,7.5 动画与视频信息,扫描样张,光电转换器,数字信号输出,(4)DV AVI格式 数码AVI格式。它不同于传统AVI格式,目前非常流行的数码摄像机就是使用这种格式记录视频数据的。(5)DivX格式 采用DivX编码的AVI格式。它将DVD的视频部分通过特殊的DivX编码压缩处理成.avi格式文件。它可把DVD压缩为原来的10%,质量接近DVD光盘。(6)MPEG格式 用MPEG算法压缩得到的视频文件。VCD是用MPEG-1格式压缩的,DVD 则是用MPEG-2格式压缩的。(7)RM格式 视频流媒体技术始创者。图像质量较差。特别适合带宽较小的网络用户使用。,7.5 动画与视频信息,扫描样张,光电转换器,数字信号输出,(8)RMVB格式它是流媒体RM影片格式上的升级。RMVB在保证了影片整体的视听觉效果的前提下文件大小比DivX影片减少了将近45%。(9)ASF格式微软开发的流格式视频文件。是可以直接在网上观看视频节目的文件压缩格式。它的图像质量比VCD差一点,但比同是视频“流”格式的 RM 格式要好。特别适合在网页中插播。(10)WMV也是微软开发的一种可在网上实时播放流格式视频文件。效果好于ASF和RM格式的视频文件。,7.6.1 多媒体数据压缩概述,7.6 多媒体数据压缩,图像(30万像素,真彩色)(64048024)81024=900KB视频(PAL制式,每秒25帧)(90025)1024 22MB/s声音(采样频率44.1KHz,16位量化,双声道)(44.11000162)8 1024=172KB/s,数据压缩就是将庞大数据中的冗余信息去掉,保留相互独立的信息分量。,(1)多媒体数据压缩的必要性,7.6 多媒体数据压缩,什么是“数据冗余”?各种信号中携带的信息,存在许多与有用信息无关的数据,这就是数据冗余,包含:(1)相同或相似的信息的重复(2)实际应用中,接收者由于条件限制,导致一部分信息分量被过滤或屏蔽,(2)多媒体数据压缩的可能性,多媒体数据可以被压缩,是因为其中存在着冗余信息。,7.6 多媒体数据压缩,1.空间冗余图像中的某个区域相邻像素的颜色信息相同,则该相邻像素在数字化图像中就表现为空间冗余。,2.时间冗余在一个图像序列的两幅相邻图像中,后一幅图像与前一幅图像之间有着较大的相关。,(2)多媒体数据压缩的可能性,多媒体数据可以被压缩,是因为其中存在着冗余信息。,7.6 多媒体数据压缩,.结构冗余 有些图像的纹理区,图像的像素值存在着明显的分布模式。于是,已知分布模式,可以通过某一过程生成图像。,.知识冗余 有些图像的理解与某些基础知识有相当大的相关性。例如,人脸的图像有固定的结构。,5.视觉冗余 是指人的视觉分辩率要低于实际图像而产生的冗余。例如,人的视觉对灰度的分辩率为26,而一般图像量化采用的灰度等级为28。,7.6 多媒体数据压缩,(1)无损压缩:采用可逆的编码方法,数据可完全恢复,无偏差和失真;(2)有损压缩:不能完全恢复,但听觉或视觉的效果一般可被接受。,(3)多媒体数据压缩的分类,7.6 多媒体数据压缩,多媒体数据压缩的主要方法可分为统计编码、预测编码、变换编码等。(1)统计编码 统计编码的理论基础是信息论。数据压缩的理论极限是信息熵。在信息论中,信息熵是对信息量的度量。实践表明,一个事件的信息量多少,与该事件发生的概率有关。一个小概率事件发生,信息量就多。反之,一个大概率事件的出现,信息量就少。根据香农信息论,只要信源(即要压缩的对象)不是等概率分布,就存在着数据压缩的可能性。,7.6.2 多媒体数据压缩的主要方法(仅了解),7.6 多媒体数据压缩,(2)预测编码 利用以往的数据样本数据,对下一个新的样本值进行预测,将预测所得的值与实际值相减得到一个差值,对差值进行编码。由于差值小,可减小编码的码位。,7.6.2 多媒体数据压缩的主要方法(仅了解),(3)变换编码 从信号的一种表示空间变换到信号的另一种表示空间,然后在变换后的域上对变换后的信号进行编码。,(1)JPEG标准,适合静态的彩色和灰度图像。一般对单色和彩色图像的压缩比通常分别为10:1和15:1。以JPEG方式压缩的文件扩展名为.JPG。,一副原始图像,经JPEG压缩10倍后的恢复图像,7.6.3 多媒体的主要压缩标准,JPEG2000,JPEG的升级版,其压缩率比JPEG高约30左右。,7.6 多媒体数据压缩,(2)MPEG标准,针对运动图像而设计压缩标准。目前已推出MPEG-1、MPEG-2、MPEG-4,MPEG-7等。,MPEG-1是一个通用标准。VCD采用MPEG-I压缩标准。,MPEG-2标准其全称为“运动图像及其伴音的编码”,该编码适合高清晰度电视(HDTV)所需要的视频及伴音信号。DVD采用MPEG-2标准。,MPEG-3标准现在已经被废弃了。,7.6 多媒体数据压缩,MPEG-4可利用很窄的带宽压缩和传输数据,以求用最少数据获得最佳图像质量。它的目的是用来做互联网视像传送、交互式视频游戏,实时可视通信。如电视电话,视频邮件和视频会议等。,MPEG-7是属于信息方面的检索和搜寻,本质上说就是我们常常在网上使用的搜索引擎,只不过它提供的是多媒体的信息查询服务。,(3)H.261视听通信编码,H.261是ITU为可视电话和电视会议制定的压缩标准。与MPEG不同的是它的目标是为了适应各种信道容量的数据传输,其主要缺点是图像质量较低。,7.6 多媒体数据压缩,第七章 计算思维案例,数据压缩技术,就是用最少的数码来表示信号的技术。数据压缩的发展就是创新思维的发展。人类不断通过创新性研究和总结出不同的数据压缩算法,并在计算机多媒体数据压缩过程中得以应用,是运用计算机科学的基础概念进行问题求解的一个典型的计算思维活动。对我们来说,计算机能越高效地表达信息越好。没人希望通过网络传送数据时总是耗费过久的时间,也没人希望计算机里总没有足够的空间来储存数据。减小数据占用空间的方法称为压缩。,案例1 数据压缩,第七章 计算思维案例,在储存信息之前压缩数据,需要使用的时候再将其解压缩,信息便能在网络中更快地传送了,而硬盘中也能储存更多数据。从网络上下载音乐、图片或视频的时候压缩尤其显得重要。为了满足上述要求,我们需要做两件事情:压缩数据以便缩小它的体积;然后解压缩以便人们正常阅读信息。通常这两道工序由计算机在后台自动完成。许多人绞尽脑汁想设法创新和改进各种压缩算法与编码。经常换个角度来思考问题,没准儿你我就能发明一种新的算法,就能在压缩技术发展史上扬名呢。,案例1 数据压缩,第七章 计算思维案例,在多媒体技术中,运动捕捉与三维动画设计就是一个典型的运用建模与仿真的计算思维方法。例如,采用运动捕捉技术对演员动作进行捕捉,演员动作不受限制,动作流畅,自然。这些动作都是非常具有特点的、非常敏锐的。一旦动作被捕捉,坐标就被映射到任意通过三维软件制作的卡通人物模型上。如果制作人员想改变以下所捕捉的动作,可以利用标准的动画工具如反应运动学、皮肤变形等对这个动作做进一步的编辑。制作人员也可以对动作增加各种变化,产生新的艺术效果。,案例2 建模和仿真,第七章 计算思维案例,例如,用三维扫描技术对一个八十岁的白发老人进行扫描,形成一个数字化人物模型,然后将篮球明星乔丹的动作捕捉下来,用这些动作或表情数据直接驱动老人模型的运动,观众将看到八十老人空中扣篮的场面。想像一下,如果我们用演员的表演来驱动动物的模型,专讲动物王国的故事又将是一个怎样的场面。,案例2 建模和仿真,第七章 计算思维案例,虚拟现实技术是利用计算机技术生成的一个逼真的具有视、听、触及嗅觉的感觉世界,在这个虚拟世界中,人们可直接观察周围世界及物体的内在变化,与其中的物体之间进行自然的交互,并能实时产生与真实世界相同的感觉,使人与计算机融为一体。这同样也可以看成是一个建模和仿真的问题。例如,带上特制的头盔,骑一辆自行车,从头盔显示器中远远看到天安门城楼,你骑车越过金水桥,穿过午门车速太快一下子破墙而入,冲进了金銮殿,当你摘下头盔,发觉自己仍然骑在自行车上,一步也没动。,案例3 虚拟现实,1从网络下载保存或自己数码相机拍摄的一幅JPG彩色图片,然后使用Windows的“画图”工具,将该图片分别保存为单色、16色、256色、24位色的位图。试比较这几幅图像质量及文件大小。2请用手机录制一段WAV格式的音频或直接从网络上下载一段WAV格式音频文件,然后选择一种音频格式转换软件,将该WAV音频文件按不同的压缩率分别转换成WMA、MP3格式。比较转换前后视频文件大小及播放效果。,思考和讨论题,1.用8位二进制可以表示的颜色数量为?那24位又能表示多少颜色?2.一幅256色位图,像素640480,存储这幅图像未经压缩需要多少个字节?3.两分钟双声道,16位量化位数,44.1kHz采样频率,这样一段声音不压缩的数据量多少?4.一段PAL制式(每秒25帧)的未经压缩视频,图像采用640480的分辨率和24位真彩色,若不考虑声音,一张650M的光盘能存储这样的视频图像多少分钟?,第七章 课后作业(第3次),1.用8位二进制可以表示的颜色数量为28=256。24位能表示2241677万种颜色。2.一幅256色位图,像素640480,存储这幅图像未经压缩需要字节:=640*480*8/(8*1024)=300KB3.两分钟双声道,16位量化位数,44.1kHz采样频率,这样一段声音不压缩的数据量为:44.1*1000*16*2*2*60/(8*1024*1024)20MB4.一段PAL制式(每秒25帧)的未经压缩视频,图像采用640480的分辨率和24位真彩色,若不考虑声音,一张650M的光盘能存储这样的视频图像多少分钟?每秒未经压缩的视频容量=640*480*24*25/(8*1024*1024)=21.97MB,一张650M光盘只能存29.6秒,即半分钟不到。,第七章 课后作业(第3次),