多媒体元数据研究.ppt

上传人：夺命阿水

文档编号：248077

上传时间：2023-03-23

格式：PPT

页数：42

大小：244KB

《多媒体元数据研究.ppt》由会员分享，可在线阅读，更多相关《多媒体元数据研究.ppt（42页珍藏版）》请在课桌文档上搜索。

1、多媒体元数据研究,1、多媒体资源Audio Visual MetadataECHO(European Chronicles On-line，欧洲编年史在线)MEPG-7MPEG-21VRA Core CategoriesEAD(编码文档描述),2、数字图像资源MOA(the Making of American)2 数字图像元数据CDL数字图像元数据Dig35NISO/CLIR/RLG的图像技术元数据,3、元数据编码与传输标准METSMetadata Encoding and Transmission Standardhttp:/www.loc.gov/standards/mets由数字图书馆

2、联盟(Digital Library Federation)发起研发，现由美国图书馆代表大会网络发展与MARC标准办公室负责维护目标：期望能针对数字图书馆对象的编码叙述、管理与元数据构建提供一个以XML为基础的框架内容涵盖四个方面：描述性元数据(Descriptive Metadata)管理性元数据(Administrative Metadata)文件群组(File Groups)结构地图(Structural Map)METS除可以作为对象间交换的标准外，还可以作为对象保存、访问、展示的编码机制,4、MPEG系列标准（1、2、4、7、21）MPEG是专门从事多媒体音、视频压缩技术标准制定的国

3、际组织，成员包括来自近30个国家、200多个公司的400多位专家。该组织自1988年以来，已经制定了一系列国际标准，其中MPEG-1、MPEG-2已为人们所熟知，它们为VCD、DVD及数字电视等产业的发展奠定了基础。目前正在制定的MPEG-4、MPEG-7和MPEG-21将为多媒体数据压缩和基于内容检索的数据库应用提供一个更为通用的平台，必将对下一代视、音频系统和网络应用产生深远的影响。,MPEG-1：存储和回放 MPEG-1制定于1993年，是针对1.5Mbps以下数据传输率的数字存储媒介运动图像及其伴音编码的国际标准，主要用于在CD-ROM上存储同步和彩色运动视频信号。MPEG-2：数字电

4、视 MPEG-2出台于1995年，它是针对HDTV和DVD等制定的3Mbps10Mbps的运动图像及其伴音的编码标准。它的出现使得基于CD-ROM的交互式电视和数字电视成为了可能。,MPEG-4：基于对象的存取 MPEG-4于1999年成为国际标准。它和MPEG-1和MPEG-2的重点在于编码效率上不同的是，MPEG-4的目标是提出一种新的方式来传输、访问和操作数字视听数据。MPEG-4计划为多种通讯规范提供一种普遍的技术解决方案，最终消除它们之间的差别。与MPEG-1和MPEG-2的另一点不同是，MPEG-1和MPEG-2是基于帧的规范，而MPEG-4则是基于对象的规范。,4.1 MPEG-

5、7：多媒体内容描述随着Internet的普及和网络带宽的增加，产生了大量的多媒体数据，如何在浩如烟海的信息中快速、容易地获得自己所需的内容则成为当前必须解决的问题。在此需求下，MPEG-7应运而出。MPEG-7力求能够快速且有效地搜索出用户所需的不同类型的多媒体信息。该标准主要致力于视听数据的信息编码表达，换句话说也就是集中在对多媒体材料描述的通用接口的标准化上。MPEG-7的功能与其他MPEG标准互为补充。MPEG-1、MPEG-2和MPEG-4是内容本身的表示，而MPEG-7是有关内容的信息，是比特的比特。,MPEG-7中的主要概念数据(Data)是用MPEG-7描述的视听资料，不考虑

6、它们的存储、编码、显示、传输、媒介或技术。该定义非常广泛，包含图形、静止图像、视频、影片、音乐、语音、声音、文本和其他相关的AV媒体。-特征(Feature)指数据的特性。特征本身不能比较，而要用有意义的特征表示(描述子)和它的实例(描述值)。如图像的颜色、语音的声调、音频的旋律等。-描述子(Descriptor，D)是特征的表示。它定义特征表示的句法和语义，可以赋予描述值。一个特征可能有多个描述子，如颜色特征可能的描述子有：颜色直方图、频率分量的平均值、运动的场描述、标题文本等。-描述值(Descriptor Value)是描述子的实例。描述值与描述模式结合，形成描述。-,描述模式(Desc

7、ription Scheme，DS)说明其成员之间的关系结构和语义。成员可以是描述子和描述模式。DS和D的区别是：D仅仅包含基本的数据类型，不引用其他D或DS。如对于影片，时间结构化为场景和镜头，在场景级包括一些文本描述子，在镜头级包含颜色、运动和一些音频描述子。-描述(Description)一个描述由一个描述模式(结构)和一组描述值组成。-编码的描述(Coded Description)是对已完成编码的描述，满足诸如压缩效率、差错恢复和随机存取的相关要求。-描述定义语言(Description Definition Language，DDL)是一种允许产生新的描述模式和描述子的语言，允许扩

8、展和修改现有的描述机制。-,为了更好地理解这些术语，请参看图1。图中解释了 MPEG-7在实际系统中的位置。圆角框表示处理工具，矩形框表示静态元素，阴影部分包含MPEG-7标准的规范元素：DDL提供建立描述模式的机制，然后将描述模式作为基础，产生一个描述。,MPEG-7的范围下图是MPEG-7处理链的一种高度抽象示意图，用于解释MPEG-7的范围。它包括特征抽取(分析)、描述本身和搜索引擎(应用)。,MPEG-7对视觉数据的描述 MPEG-7具体对视觉方面的描述子和描述模式有以下方面的要求:(1)特征类型-视觉描述允许以下特征(与查询中使用的信息类型有关)：颜色、视觉对象、纹理、轮廓(草图)

9、、形状、静止和动态图像、体积、空间关系(相对于图像和图像序列中的对象空间和拓扑关系，这个关系是空间合成关系)、运动(如视频镜头中的运动，用于利用时间合成信息来检索等方面)、变形(如对象的弯曲)、视觉对象的源和它的特性(如源对象、源事件、源属性、事件、事件属性等)、模型(如MPEG-4 SNHC)。(2)利用描述进行数据可视化-MPEG-7数据描述应该容许被索引数据或多或少地粗略可视化。(3)可视数据的格式-支持以下可视数据格式：数字视频和电影(例如MPEG-1/2/4)、模拟视频和电影、电子形式的静态图像(如JPEG)或纸上的图像、图形、3D模型以及与视频关联的编辑数据。(4)可视数据类型-可

10、以是自然视频、静态图像、图形、动画、三维模型、编辑信息。,MPEG-7对听觉数据的描述(1)特征类型-频率轮廓线、音频对象、音色、和声、频率特征、振幅包络、时间结构(包括节奏)、文本内容(语音或歌词)、声波近似值(通过哼唱一段旋律或发出一种声音效果来生成)、原型声音(典型的用于示例查询)、空间结构(用于多通道声源，如立体声、5.1通道等，每个声道有特定的映像)、声源和它的特性(例如源对象、源时间、源属性、事件、事件属性和典型的关联场景)、模型(如MPEG-4 SAOL)。-(2)描述数据的听觉化-类似视觉数据的要求。-(3)听觉数据格式-数字音频(如MPEG-1音频、CD)、模拟音频(如录音带

11、介质)、MIDI(包括一般的MIDI和Karaoke格式)、基于模型的音频、产品数据。-(4)听觉数据类-声音轨迹(自然音频场景)、音乐、原子声音效果(如掌声)、语音、符号音频表示(MIDI、SNHC音频)、混音信息(包括效果)。,4.2 MPEG-7的“拉”应用 1）视频数据库的存储和检索-电视和电影档案中保存有大量的各种格式的多媒体资料，如数字、模拟磁带和胶片、CD等，这些资料不一定有描述信息(元数据)，即使有也大都是简单的文本描述，它们以专用的格式存储在数据库中，因此，需要按照国际标准格式进行存储和交换。另外，要对大量旧的模拟视听资料进行数字化，在数字化和压缩阶段，可以在数据库中使其包含

12、基于内容的索引特征。对于新的视听媒体，在视频生产的各个阶段可以把描述信息附加在视频流上，从而极大地提高了用手工进行有限词汇注释的质量和生产率。,“拉”应用 2）专业媒体制作方面的图片和视频提交-演播室需要向电视频道提交适当的视频，另外还需要编辑一段库中的视频，如编辑记录片和广告片等。-在这个应用中，用户是专业性的。演播人员可以基于元数据和视频片段来提交一个完整的视频，可以基于客观特性和主观特性来查询出想要的视频片段并用于编辑。查询也可以作用于分布数据库，以获得视觉、版权和价格信息，以及源视频资料的技术质量数据。-在设计方面，静止图片也具有相似的应用和需求。Web 设计人员并不都是做新的设计，有

13、时也在网络上选择现有的图片用于Web站点的设计。在网络上，设计人员可以通过基于内容的检索方法挑选想要的素材。其他设计领域具有相似的可视搜索用途。,“拉”应用 3）商业音乐应用(卡拉OK和音乐销售)-卡拉OK在亚洲极其流行。一般是根据歌名和原唱者姓名检索，但也常有记不清歌名的情况。这时可以利用音频内容检索技术，业余歌手哼几句记忆的曲调，让计算机查找相应的歌曲(或给出相似歌曲的列表)。-相似的与音乐销售有关的应用是把可选择的音乐库扩展到用户家里。人们可以容易地访问在线数据库，用基于内容的方式(结合歌手名、风格、歌名、创作年代等)，查找感兴趣的歌曲和音乐作品，并付费下载。,“拉”应用 4）声音效果库

14、-对于要使用大容量声音效果数据库的艺术家和声音设计人员，常规的数据库管理和搜索方法是不够的。一个声音设计人员要求从声音效果库中选择出要求的声音效果，其选择方式可能是由设计人员提供原型化的声音和音频特征，甚至可以发出类似要查找的声音，通过拟声方式查询。-5）历史语音数据库-可以通过口头关键词、关键事件、说话人、地点、日期，或以上属性的组合来搜索历史数据库中的音频录音和视听演讲。这种应用也可以辅助教育或新闻业应用。例如，用户说一句关键词：I have a dream,系统把语音转换为文本关键词，查找出马丁路德金的录音和演讲文本。,“拉”应用 6）通过听觉事件进行电影场景检索-许多视觉场景是与声音事

15、件相关的。例如在喜剧电影或电视场景中，人们可以通过记忆的对话和台词来检索电影的场景。另外，还可以通过明显的声音事件来检索，例如通过观众的欢呼声和解说员的解说词检索足球进球的场景，通过爆炸声检索战斗和破坏场景等。音轨中的听觉事件也同样具有这样的检索能力。该应用利用语音的描述和声音效果的描述来实现检索。7）商标库的注册和检索-通常情况下，商标是二维图像，包含文本、图画或图片以及象征性的颜色。二维商标可以分为三类：文字商标(仅仅包含文字，适合用文本注释来描述)、图案商标(仅仅包含图形或象征性标志，需要形状描述)、组合形式的商标(包含字符和图形)。,4.3 MPEG-7的“推”应用与以上的“拉”应用

16、相反，下面的“推”应用类似于广播和Web广播。“推”应用用到“选择”和“过滤”，而不是“索引”和“检索”，因此有非常不同的要求。通常它们涉及到流描述，而不是存储在数据库中的静态描述。,“推”应用 1）用户代理驱动的媒体选择和过滤-过滤与搜索正好相反。搜索涉及“拉”信息，而过滤意味着“推”信息。搜索请求“包含”那些信息，而过滤“排斥”指定的数据，但二者都从相同的元信息中获得好处。广播媒体这种形式正向WWW转移，使WWW这种典型的“拉”媒体同时具有广播的能力。-面向消费者的选择技术可以用于个人化视听节目的应用。在收集与个人相关的新闻节目方面，这甚至可以做到比典型的VOD更进一步。例如，一个面向内容

17、生产商的选择技术可以在片段和镜头级从数据库中收集原始资料。,“推”应用 2）个人化电视服务-在广播领域，内容的描述可以辅助广播数据的选择，所选择的广播数据形式可以是即时的或以后要观看的，或录像形式的。对于个人化广播，提供给用户的数据可以按照用户自己的喜好来对广播流进行过滤，其形式可以是自动方式的，例如根据地理位置、年龄、性别或以前的选择行为自动选择，或是半自动方式(基于预定的设置)。结合NVOD(准视频点播)服务，可以基于关键帧实现步进/后退操作，加速节目的表现。对于未来的广播服务，与节目中特定事件相关的交互功能也很重要。3）智能多媒体表现-随着可获取信息的大量增加，人们正在寻找一种新的方式，

18、自动地表现这些数据。它可以通过把上下文、用户、应用和设计原则的知识与显示信息的知识结合起来完成。灵活地应用这些知识，就可以设计一种智能多媒体表现系统。,“推”应用 4）个人化浏览、过滤和搜索-这种应用背景是在消费者的家里。使用一种灵巧装置将浏览、过滤和搜索功能集于一体。平常，这个灵巧装置按照主人的设置(爱好)自动过滤广播数据，录下感兴趣的节目，等到主人有空的时候观看。观看过程中可以充分利用内容描述能力，快速地基于内容浏览，或搜索出感兴趣的片段。5）特别的信息存取-这种应用满足残疾人的信息存取要求，提供主动的信息表现形式，可以帮助他们克服信息获取的问题。关键问题是允许用多模态通信来表现信息。例如

19、，一个搜索代理不仅为盲人排除图像显示，而且获得MPEG7的元数据。在元数据的辅助下，可以通过发声和触觉的形式表现信息。相似的元数据可以帮助其他方面有障碍的残疾人。,4.4 MPEG-7特殊的专业应用和控制 1）远程购物-越来越多的商品是通过在线商品目录销售的。如果目录限制为文本形式，效果就不好。视觉的印象要比文本的印象深刻得多。用常规的方法可以检索到商品，但是对于要买的商品，往往是许多用户仅仅知道一些模糊的概念，“看到了才知道”。因此，需要提供视觉查找方法，以及逐步调整搜索要求，最终找到所要的商品。例如，“我要查找棕色的鞋子，像这样的鞋子，但是后跟要高一些”，或者是“我在找这种花样的窗帘，但是

20、颜色要更鲜艳一点”。这样的可视搜索还适合地毯、布料、内装修、建筑等方面的商品选购。它需要一种集中更新的图像数据库系统支持分布的销售点的信息存取。,2）生物医学应用-医学是视觉识别技术的用武之地之一。医学资料充满了大量的图像，以不同的缩放比例，表示身体各部分正常和病变的状况。诊断中通常需要调用这些资料，而仅仅用基于文本的描述是不够的。因此，需要能够响应图像查询的搜索引擎。医生调用医疗数据库中的病例记录，比较X光照片以判断病变组织。医学中的 3D成像技术越来越重要，因此，图像查询要能够处理2D和3D数据。有些病例资料包含声音描述，例如胸透X光照片结合咳嗽声，这时需要交叉模型的搜索方法支持查询。,3

21、）遥感应用-遥感应用基于卫星图像数据库。数以百万计的图像是按照全色、多频谱、超频谱等方法获得的。直到现在，图像库中的搜索还是基于文本信息的，例如现场名、几何、频谱和地物信息。一种挑战是为在线数据库系统提供以下功能：文本查询、基于整体和部分参考图像(一个和多个频谱边带)的图像查询、基于内容的检索和浏览、保密性和数据保护。4）半自动多媒体编辑-在拥有足够的内容信息条件下，多媒体对象可以干些什么？拥有足够的自身结构信息，再结合操纵这些结构的方法，一段“灵巧”的多媒体数据片段能够自己编辑自己，以适应邻接的多媒体数据。例如，来自不同信息源的一段音乐和视频片段可以自动结合并同步在指定的同步点。,5）教育应

22、用-在教育软件中使用多媒体所面临的挑战是尽量利用媒体内在的信息支持各种教学方法，诸如小结、问答、对错误理解和非理解的反应检测等。通过提供对大型数据库中视频序列和图像、图形、动画媒体的基于内容存取，MPEG7 可以促进教育领域采用音频和视频等媒体资料进行形象直观的教学和培训。应用的方式主要是通过在线的视听资料的检索和比较，在课堂里生动形象地展示教学内容。例如历史课、表演艺术课、音乐课等。6）监测应用-在监测应用中，摄像机监视敏感区域，如果某事件发生，系统即触发行动。系统可以建立数据库，积累视频数据和元数据信息。元数据的提取(在编码器端)和元数据的使用(在解码器端)采用相同的数据库。对采集的数据库

23、可以进行为指定的事件搜索音频/视频数据库、查找相似的事件、判断和决策。,7）基于视觉的控制-在控制领域，基于视觉的控制不是用基于文本的方法控制程序，而是采用图像、视觉对象和图像序列来指定控制行为，形成完整的控制环。这里要求多媒体对象的描述中包含丰富的对象时空关系描述，以及任意对象之间的关系描述。在这些标准的关系描述基础上可以实现基于视觉的控制系统。,4.5-21多媒体框架标准数字图书馆是采用现代高新技术的数字信息资源系统,它不受时间和空间的限制,是一个多功能、易于使用、超大规模的信息资源库。在数字图书馆的资源建设中,多媒体信息占据了信息资源的很大一部分。如何获取数字视频/音频及合成图形等信息

24、,如何传送各种不同类型的媒体并为用户提供透明的信息服务,以及如何进行内容的管理、内容的重定位、各种权利的保护、非授权存取和修改的保护等问题,日益受到数字图书馆建设者的重视。目前已经建立的传输和数字媒体的基础结构、要素、规范之间还没有一个明确的关系描述方法。如果有一种结构或者框架能够保证数字媒体消费的简单性,并在一定的情况下自动完成交易,那么它就能够处理好数字项消费中诸要素之间的关系。-21就是在这种背景下提出的。-21总体上来讲是一个支持通过异构网络和设备使用户透明而广泛地使用多媒体资源的标准,其目标是建立一个交互的多媒体框架。-21是一个针对实现具有知识产权管理和保护能力的数字多媒体内容的技

25、术标准。,-21的基本概念-21是由通过数字而相互作用的用户组成的。-21的行为主体是用户,规范的动作是“使用”,作用的客体是数字项,-21作用的过程中形成了多媒体内容传送链和价值传送链。以下是-21的三个基本概念。1用户()-21中的用户是一个广义的概念,可以是世界各地的个人、消费者、团体、组织、公司、政府以及其他标准化组织和主体。从技术上讲,-21认为内容的提供者和消费者同样都是-21的用户。用户可以各种方式“使用”内容,包括对内容进行发布、递送和消费等。2使用()-21提供了一个多媒体框架供一个用户与另一用户进行以数字信息为目标相互作用,相互作用所涉及的各方均为用户。这里所指的相互作用即

26、为对内容的“使用”,它包括内容创建、内容提供、内容存档、内容定级、内容增强和递送、内容聚集、内容传输、内容发表、内容零售、内容消费、内容提交、内容管制、以上各项交易的简化及管制等。3数字项()-21的数字项是一个结构化的数字对象,是按标准进行表达、标记并带有描述性的数据。数字项是数字资源及其相关内容(图像、数据文件、音频、视频等)的集合。它是-21框架中传送和交易的最基本单元,是用户之间发生关系的目的。,-21的结构组成-21多媒体框架是一个结构化的框架,从结构上可分成七大要素:.数字项声明():数字项声明的目的是建立数字项统一和灵活的摘要和数字项的可互操作性方案。对于同一内容有许多描述方法,

27、因此希望能有一个强大的、方便的数字项模型来表示无数种形式中的数字项的描述。.内容展现手法():它是不同媒体的数据展现方式,如音频、视频的播放。-21提供的内容表示可以通过分级的和错误恢复方法有效地表示任何数据类型。框架中的内容可以编码、描述、存储、传送、保护、交易、消费等。在-21中,多媒体内容表示可完成对-21基本对象的表示。.数字项的标记和描述():这是对不同自然属性、类型的数字项进行统一标记和描述的结构。.内容的管理和使用():-21的目的是通过各种不同的网络和设备透明地使用网络内容,所以对于内容的检索、定位、存档、跟踪、发布、使用显得越来越重要。,.知识产权的管理和保护():-21可通

28、过大范围的网络和设备对这些权利、兴趣和认定事项提供可靠的管理和保护,同时在某种程度上获得、编辑、发布相关的政策、法规、准则。.终端和网络():-21通过屏蔽网络和终端的安装、管理和实现问题,使用户能够透明地操作和发布高级多媒体内容。.事件报告():它可以使用户准确了解框架中所有可报告事件的接口和计量。事件报告将为用户提供特定交互的执行方法,同样允许大量超范围的处理,允许其他框架和模型与-21实现互操作。,-21的关键问题 1网络部分的关键问题.网络传送:包括传送带宽和速度、网络的一致性和可靠性、数据流控制、延迟、差错率、存取时间、移动性、性能价格比以及连通性等问题。.服务和设备的易用性:涉及到

29、智能化、综合连接、设备兼容、不同平台之间的互操作性、国际间兼容性、设备设计上对民族文化的冲击以及设备之间的分布式智能化等问题。.物理媒体格式的互操作性:包括与内容无关的格式、后向兼容格式、媒体的寿命、不同平台的标准存储媒质以及媒质间的内容传输等。.多平台的解码和绘制:在不同类型或不同参数的平台(设备)上回放内容,并保证一定的质量,另外还包括保证不同编解码模式对用户的透明性等问题。2内容和质量方面的关键问题.服务质量和灵活性:包括可靠性、质量检测、用户感知的质量、信息集成、评价、易用性、对用户需求的动态响应、点播、有效平滑的绘制、可预测性和连续性,以及服务的可接入性等问题。,-21的关键问题.内

30、容表示的质量:包括权限和完整性、保真性和用户感知质量(智能质量)检测、价格的一致性、真实性、持续性和时效性等问题。.内容艺术性方面的质量:涉及品牌、来源、丰富性、评论、一致性等问题。.内容的过滤、定位、检索和存储:包括一致的内容标记、描述和查询的反应时间、在内容选择上的个性化服务、搜索的完整性、有效性、可信性、内容真实性的认证、等级与分类、更新,以及对内容的组织管理等方面问题。3消费者方面的关键问题.付费/订购:包括免费服务、以收听广告或给出个人数据的免费服务、收费的奖赏模型、租借、分类付费、奖赏的复制件、点播、每项服务的签署、简单明了的收费模型、支付的验证等等;.消费者信息发布:包括内容的保

31、护和管理、自创内容的可存取性、版权购买等;.消费者使用权限:包括消费者对内容的拥有、使用、复制、编辑等权限的管理;.消费者隐私保护:在消费者和服务提供商或第三方之间保证个人交易隐私的协商能力。,-21的最终目标是为多媒体信息的用户提供透明而有效的电子交易和使用环境。-21最近完成的两项数字版权技术规范也将给数字图书馆多媒体信息资源的版权管理提供新的思路。相信随着-21标准的不断发展和完善,它将在数字图书馆的多媒体信息服务中发挥重要的作用。MPEG官方网址http:/www.mpeg.org,5、国外多媒体元数据研究ECHO(European Chronicles On-line)http:/p

32、c-r.it/echo/#为数字影音文件提供长期可重复使用的软件结构支持服务扩展性以IFLA的数目记录功能需求模型（FRBR model）为基础，将影音资料分成四种层次：Work 作品Expression 内容版本Manifestation 载体版本item 条目,ECHO元数据模型图,书目记录功能需求FRBR模型Functional Requirements for Bibliographic Records研究小组成立于1991年，成员来自IFLA Section on Cataloguing与Section on Classification and Indexing目标：提供清晰的联接

33、书目编目资料的结构化架构建立国家资料库的概念性架构建议国家书目记录的核心层实体的四种表现层次：Work 作品Expression 内容版本Manifestation 载体版本item 条目影响众多标准的发展、再完善，为当前国际书目研究所瞩目ISBDAACRMARC21,VRA核心类目http:/www.vraweb.org/vracore3.htm最初的描述对象是为网络环境下艺术、建筑、史前古器物、民间文化等艺术类可视化资源，主要用于博物馆的收藏，后来扩展应用到非艺术类领域组成：作品著录类目用于作品实体或视觉文献所记载的原始作品（多为三维作品）的著录，含作品类型、尺寸、主题等19个单元。视觉文

34、献著录类目用于视觉文献的著录，包括视觉文献类型、视觉文献格式等9个单元。,MOA II 数字图像元数据（http:/www.hti.umich.edu/m/moagrp/）包括描述性、结构性、管理性元数据描述性元数据：推荐使用MARC、DC、EAD等已广为接受的元数据结构性、管理型元数据定义了描述完整对象、子对象两种管理性元数据有四部分构成数字原版图像元数据、识别数字图像元数据、联结数字图像及实例的元数据、归属和版权等信息元数据CDL数字图像元数据（http:/www2.cdlib.org/index.html）基本参照MOA 2元数据分三类重点定义了管理和显示的描述性元数据数字对象分为简单和

35、复杂两种，分别定义元数据Dig35（http:/www.i3a.org/i_dig35.html）为静态数字图像定义了一系列公开的元数据构成基本图形参数元数据图像创建元数据内容描述元数据历史元数据知识产权元数据基本元数据类型,6、国内多媒体元数据研究大陆中国民族音乐数据库元数据上海交通大学图书馆（http:/5个元素2个限定词结构性元数据：1个元素（确定资源之间的关系）,台湾中央研究院之“数位典藏国家型科技计划”http:/ndap.org.tw/TechReport/part1/html/060chapter/020_110.shtml第一阶段：以DC为基础DC可以满足描述的需求但与媒体制作

36、、影音技术、内容研究等多方面要求有差距第二阶段：以ECHO为基础发展自己的元数据总体框架结构遵循ECHO分层描述：整卷（whole）-片段（sequence）-场（scene）-镜头（Shot）采用新技术，自动生成部分元数据提供不同层次和形式的多重检索功能,7、元数据的未来发展趋势互操作实现元数据的互操作是元数据发展的必然趋势未来元数据的发展，必须建立一种标准的元数据框架，框架内能够很容易实现元数据映射、互操作以及保存灵活和长期有效地保存能够适应变化是元数据标准灵活和可扩展最本质的特征灵活性意味着元数据标准能够容易扩展大众化语义通俗化：保证非专业人员容易理解和接受加工平台规范、标准化：为资源的制作者提供一套简单好用的电子资源描述格式界面友好化：适用不同的文化水平的用户专业人员和一般的公众,