计算机新技术.ppt
《计算机新技术.ppt》由会员分享,可在线阅读,更多相关《计算机新技术.ppt(132页珍藏版)》请在课桌文档上搜索。
1、计算机新技术学术讲座,2,个人简介,复旦大学计算机软件与理论 博士东南大学电子商务系 副教授东南大学经济决策与信息管理研究所 副所长主要研究方向:数据库/数据仓库、数据挖掘与知识发现、智能信息处理。已在国内外计算机类核心期刊发表论文十余篇,其中多篇论文被EI检索。研究课题:数据挖掘应用平台研制及应用(国家863项目)智能交通数据挖掘平台(信息产业部攻关项目)环球多市场金融信息平台(上海市科委攻关项目),3,主要内容,计算机硬件与互联网技术计算机软件技术智能信息处理技术,4,计算机硬件与互联网技术,集群计算技术网格计算技术普适计算本体论与语义网络,5,集群计算技术,什么是集群集群是使用两台或两台
2、以上的服务器组成的服务器集合,用以提供高性能的不停机服务,每台服务器均承担部分计算任务和容错任务,但是整体上表现为一个单一系统。与传统的并行计算模型相比,集群中各节点的复杂度中等,但是在单一系统映像、可靠性和可伸缩性上更优越。由于集群大多使用标准的商用部件,因此能够大幅度降低企业成本,如下页表所示。,6,集群计算技术,7,集群计算技术,集群系统的组成部分后台共享存储设备集群内部网络通讯公共网络虚拟的前台界面无虚拟内存的的集群系统为了进一步提高集群系统的效率,使用高速网络将各主机的内存连接起来,当一个任务的内存不够时,它可以通过远程缺页的方式使用远程结点的内存,这样可以通过高速网络共享全局内存。
3、,8,集群计算技术,无虚拟内存集群系统的难点整个资源的分配概念发生了变化,它是基于内存的资源分配;一个结点可能需要访问另外一个结点的内存,这就需要解决结点内存的所有权和自治问题;需要解决全局内存管理问题(集中式还是分散式),通过全局内存管理,应能达到减少网络流量,降低延迟和数据本地优化的目的。目前的操作系统还没有实现上述的处理,我们需要重构操作系统以方便内存资源共享。,9,集群计算技术,集群的分类科学计算集群该集群主要用于大规模数值计算,解决复杂的科学问题。这种集群上一般运行专用软件,能够将数据分布到不同的服务器上进行解决。针对不同的科学计算任务,一般有以下两种方式:任务分片方式:将任务分成多
4、个子任务并分配到各节点,每个节点单独运行出结果,最后汇总计算结果;并行计算方式:各个节点可以进行具有强藕合关系的运算,运算中交换大量数据。,10,集群计算技术,负载均衡集群该集群的目的是使负载尽量在各个节点中均衡分布,如计算负载、网络流量负载等。高可用性集群该集群的目的是使服务系统的运行速度和响应速度尽可能快,通过将程序运行在冗余节点上,集群具有更好的容错性。高可用性集群可以分为主从方式、双机备份方式和多机备份方式。,11,集群计算技术,并行数据库集群近年来兴起的集群类型,同时具有并行计算、高可用性和负载均衡等多种特征,主要用于高端数据库领域,如Oracle RAC和 IBM DB2 EEE。
5、Oracle RAC系统每台主机拥有独立的CPU和内存,但是共享磁盘空间,主要针对于大量用户并行的访问,I/O冲突采用数据库的锁机制解决;DB2 EEE中各计算机拥有独立的CPU、内存和磁盘,并且高速相连,对每一次访问,每个节点查询本地表中的相应结果,返回给协调程序,最后汇总成最终查询结果。,12,网格计算技术,网格的基本概念什么是网格(GRID)网格是以Internet技术和分布计算技术为基础,将地理上分散的各类计算资源、存储资源、数据资源、应用资源、仪器设备等构成统一的虚拟环境,采用开放标准的协议,实现资源的有效共享,为动态参与的、由多机构所形成的虚拟组织协同完成高性能计算、信息处理等各类
6、应用,提供可扩展的、安全的、一致的、不同等级质量的服务。网格是集群系统的进一步发展。,13,网格计算技术,网格计算的产生背景分布式计算、高性能计算、大规模的资源共享、协同工作、数据密集型的科学计算。网格的本质特征是分布与资源共享高度抽象自相似动态性和多样性高可扩展性网格计算的示例(见下页图所示),14,网格计算技术,Tier 1,15,网格计算技术,网格的系统结构(见下页图所示)网格结点:地理上独立的计算和信息中心,由Internet 上孤立、异构的各类资源组成;网格中间件:网格体系结构的核心部分,其功能是屏蔽网格资源层中计算资源的分布、异构性,向网格应用层提供透明、一致的服务接口,如远程进程
7、管理、资源分配、存储访问和安全控制等。网格应用工具层:提供更为专业化的服务和组建不同类型的应用。网格应用层:应用层包括各种应用软件的研究、高速网格的建设等,它可以使用户方便地共享网格中的各种资源。,16,网格计算技术,17,网格计算技术,典型的网格系统(1)Globus系统什么是GlobusGlobus 是一个研究性的项目,其主要的研究目标是网格基础技术研究,以及相应软件的开发和标准的制定。Globus 是网格技术的典型代表,也是目前事实上的规范。Globus 是一种软件基础设施,它以单一虚拟机的方式处理分布异构的计算资源,其核心在于Globus Metacomputing Toolkit(G
8、MT),它提供了建构一个计算网格所需的基本服务,如安全、资源定位、管理和调度、通讯服务等。,18,网格计算技术,Globus的五层结构,19,网格计算技术,典型的网格系统(2)TeraGrid系统TeraGrid网格系统基本情况与主要应用TeraGrid网格系统最初包括4个节点,后扩充到9节点,节点间通过 10-30 GB/s 的专用网络互联,具有超强的计算能力和存储能力。协作进行分布式数据集的分析和交换:各节点进行独立的数据分析,整个项目的完成依赖于快速和频繁的分析结果交换,如研究宇宙射线项目;多个机构共享的分布式模拟:例如规模庞大的地震模拟计算在不同的节点进行,任何节点的科学家可以通过高速
9、网络快速获取各个不同阶段的计算结果;,20,网格计算技术,网格计算的关键技术安全技术网格安全机制相当复杂,各种自治资源交互时既不能影响资源本身的可用性,又不能在系统中引入漏洞。Globus 提出了网格安全基础设施GSI,GSI 主要集中在网络的传输层和应用层,采用X1509 认证和安全套接层(SSL)通信协议,GSI 中的主要安全技术包括安全认证、安全身份相互鉴别、通信加密等。,21,网格计算技术,异构系统的单一系统映像技术网格包含多种异构资源,实现异构机器间的合作和转换,向用户提供统一、透明的服务是首要问题。Globus 中使用使用轻量级目录访问协议(LDAP)作为访问该信息的接口。通过使用
10、LDAP服务器,MDS 在公共接口中提供了中间件信息,从而将统一的图像放在全异资源的顶部。,22,网格计算技术,网格统一资源管理技术网格资源管理包括资源信息的组织、查询与更新等,网格资源分为计算类和非计算类资源。计算类资源信息包括所有网格结点及网络的静态和动态信息,如结点计算能力、存储能力、网络结构和性能指标;非计算类资源信息指网格中服务于系统和用户的信息,如网格用户信息、软件信息、服务功能信息等。Globus 使用GRAM 处理资源请求、执行远程应用、分配资源等任务,并根据计算资源的情况,把资源更新信息发送给MDS。,23,网格计算技术,网格技术的缺陷和局限网格系统对数据通讯速率要求很高,影
11、响了系统效率或提高了成本;网格系统的维护费用比集群等高得多;由于目前网络带宽比CPU资源昂贵得多,且因特网成本降低的速度低于芯片成本降低的速度,因此网格系统目前比较适合于计算复杂、但数据传输量小的应用。对于大多数应用,集群系统方案综合看来更优越。,24,网格计算技术,网格技术在数字油藏模拟中的应用背景当前被模拟的油藏模型从几十万个单元到几千万个单元,运行平台主要是专业的并行机。随着老油区开发难度的增大,油藏模型的面积和数量将会明显地增加和扩大,继续用传统的并行计算机来模拟,为了达到理想的模拟速度和效果,其硬件平台的投资将很高。同时随着随着并行机市场不断萎缩,其系统的扩容、维护等都存在很大的问题
12、。,25,网格计算技术,目的为获得低成本、高性能的计算平台,以满足企业对油藏模拟不断增长的计算需求,国外石油公司逐步采用了基于网格技术的PC 集群系统(即以PC 集群作为网格主节点,再通过网格中间件并入其他异构系统)替代并行机来进行油藏模拟。对比实验选择了国外某油田100 万个网格、8 个断层、7 个组分、100 个井的模型,模拟时间20 年。对比IBM SP2并行机与基于千兆以太网、Myrinet 高速交换技术和AMD Opteron 64 位CPU的PC 集群系统。(基于VIP 模拟软件),26,网格计算技术,实验结果(新疆油田勘探开发研究院提供)在模拟计算的精度和稳定性上,PC集群系统与
13、并行机结果相当;到IBM SP2 的4 个节点8 CPU 的并行机上模拟,系统运行了30.2 个小时后,同样CPU 个数的基于Myrinet 的PC 集群的运算时间为11.66 小时;基于千兆以太网的PC集群运算时间是16 小时,在运算速度上,比IBM SP2 提高了2.61.9 倍;VIP 软件的计算节点之间需要大量的数据交换,去计算相邻网格单元边缘处的偏移。在PC 集群系统中,当计算节点很多时,存在着访问网络的瓶颈问题。,27,普适计算,普适计算普适计算的定义普适计算是信息空间与物理空间的融合,在这个融合的空间中人们可以随时随地、透明地获得数字化的服务。随时随地是指人们可以在工作、生活的现
14、场就可以获得服务,甚至是由系统主动提供;透明是计算机技术已经渗透到人们的日常生活中,以致于人们根本没有意识到这些技术。普适计算强调把计算机嵌入到环境或日常工具中去,让计算机本身从人们的视线中消失,让人们注意的中心回归到要完成的任务本身。,28,普适计算,普适计算的研究内容智能环境和不可见的计算即物理环境与信息环境有效地融合,信息环境能够自动、智能地感知物理环境中的变化。常用的方法包括:(1)直接在物体上嵌入一定的感知、计算、通信能力,使其同时具有物理空间和信息空间中的用途;(2)为每个物体添加可以被计算机自动识别的标签,如红外或者RFID。,29,普适计算,无缝的可移动性用户能够在不同的服务空
15、间中很自然地移动,可以把应用从一个设备移动到另一个设备中。普遍的信息访问通过网络和服务器的支持,用户能在任何时间和地点检索信息,利用任何种类的交互设备与远程联网的设备进行交互。觉察上下文的计算系统能觉察在当时的情景中与交互的任务有关的上下文,并据此做出决策和自动地提供相应的服务。,30,普适计算,普适计算的实例RFID(无线射频识别标签)通常为一片带有存储单元和天线的半导体芯片,通过天线与读取器进行非接触通信。普适计算环境下,带有RFID标签的衣服能够在商场收银台显示商品的价格,能够将衣服的布料成分传递给洗衣机和电熨斗,使洗涤、烘干程序和熨烫温度均可以自动设定。家庭计算机可以通过RFID信息了
16、解到衣物的保暖、防风性能,自动比较主人外出前穿戴衣物的保暖性能是否适应室外的气候,包括当时的气候和一段时间之后的气候。如果主人出远门,计算机还会通过订票信息了解目的地的气候情况并进行分析,这些分析会根据每个个体的衣着习惯进行。,31,本体论与语义网络,本体论与语义网络什么是本体(Ontology)在哲学界,本体作为表述哲学理论的术语,是指形成现象的根本实体。在信息技术与知识领域,本体是用于描述或表达某一领域知识的一组概念或术语,可用于组织知识库较高层次的知识抽象,也可用来描述特定领域的知识。总的来说,本体就是通过对于概念、术语及其相互关系的规范化描述,勾画出某一领域的基本知识体系和描述语言。,
17、32,本体论与语义网络,研究本体的意义本体可以在不同的建模方法、范式、语言和软件工具之间进行翻译和映射,以实现不同系统之间的互操作和继承。本体和数据库在功能上有些相似,但是定义本体的语言,在词法和语义上都比数据库所能表示的信息丰富得多,并且本体提供的是一个领域严谨丰富的理论,而不单单是一个存放数据的结构。本体是领域内重要实体、属性、过程及其相互关系形式化描述的基础,这种形式化的描述可成为软件系统中可重用和共享的组件。,33,本体论与语义网络,对于知识管理系统来说,本体就是一个正式的词汇表。本体可以将对象知识的概念和相互间的关系进行较为精确的定义。在这样一系列概念的支持下进行知识搜索、知识积累、
18、知识共享的效率将大大提高,真正意义上的知识重用和知识共享也能成为现实。本体适合表示抽象的描述,而企业模型是人们对企业或者企业的某些模型的抽象描述,因此在企业逻辑建模中,本体的使用可以帮助我们清楚地理解企业特定领域的相关元素、关系和概念,让知识表达更加准确便捷,帮助人们进行更好的企业决策。,34,本体论与语义网络,本体的分类顶层本体描述的是最普遍的概念及概念之间的关系,如空间、时间、事件、行为等等,与具体的应用无关,其他种类的本体都是其的特例;领域本体描述的是某个特定领域(如医药、地理等)中的概念及概念之间的关系;任务本体描述的是特定任务或行为中的概念及概念之间的关系;应用本体描述的是依赖于特定
19、领域和任务的概念及概念之间的关系。,35,本体论与语义网络,语义网络的产生背景现有互联网技术只是按照URI来定位信息,并没有对信息的含义进行描述,但对信息的内容并不关心,因此互联网上信息处理的自动化、智能化程度是很低的。语义Web通过扩展现有互联网,在信息中加入表示其含义的内容,使计算机可以自动与人协同工作,提高信息处理的自动化和智能化。语义Web是要把Web 上的资源(如一篇文章里的关键词的含义和主题思想)用本体论语言标注明确其语义,然后进行基于语义的查询和推理。,36,本体论与语义网络,语义Web的分层结构基于XML的语法层XML允许用户为文档添加结构信息,但并不能说明这些结构的含义,语义
20、Web 结构中使用XML 作为语法层,为语义Web 的建立提供语法基础。基于资源描述框架(RDF)的数据层RDF 是对结构化的元数据编码、交换和重用的基础。在语义Web 模型中,信息统一以RDF 句子的形式存储,便于机器理解。RDF 数据模型表示为一个有向标记图,该图独立于实现且可以用XML 来序列化。,37,本体论与语义网络,基于本体的语义层本体适合于描述互联网上各种不同的、分散的、半结构化的信息资源。通过定义共享的、通用的领域知识,本体帮助人和机器进行语义级的交换,而不仅是语法级的。逻辑层逻辑层提供了规则,从而便于进行推理。证据层在逻辑层基础上交换推理的结果,为了检查这些结果,需要将内部推
21、理机制转化为一种通用的证据表示语言。,38,本体论与语义网络,语义Web的应用研究Web services 是一系列用来促进跨平台的程序间通信的标准。语义Web 可以提高用户对Web services 进行定位、选择、运用、组合和监控的自动化程度。语义Web 用本体来描述各种网上资源,网络中的知识将用一种结构化、逻辑化、语义化的方式来表示。代理(Agent)可以在本体的指导下对网上知识进行读取和推理,并形成一个动态联系的Agent网络,传统的C/S计算模式将可能被一种基于Agent的分布式计算模式所取代。,39,本体论与语义网络,现有的搜索引擎是基于关键字,词语中的多义词和同义词降低了查询的精
22、确性。尽管研究者们提出许多算法来解决这个问题,但从网页的文本内容入手仅能得到有限的语义信息,而语义Web则可以较好的处理这个问题。近年来大量的数字化多媒体数据被加入互联网,传统的基于内容的多媒体数据检索技术,不能有效利用网上的多媒体数据。基于语义的查询能够利用多媒体资源的高级特征,从而使各种多媒体数据资源得到有效利用。,40,计算机软件技术,数据库技术数据仓库空间数据库、移动数据库实时数据库、数据流技术XML数据库、微型数据库商用数据库新进展数据库新技术在地矿行业的应用软件工程技术软件工程中的知识管理,41,数据库技术数据仓库,数据仓库数据仓库的定义面向主题的、集成的、相对稳定的、反映历史变化
23、的数据集合,用于支持管理决策。数据仓库的主要特点:数据仓库面向分析型数据处理,用于支持决策,不同于企业现有的操作型数据库;数据仓库是对多个异构数据源进行的有效集成,并按主题进行重组,数据一般也不再修改。,42,数据库技术数据仓库,数据仓库的体系结构图,43,数据库技术数据仓库,数据仓库与联机分析处理OLAPOLAP是使分析人员能够从多角度对信息进行快速、一致、交互地访问,从而获得对数据的更深入了解的一种软件技术,其目标是满足在多维环境下特定的查询和报表需求。OLAP的核心是将数据按照多维结构(即数据立方体)进行组织与处理,即将实体的重要属性定义为“维”,并且“维”可以包含复杂的层次结构。根据“
24、维”的结构层次不同,OLAP分析的常见操作包括下钻、上卷、切片、切块以及旋转等。,44,数据库技术数据仓库,数据立方体的实例,美国的电视机年度销售总额,45,数据库技术数据仓库,数据仓库与OLAP的实现方式MOLAP:使用多维数组存储数据。多维数据在存储中将形成“立方体”的结构。ROLAP:以关系数据库为核心,以关系表进行多维数据的表示和存储。ROLAP将多维结构划分为两类表,即事实表(存储数据和维关键字)和维表(用于存放维的层次、成员类别等描述信息)。常见的组织形式包括“星型模式”和“雪花模式”。HOLAP:基于混合形式的实现,例如低层是关系型的,高层是多维矩阵,该方式更具灵活性。,46,数
25、据库技术数据仓库,星型模式实例,47,数据库技术数据仓库,数据仓库实施的难点业务模型与数据模型的建立;相关主题领域的确定;元数据的设计和管理;数据的净化和集成;自下而上和自上而下实施策略的选择;,48,数据库技术空间数据库,空间数据库空间数据库的出现背景:GIS的普及使用。传统RDBMS管理地理信息数据的局限地理信息数据一般为连续数据,并具有较强的空间相关性;地理信息数据的实体类型多,空间关系复杂;地理信息数据的数据项复杂,变长记录居多;地理信息数据需要大量的空间操作和查询,如拓扑关系查询和相似性查询等;,49,数据库技术空间数据库,空间数据库的实现方式混合模式:将非空间数据存储在RDBMS中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 新技术
链接地址:https://www.desk33.com/p-262625.html