云计算与分布式技术.ppt
《云计算与分布式技术.ppt》由会员分享,可在线阅读,更多相关《云计算与分布式技术.ppt(26页珍藏版)》请在课桌文档上搜索。
1、云 计算与分布式技术,1,第四章,2,云计算故事-“双十一”背后 好多人在淘宝上淘过宝贝,特别是每年的“双十一”,产生了海量的交易数据,这些数据其实不是存储在某一台存储服务器上,每单交易从商品的检索到完成下单的一系列过程,可不是一台服务器帮你完成的。阿里云平台单集群早已超越5000台,同时支持多集群跨异地机房计算,实现业务的并行处理和分布式计算。在电商平台下单,一笔买卖就是一个“事务”,对买家账户进行扣款,对卖家账户进行入账;同时,要扣库存、更新订单状态,而库存和订单一般属于不同的数据库,甚至是在不同物理位置的云数据中心主机上,如何保证这一系列数据处理的一致性?淘宝网整个交易系统是个复杂的系统
2、,由分布在不同地域的云计算数据中心,通过分工与协同,完成交易的整个过程,其中负责存储海量数据的分布式数据库OceanBase是支付宝的核心系统之一。,第四章 云计算与分布式技术,3,本章导读 云计算系统可以是一个庞大的信息处理系统,在该系统中,与大量服务器、存储设备、数据库、网络设备等分布在不同网络位置和物理位置。该系统就是利用分布式技术,将一个巨大任务,划分成多个子任务分配给系统中不同的处理节点上,然后把各个节点的处理结果进行有机整合,最终产生所需要的结果。分布式技术既提高了工作效能,又充分盘活了系统中各种空闲的软硬件资源。分布式系统是云计算中最基础的架构,其中包括分布式应用和服务。分布式系
3、统把应用和服务进行分层和分割,然后将应用和服务模块进行分布式部署,既提高了并发访问能力、减少数据库连接和资源消耗,还能使用不同应用复用共同的服务,使业务易于扩展。,第四章 云计算与分布式技术,4,本章学习目标 随着计算的发展,有些应用需要非常巨大的计算能力才能完成,如果采用集中式计算,需要耗费较长的时间来完成,分布式计算将应用分解成许多小的部分,分配给多台计算机处理,这样可以节约整体计算时间,大大提高计算效率。学习目标 理解分布式系统概念 理解分布式计算、分布式文件系统、分布式数据库、分布式存储等技术特点 了解分布式消息队列 了解分布式系统在云计算中的应用,第四章 云计算与分布式技术,5,什么
4、是分布式系统(Distributed System)?分布式系统是若干独立计算机的集合,这些计算机对于用户来说就像是单个相关系统。分布式系统由多个业务节点组成,每个节点可以由廉价的终端或昂贵的服务器组成,构成一个独立的运算单元,它们分散在不同的地理位置,基于通信网络互联和分布式软件系统来执行任务。分布式系统对用户来说就像一台计算机一样,作为整体对外向用户提供资源,但对用户而言整个系统是透明的。分布式系统根据网络的体系结构分为总线型和网络型;根据系统架构分为分布式存储和分布式计算。,4.1 什么是分布式系统,6,分布式系统特点:(1)一致性。即数据的一致性,关联数据之间的逻辑关系是否正确和完整,
5、无论对数据怎样操作,都要保持数据的完整性和可用性,没有脏数据产生。(2)可用性。用户发出的各种请求,在服务器端能及时作出正确的响应,而不是错误的或是没有响应。(3)容错性,。当一个节点出现故障时,系统中其它节点能够提供正常的服务,并对该节点进行删除和增加操作。,4.1 什么是分布式系统,7,分布式计算,是一种计算方法,和集中式计算是相对的。随着计算技术的发展,有些应用需要非常巨大的计算能力才能完成,如果采用集中式计算,需要耗费相当长的时间来完成。分布式计算将该应用分解成许多小的部分,分配给多台计算机进行处理。这样可以节约整体计算时间,大大提高计算效率。分布式计算就是让两个或多个软件互相共享信息
6、,这些软件既可以在同一台计算机上运行,也可以通过网络连接起来的多台计算机同时运行,然后共同完成一个或若干个任务得到结果。,4.2.1 分布式计算,4.2 什么是分布式系统,8,网格计算是分布式计算的一种类型。网格计算在松耦合资源环境中的得到应用,用来实现复杂的工作负载管理和信息虚拟化功能。网格计算也是一种与集群计算非常相关的技术。网格计算的实质就是组合与共享资源并确保系统安全,并通过利用大量异构计算机的未用资源(CPU、磁盘存储等),将其作为嵌入在分布式电信基础设施中的一个虚拟的计算机集群,为解决大规模的计算问题提供了一个分布式模型。网格计算或分布式具有以下特点:(1)稀有资源可以共享;(2)
7、通过分布式计算可以在多台计算机上平衡计算负载;(3)可以把程序放在最适合运行它的计算机上。,4.2.2 网格计算,4.2 什么是分布式系统,9,并行计算(Parallel Computing)是指同时使用多种计算资源解决计算问题的过程,是提高计算机系统计算速度和处理能力的一种有效手段。用多个处理器来协同求解同一问题,即将被求解的问题分解成若干个部分,各部分均由一个独立的处理机来并行计算。通过并行计算集群完成数据的处理,再将处理的结果返回给用户。并行计算有以下特征:(1)将工作分离成离散部分,有助于同时解决。(2)随时并及时地执行多个程序指令。(3)多计算资源下解决问题的耗时要少于单个计算资源下
8、的耗时。,4.3.1 什么是并行计算,4.3 并行计算,10,(1)云计算萌芽于并行计算 云计算的萌芽应该从计算机的并行化开始,并行机的出现是人们不满足于CPU摩尔定率的增长速度,希望把多个计算机并联起来,从而获得更快的计算速度。(2)并行计算追求的高性能 在并行计算的时代,人们极力追求的是高速的计算、采用昂贵的服务器。例如,截至2018年11月,美国超级计算机“顶点”蝉联冠军,中国超算上榜总数仍居第一,数量比上期进一步增加,占全部上榜超算总量的45%以上。中国超算“神威太湖之光”和“天河二号”分别位列第三、四名。(3)云计算对于单节点的计算能力要求低 而云计算并不去追求使用昂贵的服务器,云中
9、心的计算力和存储力可随着需要逐步增加,云计算的基础架构支持这一动态、虚拟化扩展的方式。,4.3.2 并行计算与云计算,4.3 并行计算,11,MapReduce是1956年由图灵奖获得者著名的人工智能专家McCarthy首次提出的,是LISP语言定义的函数,是一种编程模型,用于大规模数据集(大于1TB)的并行计算。概念“Map(映射)”和“Reduce(归约)”,是它的核心思想。它是面向大数据并行处理的计算模型、框架和平台。MapReduce是一个基于集群的高性能并行计算平台(Cluster Infrastructure)。它允许用市场上普通的商用服务器构成一个包含数十、数百至数千个节点的分布
10、和并行计算集群。MapReduce是一个并行计算与运行软件框架。MapReduce是一个并行程序设计模型与方法(Programming Model&Methodology)。,4.4 MapReduce简介,12,分布式文件系统(Distributed File System)就是分布式+文件系统,从文件系统的客户使用者来看,它就是一个标准的文件系统,提供了一系列API,实现文件或目录的创建、移动、删除和对文件的读写等操作。从内部组织结构来看,分布式的文件系统不再和普通文件系统一样负责管理本地磁盘,它的文件内容和目录结构都不存储在本地磁盘上,而是通过网络传输到远端系统上。常见的分布式应用级的文
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算 分布式 技术

链接地址:https://www.desk33.com/p-228831.html