Chapter3分布式程序设计语言.ppt
《Chapter3分布式程序设计语言.ppt》由会员分享,可在线阅读,更多相关《Chapter3分布式程序设计语言.ppt(55页珍藏版)》请在课桌文档上搜索。
1、第三章 分布式程序设计语言,2,2023/3/10,3.1 分布式程序设计语言概述,对应用程序进行程序设计的理由:减少单个计算的周转时间;增加可靠性和可用性;使系统的某些部分提供某些特殊功能以及固有的分布式应用。,3,2023/3/10,分布式应用程序的分类,并行、高性能应用程序。通过并行性达到加速是在分布计算系统上运行应用程序的最主要的原因。容错应用程序。分布计算系统具有允许部分失效的特性,即由于各处理机具有自治性,一个处理机的故障不影响其他处理机的正常工作。程序和数据也可在若干处理机上复制而进一步增加可靠性。具有专用功能的应用程序。一些应用程序可以被构造成一组专用的服务程序。例如文件服务、
2、打印服务、进程服务、终端服务、时间服务等。固有的分布式应用程序。有些应用程序本身就是分布的,在这种情况下,可以把工作站的集合看成一个分布计算系统,这种应用程序必须在分布式硬件上运行。,4,2023/3/10,分布式程序设计与顺序程序设计的区别,使用多个处理机:分布式程序在不同处理机上并行执行其代码的不同部分,这是对分布式程序设计的第一个要求处理机合作:分布式计算系统的各个进程在执行分布式应用程序时需要合作,能相互通信和同步,这是对分布式程序设计支持的第二个要求。处理部分失效:在分布计算系统中一些CPU失效时,其他CPU照样工作。能对系统的部分失效进行检测并恢复是分布式程序设计的第三个要求。,5
3、,2023/3/10,分布式程序设计语言的分类,按并行模型来分 顺序进程并行语言:这类语言使用的最基本模型是一组顺序进程,它们并行运行,并且通过报文传递进行通信。大部分是流行的C(或C+)和FORTRAN的扩展。具有内在并行性的语言:一些研究者认为算法语言不是处理并行性的最好语言,因为算法语言是内在顺序式的,许多研究者研究具有内在并行性的语言,如函数式语言、逻辑语言和面向对象语言。,6,2023/3/10,按通信模型来分 分布式程序语言分为逻辑上分布的语言和逻辑上非分布的语言。分布式系统逻辑上和物理上的分布有四种组合:在物理分布的硬件上运行逻辑上分布的软件。一组进程,每个进程在分开的处理机上运
4、行,相互使用SEND和RECEIVE原语通信,在网络上发送报文。在物理非分布的硬件上运行逻辑上分布的软件。具有相同逻辑的多进程结构,用共享主存方法实现报文传递来模拟物理报文传递通信。在物理分布的硬件上运行逻辑上非分布的软件。试图隐匿物理分布,使分布式系统相对于程序员来说好像有共享存储器。在物理非分布的硬件上运行逻辑上非分布的软件。使用共享数据通信,物理共享存储器的存在使得实现起来比较容易。,7,2023/3/10,容错模型和技术故障的处理模型:系统对程序员隐匿全部处理机故障。给程序员提供高层机制,使得程序员能够描述哪些进程和数据是重要的,以及发生崩溃后怎样恢复。实现可靠性的方法:程序设计容错技
5、术有三类:向前恢复、向后恢复、错误屏蔽。通信容错,依赖于使用的通信方式和故障的类型。,8,2023/3/10,3.2 并行性的支持,并行性的概念 并行性:因为分布计算系统有多个处理机,所以可把程序分成若干部放到多个处理机上同时运行,这就是所谓的并行性。伪并行性:即把程序表示为一组并行运行的进程,但不管它们是否在不同的处理机上同时运行。并行粒度:并行单位可以是进程(如并发C),也可以是表达式(如Par Alfl)。一般说来,通信代价越大,则并行的粒度就应该越大。,9,2023/3/10,并行性的表示进程并行:一般说来,一个进程是一个逻辑处理机,顺序地执行代码,具有自己的状态和数据。在语言中,如同
6、过程或过程类型一样,进程或进程类型是要被说明的。对象并行:面向对象语言中的并行性可以用两种方法获得。Smalltalk-80包含传统的进程概念,让程序员处理两种模块:进程和对象。另一种方法是对象本身作为并行单位。用下述方法扩充顺序对象模型可获得并行性:(1)允许对象不必在收到报文时才活动;(2)允许接收对象在返回结果后继续执行;(3)允许一次向几个对象发送报文;(4)允许报文发送者继续和接收者并行工作。,10,2023/3/10,语句并行:语句被分成组且并行执行 SEQ S1 S2 或 PAR S1 S2 并行循环语句 PAR j=0 FOR n Aj:=Aj+1,11,2023/3/10,函
7、数并行如果函数没有任何副作用,则出了“结束”这一点外,在那种次序执行方面是没有差别的,例如表达h(f(3,4),g(8),先计算f或g是没有关系的,因此可以并行计算f和g。原则上,所有函数调用均可以并行执行,唯一的限制是使用另一个函数的结果的函数要等待该结果的产生。对于分布式计算系统,函数方法需要解决以下几个问题:确立并行度,即粒度大小;如何分配计算问题;编译程序,确立处理机的分配。,12,2023/3/10,子句的并行 AND/OR并行性适合于分布式程序设计,且已并入很多并行逻辑程序设计语言中,下面的程序给出谓词A的两个子句:A:-B,C,D A:-E,F用过程的观点,存在两个并行性的机会:
8、A的两个子句可并行工作只到有一个成功或两个都失败。每个子句中的子定理可并行工作直到它们全都成功,或其中一个失败。前一种并行性叫做OR并行性,后一种叫做AND并行性。,13,2023/3/10,并行计算到物理处理机的变换 可编程的变换,即用户控制的变换通常由两步组成:把并行单元变换到物理的处理机上,几个并行单元可以变换到同一个处理机上;使用局部变换对同一处理机上的单元进行调度,通常使用分配给并行单元的优先权。无论是由程序员还是由系统把并行单元分配给处理机,有如下三种分配方法:编译时确定处理机;运行时确定处理机;完全不确定。,14,2023/3/10,3.3 进程通信与同步的支持,进程通信的表示方
9、法:报文传递和共享数据报文传递设计报文传递的通信方式应考虑的问题:可靠的报文传递和非可靠的报文传递:语言通常只提供可靠的报文传递,语言的运行时系统自动产生承认报文,这在语言级上是透明的。显式接收和隐式接收:发送者通过发送报文或调用远程过程显式地发动相互作用,接收者接收报文可以是显式的也可以是隐式的。显式接收时,接收者执行某一类accept语句指明接收哪些报文,以及当报文到达时采取什么行动。使用隐式接收时,在接收者内自动调用程序,通常在接收进程中创建一个新的线程。,15,2023/3/10,直接命名和间接命名:发送者要把报文送给谁,接收者从谁那里接收报文?双方的命名可以是直接的或间接的。直接命名
10、用于指示一个指定的进程,名字可以是该进程的静态名字或是一个表达式。间接命名包括一个中间对象,通常叫做邮箱,发送者把报文送给它,接收者从它那接收。对称命名和非对称命名:如果发送者和接收者相互命名,则基于直接命名的方案是对称的。在非对称方案中,仅发送者找接收者,在此情况下,接收者要与任何发送者相互作用。注意,使用隐式接收报文的相互作用在命名方面总是非对称的。,16,2023/3/10,报文传递通信模式同步和异步点到点报文:在同步报文传送方式中,发送者在接收者接收报文前一直阻塞。这样,双方不仅交换了数据而且还达到同步。在异步报文传送方式中,发送者并不等待接收者准备好接收其报文,发送者在送出报文后立即
11、继续工作。会合:点到点报文在两个进程间建立单向通信,但是进程之间的相互作用本知识是双向的。在Ada中会合模型基于三个概念:项说明、项调用和接受语句。项说明和接受语句是服务员程序的一部分,项调用在顾客端。当进程S调用进程R的一项,R为此项执行accept语句时,在S和R之间发生了相互作用,叫做会合。,17,2023/3/10,远程过程调用(RPC):双向通信的另一个原语。当进程S调用进程R的过程P时,由S提供的P的输入参数被送给R。当R收到调用请求时,执行过程P,然后把输出参数送回给S。执行P期间S阻塞,直到输出参数返回。这和会合机构不同,在会合机构中,一旦accept语句已执行,则调用者就不阻
12、塞,但RPC和会合机构是一样的,也是完全同步相互作用。一到多报文传送:很多用于分布计算系统的网络支持快速的广播或组通信设施,但不能保证所有的目的地收到报文。由于通信差错或某些接受处理机未准备好,报文可能会丢失。,18,2023/3/10,共享数据 分布进程的共享数据方法:分布式数据结构和共享的逻辑变量 分布式数据结构:这种数据结构可由若干进程同时处理。Linda语言使用元组空间(Tuple Space)的概念实现分布式数据结构。元组空间TS在概念上是一个共享存储器,TS是为程序的所有进程共享的全局存储器,TS的基本存储单元是元组,是有序的数据序列,类似PASCAL中的记录,例如“jones”,
13、31,true是一个有三个段的元组:一个字符串、一个整数和一个布尔值。对TS定义了三个原子操作:out操作向TS加入一个元组,read读TS中的一个元组,in读TS中的一个元组并删除它。,19,2023/3/10,共享的逻辑变量:逻辑变量具有“单赋值”性质,最初它们是未赋值的,但一旦它们接收一个值就不能再被改变,这一性质可能在共享逻辑变量的并行进程之间引起冲突。下面的例子出示了这些变量如何被用于进程之间的通信通道。假设三个目标:goal_1(X,Y),goal_2(X,Y),goal_3(X)进行逻辑乘,用进程P1、P2、P3并行求解。变量X是这三个进程的通信通道,最初是未赋值的。如果三个进程
14、中的某个给X赋值,则其它两个进程可使用此值。类似地,Y是P1和P2的通信通道,进程同步通过在无约束变量上挂起达到。,20,2023/3/10,非确定性的表示和控制 进程之间的相互作用模式并不总是确定性的,有时还决定于运行时条件,因此需要研究表示和控制非确定性模型。选择语句和保护的(guarded)Horn子句是两种分开的控制非确定性结构。选择语句:它是由如下形式的一组保护命令组成的:保护语句 其中保护(guard)由一个布尔表达式和某一类“通信请求”组成。布尔表达式必须无副作用,因为它可能在执行该选择语句过程中被计算多次。,21,2023/3/10,保护的Horn子句:逻辑程序本质上就不是确定
15、性的。并行逻辑语言并行地搜索所有子句,并且在这些并行执行期间直到有一个并行执行提交前不允许任何赋值对外部是可见的,这叫做OR并行性。但是,这不能无限地进行,因为并行工作的搜索路径随证明的长度而指数地增长。很普遍的控制OR并行性技术是提交选择非确定性,它非确定地选择一个可选择的子句,并取消其他子句,它是基于保护的Horn子句,形式如下:A:-G1,Gn|B1,Bmn0,m0目标Gi的合取(与操作)叫做保护,目标Bi的合取叫做体(body)。提交操作符“|”也是一个合取操作符。,22,2023/3/10,3.4 逻辑上分布地址空间的语言,23,2023/3/10,同步式报文传递语言1978年,Ho
16、are提出CSP语言。CSP提供简单的并行命令创建固定数目的并行进程。进程包含名字、逻辑变量和一系列语句(进程体)。CSP不使用参数,也不能变换到制定的处理机上。CSP可以创建一组相似的进程,但其数目必须在编译时是个常数。CSP进程不能使用全局变量相互通信,只能使用同步的receive和send。发送进程指出接收进程的名字,提供一个待发送的值。接收进程指出发送进程的名字并提供一个变量。执行send或receive的进程受阻,一直到其对方执行完互补的语句为止。,24,2023/3/10,简单数据和有结构的数据均可传送与赋值,只要发送的值与接收它的变量类型相同。可给有结构的数据一个名字(构造符)。
17、CSP中使用alternative结构表示非确定性,它由一组保护(后面跟着待执行的动作)组成。保护可包含布尔表达式和一个输入语句。CSP允许进程根据当前通信的输入和名字段的信息有选择地接收。,25,2023/3/10,异步式报文传递语言NIL(Network Implementation Language)是一种高级语言,用于构造大型、可靠的分布式软件系统。它是一种安全的语言,即一个程序模块不影响其他模块的正确性。该语言的原理是基于“类型状态”的,这是一个编译时特性,它能获得变量的类型和其初始状态。NIL中的并行性是基于所谓进程模型。进程不仅是并行性的单位,也是模块化的单位。把NIL程序分解为
18、进程是根据软件工程的原理,而不是基于性能的考虑。进程到处理机变换是实现上的问题,由编译和运行时系统处理。,26,2023/3/10,NIL可动态地进行进程间通信路径的配置。NIL中的信口是一个排队的通信通道。在给定时间,一个信口有一个指定的所有者。所有者关系可以转让给其他进程,可以把信口作为报文的一部分传送,或把信口作为一个新创建进程的初始化参数传送。进程可以连接其拥有的输入口和输出口。NIL既支持同步通信也支持异步通信,可把单个输入口连接到几个输出口,所以在输入口可以有多个挂起的报文,因而必须排队。NIL提供一个保护命令风格的语句用于在任何输入口上等待报文。,27,2023/3/10,基于会
19、合的语言Ada并行性是基于顺序进程,叫作任务(task),每个任务具有一定的类型。任务由说明部分(说明其他任务如何与其通信)和一个体(包含它的可以执行的语句)组成。任务通常通过会合机制通信,也通过共享变量通信,会合机制基于项说明、项调用和接受语句。Ada使用select语句表示非确定性。这个语句用于三个目的:从一组未处理的请求中非确定地选择一个项调用;有条件地调用一项(即仅当被调用的任务准备好立即接受它)和为一个项调用设置时限。Ada有一个异常处理机制处理软件故障,但语言定义未说明硬件故障问题。,28,2023/3/10,并发C并发C中的进程有一个说名部分和一个体,说名部分由进程名、一组形参和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Chapter3 分布式 程序设计语言
链接地址:https://www.desk33.com/p-236223.html