第8章动态规划第1,2节.ppt
《第8章动态规划第1,2节.ppt》由会员分享,可在线阅读,更多相关《第8章动态规划第1,2节.ppt(77页珍藏版)》请在课桌文档上搜索。
1、1,第1节 多阶段决策过程及实例第2节 动态规划的基本概念和基本方程,运筹学(第三版)运筹学教材编写 组第8章 动态规划的基本方法清华大学出版社,2,第8章 动态规划的基本方法,第1节多阶段决策过程及实例第2节 动态规划的基本概念和基本方程第3节 动态规划的最优性原理和最优性定理第4节 动态规划和静态规划的关系,3,动态规划(Dynamic Programming)是运筹学的一个重要分支,它是解决多阶段决策过程最优化的一种方法。美国数学家贝尔曼(R.E.Bellman)等人在50年代初提出了解决多阶段决策问题的“最优性原理”(Principle of Optimality)。1957年贝尔曼出
2、版了专著“动态规划”,该书是动态规划的第一本著作。目前动态规划已经用于解决最优路径问题、资源分配问题、生产调度问题、设备更新问题、复合系统可靠性问题及生产过程最优控制等,并且取得了显著的效果。,4,动态规划是用来解决多阶段决策过程最优化的一种数量方法。其特点在于,它可以把一个n 维决策问题变换为几个一维最优化问题,从而一个一个地去解决。需指出:动态规划是求解某类问题的一种方法,是考察问题的一种途径,而不是一种算法。必须对具体问题进行具体分析,运用动态规划的原理和方法,建立相应的模型,然后再用动态规划方法去求解。,5,第1节多阶段决策过程及实例,在生产经营活动中,某些问题决策过程可以划分为若干相
3、互联系的阶段,每个阶段需要做出决策,从而使整个过程取得最优。,6,各个阶段不是孤立的,而是有机联系的,也就是说,本阶段的决策将影响过程下一阶段的发展,从而影响整个过程效果,所以决策者在进行决策时不能够仅考虑选择的决策方案使本阶段最优,还应该考虑本阶段决策对最终目标产生的影响,从而做出对全局来讲是最优的决策。多阶段决策问题中,各个阶段一般是按照时间来划分的,随着时间的发展而产生各个阶段的决策,从而形成决策序列,这就是动态的含义。,7,在一些与时间无关的静态问题中(如非线性规划等),可以人为地赋予时间的概念,使其成为一个多阶段决策问题,再用动态规划方法处理。当每个阶段的决策确定以后,全部过程的决策
4、就是这些阶段决策所组成的一个决策序列,所以多阶段决策问题也称为序贯决策问题。,8,例1 最短路线问题,给定一个线路网络,两点之间连线上的数字表示两点之间的距离(或费用),试求一条由A到G的铺管线路,使总距离为最短(或总费用最小)。,9,例2.机器负荷分配问题,某种机器可以在高低两种不同的负荷下进行生产。在高负荷下进行生产时,产品的年产量g和投入生产的机器数量u1的关系为g=g(u1),这时,机器的年完好率为a,即如果年初完好机器的数量为u,到年终完好的机器就为au,0a1。在低负荷下生产时,产品的年产量h和投入生产的机器数量u2的关系为 h=h(u2),相应的机器年完好率b,0 b1。假定开始
5、生产时完好的机器数量为s1。要求制定一个五年计划,在每年开始时,决定如何重新分配完好的机器在两种不同的负荷下生产的数量,使在五年内产品的总产量达到最高。,10,第2节 动态规划的基本概念和基本方程,11,例1图8-2 p.192,12,当某阶段的始点给定时,它直接影响后面各阶段的进行路线和整个路线的长短,而后面各阶段的路线的发展不受这点以前各阶段线路的影响。(无后效性)问题要求:在各阶段中选取一个恰当的决策,使由这些决策组成的一个决策序列所决定的一条路线,其路程最短。穷举法2*3*2*2*2*1=48,13,2.1 动态规划的基本概念,1阶段(Stage)根据所需解决问题的特点,按照时间或空间
6、顺序把整个过程划分为若干相互联系的阶段,以便按照一定次序求解。描述阶段的变量称为阶段变量,通常用k表示。,14,2.状态(State)状态表示各阶段开始所处的自然状况或客观条件,它既是某阶段过程演变的起点,又是前一阶段某种决策的结果。描述状态的变量称为状态变量,常用Sk表示第k阶段的状态变量。S1=AS2=B1,B2S3=C1,C2,C3,C4无后效性(即马乐科夫性)系统从某个阶段往后的发展演变,完全由系统本阶段所处的状态及决策所决定,与系统以前的状态及决策无关。只有具有无后效性的多阶段决策过程才适合于用动态规划方法求解。,15,3.决策(Decision),当各阶段的状态选定以后,可以做出不
7、同的决定(或选择)从而确定下一个阶段的状态,这种决定(或选择)称为决策。表述决策的变量称为决策变量uk(sk)表示第k阶段当状态为sk时的决策变量。允许决策集合决策变量的取值范围,Dk(sk)uk(sk)Dk(sk)如D2(B1)C1,C2,C3,若从B1出发选取C2,则C2是状态B1在决策u2(B1)作用下的一个新的状态,记为u2(B1)=C2,16,4.策略(Policy),策略是一个按顺序排列的决策组成的集合。当各个阶段的决策确定以后,各阶段的决策形成的一个决策序列最优策略使系统达到最优效果的策略k后部子过程(或称为k子过程)在n阶段决策过程中,从第k阶段到终止状态的过程k后部子过程策略
8、,简称子策略k后部子过程相应的决策序列,记为pk,n(sk),即:pk,n(sk)=uk(sk),uk+1(sk+1),un(sn)全过程策略,简称策略,当k=1时,即由第一阶段某个状态出发做出的决策序列记为p1,n(s1)即:p1,n(s1)=u1(s1),u2(s2),un(sn),17,5.状态转移方程(State Transfer Equation),状态转移方程表示从第k阶段到第k+1阶段状态转移规律的方程,它反映了系统状态转移的递推规律。设第k阶段状态为sk,做出的决策为uk(sk),则第k+1阶段的状态sk+1随之确定,即:sk+1=Tk(sk,uk)Tk称为状态转移函数确定状态
9、转移方程是建立动态规划的难点之一。,18,图示如下:,状态转移方程是确定过程由一个状态到另一个状态的演变过程。如果第k阶段状态变量sk的值、该阶段的决策变量一经确定,第k+1阶段状态变量sk+1的值也就确定。,其状态转移方程如下(一般形式),能用动态规划方法求解的多阶段决策过程是一类特殊的多阶段决策过程,即具有无后效性的多阶段决策过程。,19,如果状态变量不能满足无后效性的要求,应适当地改变状态的定义或规定方法。,动态规划中能处理的状态转移方程的形式。,状态具有无后效性的多阶段决策过程的状态转移方程如下,无后效性(马尔可夫性),如果某阶段状态给定后,则在这个阶段以后过程的发展不受这个阶段以前各
10、段状态的影响;,过程的过去历史只能通过当前的状态去影响它未来的发展;,构造动态规划模型时,要充分注意是否满足无后效性的要求;即状态变量要满足无后效性的要求;,20,6.指标函数和最优指标函数,指标函数衡量所选策略优劣的数量指标。它是定义在全过程和所有后部子过程上确定的数量函数,常用Vk,n表示,即:Vk,n=Vk,n(sk,uk,sk+1,uk+1,,sn+1)动态规划数学模型的指标函数应该具有可分离性,并满足递推关系,即:Vk,n(sk,uk,sk+1,uk+1,,sn+1)=ksk,uk,Vk+1,n(sk+1,uk+1,,sn+1),21,常见的指标函数形式有两种,(1)任一后部子过程的
11、指标是它所包含的各阶段指标的和,即:Vk,n(sk,uk,sn+1)=写成递推关系:Vk,n(sk,uk,sn+1)=vk(sk,uk)+Vk+1,n(sk+1,uk+1,sn+1)其中vk(sk,uk)为第j阶段的阶段指标(2)任一后部子过程的指标是它所包含的各阶段指标的积,即:Vk,n(sk,uk,sn+1)=写成递推关系:Vk,n(sk,uk,sn+1)=vk(sk,uk)Vk+1,n(sk+1,uk+1,sn+1),22,最优值函数指标函数的最优值,记为fk(sk),它表示从第k阶段状态sk出发到第n阶段的终止状态的过程,采取最优策略所得到的指标函数值,即:opt 是英文optimiz
12、ation(优化)的缩写,可根据题意取max或min。在不同的问题中,指标函数可以是利润、成本、距离、产品质量或资源消耗等。在最短路线问题中,第k阶段的指标函数vk(sk,uk)通常也用dk(sk,uk)表示。,23,小结:,指标函数形式:,和、,积,无后效性,可递推,24,2.2动态规划的基本思想与基本原理,结合例1的最短路线问题来阐述动态规划的基本思想。,25,最短路线重要特性,如果由A点经B点到C点是一条最短路线,那么从B点到C点的这条子路线必定是从B点到C点的所有路线中最短的一条路线。所以求解最短路问题,就可以从最后一段开始,由后向前逐步递推,逐段求各点到终点的最短路线,每段都要用到上
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 章动 规划
链接地址:https://www.desk33.com/p-751389.html