最优控制PROJECT.docx
最优控制PROJECT对单级倒立摆系统进行控制的研究组别:第二小组成员:余凯刘姓陶敬导师:管晓宏专业:系统工程班级:硕325/硕330院所:西安交通大学系统工程研究所日期:2004.05.18二、单级倒立掘余统挂制问题的提出-3三、单级倒立握乐院挂制问题的分析一4四、对单级倒立旗东统进行控制并利用SlMU1.lNK进行仿真8*不同控制C调节)方景的比较54M、本次Project与实标中对单级例立掘东统进行越制的区别55七、工作情况和心存体会-56八、感谢和小结56对单级倒立摆系统进行控制的研究一、倒立41余统简介1 .引言倒立摆系统是一个典型的高阶次、多变量、严重不稳定和强耦合的非线性系统。由于它的行为与火箭飞行以及两足机器人行走有很大的相似性,因而对其研究在理论上、实践上和方法论上具有重大意义。由于倒立摆系统本身所具有的上述特点,使它成为人们深入学习、研究和证实各种控制理论有效性的实验系统。对倒立摆系统进行研究可归结为对非线性多变量绝对不稳定系统的研究,其控制方法和思路对处理一般工业过程亦有广泛的用途。近年来,国内外不少专家学者对一级、二级倒立摆进行了大量的研究,有些研究人员对四级倒立摆系统进行了研究。人们试图寻找不同的控制方法实现对倒立摆的控制,以便检查或说明该方法对严重非线性和不稳定系统的控制能力。对倒立摆系统进行控制的研究如今已取得了巨大的成果,人们研究了闭环状态反馈极点配置、闭环输出反馈极点配置、1.QR线性二次型状态反馈最优控制、1.QY线性二次型输出反馈最优控制、PID控制、模糊控制、神经网络控制、拟人控制、专家控制以及多种控制理论的综合控制如基于神经网络的模糊控制、基于PID的模糊控制、基于遗传算法的模糊控制,模糊专家控制等等,已经对单级和二级倒立摆系统实现了较好的控制,有些研究人员还对四级倒立摆控制系统进行了成功地实验和开发.2 .倒立摆系统的图示卜.面我们来简要地看一下单级和二级倒立摆系统的图示(图1和图2):U图1单级倒立摆系统的图示图2二级倒立摆系统的图示以下我们仅研究对单级倒立摆系统的控制。二、单级倒立旗氽统旌制问题的援出1 .单级倒立摆系统的组成图3单级倒立摆系统如图3所示,单级倒立摆系统由一个可以在导轨上滑动的小车和一个可以绕小车中部的较接点的杆组成。我们设水平方向为X方向,小车的质量为M,杆的质量为m,杆的长度为21.,转动惯量为J,小车与地面的摩擦系数为b。杆的摆角为O,杆的角速度w,小车的位移为X,小车的速度为V。各种参数的具体数值如图中所标。2 .对单级倒立摆系统进行控制的目标我们对单级倒立摆系统进行控制的基本目标就是:使系统稳定,鲁棒性好,即系统受到扰动后能够较好的恢复到稳态。使系统的瞬态和稳态性能良好,即系统的调节过程应当迅速,振荡不要太强,并能较好地改善静态时的摆动现象。这即是要求对倒立摆系统进行控制后能够使杆的摆角稳定在垂直位置,即0=0,小车的位移也能够稳定在平衡位置(位移为零),即x=00在系统向稳态值进行调节的过程中,应当尽量迅速且振幅保持较小。同时,在系统受到干扰时能够很好地恢复到平衡状态。由此看来,我们要将单级倒立摆系统最终调回到各状态都为零的位置,因此从准确意义上讲,我们研究的是对单级倒立摆系统进行调节的问题。但是以后所介绍的内容也适用于对单级倒立摆系统进行控制的情况(终态位置各状态为某值),因此我们这里统一称作“对单级倒立摆系统进行控制”。三、单做倒立旗东统校制问题的分析1 .建立倒立摆系统的数学模型首先我们需要建立单级倒立摆系统的数学模型。如前面图5所示,需要对一个质量为M的小车进行控制,在小车上固定有一根长为21.的质量为m,且密度均匀的刚体摆杆,我们将水平向右设为X轴的正方向,竖直向上设为y轴正方向,记小车的位移为X,由此推得速度为北、加速度为无,记摆杆与y轴的角度为。,由此推得角速度为6、角加速度为小,同时我们假设小车与地面、小车与摆杆的摩擦力忽略不记,仅考虑与其速度相关的阻力f=b4io再将杆所受的力N分解为水平方向上的NX和竖直方向上的NY对小车在水平方向上进行受力分析可得:F=Mx+Fx-Vbx(1)对摆杆在水平方向上进行受力分析可得:j2Fx=m*(x÷2*sin)(2)将(2)式带入(1)式可得:F=+rn)x+bxtnl2sn+mlcos(3)再对摆杆相对于小车的转动进行分析可得:mlmg1.sinm1.xcos(4)我们将摆杆的转动范围限定在一个较小的范围内考虑-5。<6<5。,此时我们可以得到以下三个近似关系式:si。=Ocos夕=1炉=O由此对(3)、(4)进行线性近似可得:F=M÷ni)x+m1.+bxZTiZ?=mg1.mx1.(6)由(5)、(6)可以解出:.ml?F一ml3bx-m2l3x=77Tf(7)mE(M+m)-m1.(8)(M+m)ng1.+bmlxmlF将乂月夕例设为状态变量,通过(7)、(8)可以得出:010_.ml(M +m)-m2l000、"M_厂nl3(M +m)-n"l0ml(M-vri)- nrIj0(M + ni)mg1.nl(M + m)- m2l00mlml(M + m) - m2l 0-mlnl(M +m)- mil3XlOO司一oO1即整个倒立摆的线性近似数学模型。下面我们代入具体数值M=IKg、m=0.1KgNg=10NKg>2*1.=0.6m%b=0.1Nmsec后得到系统的状态方程:'x"01OOXOXO-0.094-0.353()X0.94OOOO1*+O*p(9a)O0.11912.941O-1.1762 .控制方案的提出对于单级倒立摆系统,我们可以采取多种经典的控制方法以及近代兴起的一些智能控制方法进行控制。我们观察单级倒立摆系统的数学模型结构如图4所示:图4单级倒立摆系统的开环结构可见,该结构是一个开环结构,系统的被控制量对系统的控制作用没有影响,不具备抗干扰能力。为了能够使单级倒立摆系统具备抗干扰能力,我们可以运用不同的控制方法,设计出一个闭环结构。 我们可以建立具有状态反馈的闭环结构。如下面图5所示:图5单级倒立摆系统具有状态反馈的闭环结构图5所示的是具有状态反馈的闭环结构。对应于这种闭环结构的控制方法有:闭环状态反馈极点配置法,1.QR线性二次型状态反馈最优控制法等。这些方法都需要依赖受控系统的线性数学模型。 我们可以建立具有输出反馈的闭环结构。如下面图6所示:图6单级倒立摆系统具有输出反馈的闭环结构图6所示的是具有输出反馈的闭环结构。对应于这种闭环结构的控制方法有:闭环输出反馈极点配置法,1.QY线性二次型输出反馈最优控制法等。这些方法也都需要依赖受控系统的线性数学模型。 我们可以建立具有PlD控制的闭环结构。如下面图7所示:图7单级倒立摆系统具有PID控制的闭环结构图7所示的是具有PlD控制的闭环结构。PID控制也需要依赖受控系统的线性数学模型。我们可以建立其它一些控制系统的闭环结构。如下面图8所示:图8单级倒立摆系统其它一些控制系统的闭环结构图8所示的是其它一些控制系统的闭环结构。对应于这种闭环结构的控制方法有:模糊控制、神经网络控制、拟人控制、专家控制等智能控制方法以及多种控制理论的综合控制如基于神经网络的模糊控制、基于PlD的模糊控制、基于遗传算法的模糊控制,模糊专家控制等等。这些方法不需要依赖受控系统的线性数学模型,可以直接根据单级倒立摆的物理模型进行控制。3 .控制方案的选择控制方案的选择是要根据对单级倒立摆系统进行控制后所产生的结果来分析比较最终选出最优的控制方案。比较分析的标准就是上面提到的进行控制的目标:哪个控制方案能够使杆的摆角稳定在垂直位置,即。=0,小车的位移也能够稳定在平衡位置,即X=0,且使系统向平衡位置进行调节的过程中迅速且振幅保持较小,同时在系统受到干扰时能够很好地恢复到平衡状态,哪个控制方案就较为优良。但是,我们所面对的往往是多目标优化问题,这就意味着要求多个目标都为最优。但这种情况是很难出现的,往往会由于优化了一个目标而牺牲了别的目标,因此我们只能根据要求提出一个折衷目标,进而求出一个折衷解。追求绝对最优控制是不现实的。8、对单级例立标亲线进行校南(明节)并利用SlMU1.INK进行仿宾我们首先利用Mat1.ab中的Simu1.ink工具对开环系统进行仿真。仿真结构如图9所示。该结构是一个开环结构,控制输入为一个随机干扰信号,它的期望值为零,方差为I,其信号波形如图io所示。系统的初始状态为0,即Xo=O;o;o;oF。我们认为系统的输出如果大于5即为饱和状态,因此我们加入了一个SatUratiOn模块。下面我们对其进行IOS的仿真,来观察系统输出的结果。>0图9开环系统仿真结构图图10随机干扰输入信号波形图11输出结果X和0(t)波形图11中,蓝线表示小车的位移X,绿线表示杆的摆角0。可见,它们均趋向于极限饱和状态,随着时间的推移,偏离稳态值越来越远,因此是不稳定,也不具备抗干扰能力的。那么为什么这个系统的开环结构是不稳定的呢?我们通过计算,可以得到该系统的零极点为:0,-0.0908,3.5958,-3.5990),可见其中有极点是正实数,因此这个系统是不稳定的。但是我们通过计算该系统的能控性矩阵可以发现,00.9400-0.08840.4213Q=B9AB,A2B,A3B=0.9400-0.08840.4213-0.07880-1.17000.1109-15.1514-1.17000.1109-15.15141.4851的秩为4=n,因此该系统是完全能控的。同时我们通过计算该系统的能观性矩阵可以发现,1.0000000001.00000"C'01.000000CA0001.0000CA20-0.0940-0.35300CA300.118012.9410000.00880.0332-0.35300-0.0111-0.041712.9410的秩为4=n,因此该系统是完全能观的下面我们选用闭环状态反馈极点配置法、1.QR线性二次型状态反馈最优控制法、1.QY线性二次型输出反馈最优控制法以及模糊逻辑控制法对该单级倒立摆系统进行控制,并利用SIMU1.lNK进行仿真。1.闭环状态反馈极点配置法闭环状态极点反馈实质上是对经典控制理论综合方法的一个直接推广。它的含义是:以一组期望极点为性能指标,对线性时不变受控系统综合一个状态反馈型的控制,使综合导出的控制系统特征值配置到更平面上的期望位置。由前面的计算可知,该单级倒立摆系统是完全能控的,因此可以对该系统的全部4个极点任意配置。由前所知,这个系统的极点有正实数,因此是不稳定的,为此我们需要将系统的特征值全部配置到负实半平面。通过指定期望极点,利用状态反馈极点配置的算法,计算出状态反馈矩阵K,进而构成反馈控制系统。我们知道,在极点配置中,期望极点选取的不同,会产生不同的调节性能指标。对于这个4维系统,它的期望极点有4个。但是其中离虚轴较近的两个是主导极点,而离虚轴较远的两个是副导极点。在副导极点距离虚轴的距离是主导极点距离虚轴的距离的4-6倍以上时,副导极点对系统调节的性能指标的影响就可忽略不计。而两个主导极点是一对共匏复数,它们具有如下的形式:5p52=-±yll-2,其中T是时间常数,J是阻尼系数,一般小于1。我们这里主要关心的是系统调节过程中的两个指标:超调量。和调节过程时间t。其中超调量是与J有关的:J越大,则系统调节过程中的超调量就越小。调节时间t在系统稳态误差取3%时,可由下式计算,t地为此我们在这里选取两组不同的期望极点:第一组期望极点P和利用MATA1.AB中的PIaCe()语句求出对应的状态反馈矩阵K为:p=-0.5±0.2/,-3.5±0.5/K=-0.3085-1.3375-28.0816-7.7919根据以上主导极点的表达式,我们可以计算出对应于这组期望极点的。为0.88。第二组期望极点p和利用MATA1.AB中的place语句求出对应的状态反馈矩阵K为:p=-0.5±z,-6±ZK=-3.9364-4.5276-56.8849-14.5935根据以上主导极点的表达式,我们可以计算出对应于这组期望极点的&为。390因为。专,这就意味着在我们对该系统进行调节的时候,以第一组期望极点所进行的极点配置在调节过程中的超调量应该比以第二组期望极点所进行的极点配置在调节过程中的超调量要小。同时我们也分别计算了两次不同极点配置状态反馈进行调节时的调节时间,第一次调节时间要比第二次调节时间略长。下面我们就对该系统利用MAT1.AB中的SIMU1.INK进行仿真,我们可以采取如图12和图13两种仿真结构:图12闭环状态反馈极点配置仿真结构图1图13闭环状态反馈极点配置仿真结构图2图13主要是为了直接利用State-SPaCe模块以使仿真结构简单明了,但为了不仅能够观察到系统的输出变量,还能够观察到系统的状态变量,我们将其输出变量扩展为1OOY= x X O 即可。O1O同时令输出矩阵C=O0OOO在以上仿真结构中我们使用的倒立摆系统的模型是已经线性近似化的数学模型,这就要求杆的摆角不能过大,应控制在5°以内,即-0.09”Ze0.09图同时我们假定,-0.1Srad/s0Srad/s,-0.5mx0.5m,-tns<xms下面我们对由这两组期望极点的极点配置法所构成的反馈控制系统分别进行仿真。我们假设倒立摆系统受到了一个干扰,偏离了稳态值。其状态变量变为0.10.20.020.01/,这就是我们仿真的初始状态变量X。我们对其进行20s的仿真。我们对系统调节的目的就是要使其返回到稳态值。为了方便直观的比较结果,我们对于相同的变量使用相同的坐标值和比例值。以第一组期望极点=-0.5±0.2i,-3.5±0.5i进行极点配置组成的反馈系统所得的仿真结果。图14,图15,图16,图17,图18分别是杆的摆角。,小车的位移X,杆的角速度w,小车速度v,控制力f的变化相应图。图14杆的摆角0变化响应图(极点配置1)图16杆的角速度w变化响应图(极点配置1)通过以上的结果我们可以看出,状态反馈极点配置可以在系统受到干扰偏离稳态值的情况下调节系统回到稳态值。对于瞬态性能,系统在调节过程中的震荡次数不是很多,超调量也不是很大。杆的摆角超调量约为0.02rad,即为小于1.5°,而小车位移几乎没有超调量。但是调节时间稍微有一些长,譬如小车的位置调整需要约IOs左右。对于稳态性能,通过放大的图形可以看出,它们的稳态误差都为10"单位级左右,是很小的。以第二组期望极点=H).5±i,-6±力进行极点配置组成的反馈系统所得的仿真结果。图19,图20,图21分别是杆的摆角0,小车的位移X,控制力f的变化相应图。图19杆的摆角变化响应图(极点配置2)图20小车的位移X变化响应图(极点配置2)图21控制力f变化响应图(极点配置2)通过以上的结果我们可以看出,以第二组极点进行配置后的状态反馈也可以在系统受到干扰偏离稳态值的情况下调节系统回到稳态值。与第一组极点的结果相互比较可以发现,对于瞬态性能,系统在调节过程中的超调量要大一些。杆的摆角超调量约为0.037rad(大于极点配置1的0.02rad),而小车位移的超调量约为0.05m。但是调节时间与极点配置相比1相比要短一些,譬如小车的位置调整需要约8s左右(小于极点配置I的IOs左右)。这些比较的结果与我们之前理论推出的结果也基本上是一致的,验证了理论结果的正确性。对于稳态性能,通过放大的图形可以看出,它们的稳态误差还是为10一7单位级左右,是很小的。由此我们可以看出,选择不同的极点进行配置得到的状态反馈系统在调节过程中的性能指标是有着差异性的。我们这次Project的目的仅仅是对各种控制方法有一个初步的了解和掌握,因此在这里仅仅是对其理论上的结果加以验证。在实际中,由于我们所处理的往往是多目标优化问题,例如对于倒立摆系统要求调节过程时间要短,超调量要小,振荡次数要少等等,并没有各个性能指标都为最优的那种解,往往会由于考虑了一个指标的最优而牺牲了另一个指标的品质,因此我们只能求得折衷解或称非劣解。因此当我们要对一个系统进行控制时,我们应该首先对系统调节过程的性能指标提出一个要求,譬如指出超调量的上限和调节时间的上限,然后根据这些指标通过极点配置的理论知识计算出期望的主导极点和副导极点,再进一步计算出反馈矩阵并实现反馈控制系统。最后实验仿真,反复调试,最终实现对一个系统的最优控制。下面我们对该系统加上一个微小的持续随机干扰信号,其信号波形如图10所示,这就意味着系统始终受到一个随机干扰。我们对第一组极点配置所得到的状态反馈控制系统进行仿真。我们依然认为在初始时,系统受到了一个干扰而偏离了稳态值,即X0=0.10.20.020.01zo图22,图23,图24,图25,图26分别是杆的摆角。,小车的位移X,杆的角速度W,小车速度V,控制力f的变化响应图。图22带有随机干扰的杆的摆角0变化响应图图24带有随机干扰的杆角速度w变化响应图图25带有随机干扰的小车速度V变化响应图通过以上的结果我们可以看出,在系统受到微小的持续随机干扰的情况下,以极点配置状态反馈构成的反馈系统也可以在系统受到干扰偏离稳态值的情况下调节系统回到稳态值。系统调节的瞬态性能与没有持续随机干扰时的情况基本相同。对于稳态性能,则要稍差一些。通过放大的图形可以看出,它们的稳态误差基本都保持在5%左右,是可以接受的。2.1.QR线性二次型状态反馈最优控制法线性二次型(1.Q-1.inearQUadratiC)是指系统的状态方程是线性的,指标函数是状态变量和控制变量的二次性。线性二次型控制理论已成为反馈系统设计的一种重要工具。其特点是:它为多变量反馈系统的设计提供了一种有效的分析方法;它可以适用于时变系统;它可以处理扰动信号和测量噪声问题;它可以处理有限和无限的时间区间。对于线性连续系统,提出二次型目标函数,叫n=(O)SX(U)+;/(f)QQ)x(f)+/(f)R(f),s.t.x(t)=A(r)x(r)+B(t)u(tx4)=x0式中,R(t)正定,Q(t)及S半正定。f°J固定。我们设R。),Q及S为对称阵。可以看出,这是一个BOlza问题的特例,称为线性二次型问题。我们研究的是调节器,即1.QR(1.Q-1.inearQuadraticRegUIator)问题。1.QR问题正是表示了这样一种物理概念:若系统受外界扰动,偏离稳态值(零状态)后,应施加怎样的控制u,使系统回到稳态值,并满足二次型目标函数为最小。二次型目标函数的第一项g(")网内)表示稳态误差,S为其加权矩阵:第二项IyQ)。M)W表示暂态误差的总度量,Q为其加权矩阵且是时变的;第三项;6(f)R(f)“表示暂态过程中消耗的控制能量总和,R为其加权矩阵且是时变的。由此可以看出,1.QR目标函数鲜明地提出了稳态误差,暂态误差的总度量以及消耗控制能量最小。由于它并没有对系统的输出提出要求,因此我们称其为线性二次型状态调节器.1.QR问题的提法有普遍意义,不限于哪种物理系统,且这样的提法易获得解析解,还可以得到线性反馈结构。同时1.QR提供一种统一的框架,把经典设计统一于其中。1.QR适用于线性系统,对于小信号下运行的非线性系统,可作为一次近似加以应用,因此我们可以将1.QR应用于前面已经近似的单级倒立摆系统的线性数学模型。这里我们令ff8,即考虑无限时间1.QR状态调节器。这样就没有稳态误差这一项,即S=O,因为对于渐进稳定系统,稳态误差自然为零。这样无限时间1.QR状态调节器的目标函数就退化为:min+,tfo进一步我们选择加权矩阵Q,R均为时不变的。由前讨论所知,该系统完全能控且能观,因此其P(t)=P=constant,且为下列矩阵Riccati方程的解:一P4-"P+尸历?一必丁尸一。=0。最终我们可以求出其Kalmen增益为K=RTB/P,其最优控制二中如丁公。这些计算过程都可以由MAT1.AB来完成。下面我们就对该系统利用Mat1.ab中的Simu1.ink进行仿真,我们依然可以采取如前面图12和图13所示的两种仿真结构对1.QR所构成的反馈控制系统进行仿真。这里依然假设倒立摆系统受到了一个干扰,偏离了稳态值。其状态变量变为0.10.20.020.017,这就是我们仿真的初始状态变量X。我们对其进行20s的仿真。我们对系统调节的目的就是要使其返回到稳态值。为了方便直观的比较结果,我们对于相同的变量使用相同的坐标值和比例值。1.QR1:我们首先选择如下所示的加权矩阵对该系统进行1.QR调节:Q=l000;0000;00I0;OooO,R=l。利用MAT1.AB中的Iqro语句就可以计算出其对应的反馈矩阵K:K=-1.0000-2.1480-31.8896-8.9086。图27,图28,图29,图30,图31分别是杆的摆角0,小车的位移x,杆的角速度w,小车速度V,控制力f的变化响应图。图27杆的摆角变化响应图(1.QRl)图28小车的位移X变化响应图(1.QRl)图29杆角速度W变化响应图(1.QRl)图31控制力f变化响应图(1.QRl)通过以上的结果我们可以看出,1.QR状态反馈也可以在系统受到干扰偏离稳态值的情况下调节系统回到稳态值。对于瞬态性能,系统在调节过程中的震荡次数不是很多,超调量也不是很大。杆的摆角超调量约为0.03rad,即为小于2°,而小车位移几乎没有超调量。但是调节时间较之前面的两次极点配置要短一些,约为6s左右。对于稳态性能,通过放大的图形可以看出,它们的稳态误差都为10单位级左右,依然是很小的。与极点配置中期望极点的选择一样,在1.QR调节中,选择不同的加权矩阵Q,R,就会使系统调节的性能指标产生差异。当我们对系统的某个分量加更大的权时,意味着我们对其性能指标更为重视,也往往使其性能指标更为优良。为了观察加权矩阵Q,R对于系统调节性能指标的影响,我们以下再选取三组不同的Q,R矩阵,计算出对应的反馈矩阵K,并构成状态反馈系统,在与1.QRl同样的初始状态下进行仿真,加以比较结果。1.QR2:我们选择如下所示的加权矩阵对该系统进行1.QR调节:Q=Uoo0;OIOOO0;0010;000100,R=lo利用MAT1.AB中的Iqro语句就可以计算出其对应的反馈矩阵K:K=-1.0000-10.8251-85.7397-26.13241.QRl:1.QR2:Q=l000;0000;0010;0000Q=l000;010()00;00I0;000100R=UR=lK=-1.0000-2.1480-31.8896-8.9086JK=-1.0000-10.8251-85.7397-26.1324与1.QRl中的加权矩阵Q,R相比,1.QR2中我们对Q作了变化,对杆角速度W和小车速度V加大了权重,这就意味着我们更注重这两个分量的性能指标。图32,图33,图34,图35,图36分别是1.QRl与1.QR2杆的摆角。,小车的位移x,杆的角速度w,小车速度v,控制力f的变化响应图。其中左边为1.QRl的结果图,右边为1.QR2的结果图。图32杆的摆角0变化响应图(1.QRl与1.QR2比较)图33小车位移X变化响应图(1.QRl与1.QR2比较)图34杆角速度W变化响应图(1.QRl与1.QR2比较)图35小车速度V变化响应图(1.QRl与1.QR2比较)通过以上的结果我们可以看出,1.QR2状态反馈可也以在系统受到干扰偏离稳态值的情况下调节系统回到稳态值。对于瞬态性能,我们观察杆的摆角O和小车位移变化响应图可以发现,1.QR2较之1.QRI的调节过程更为缓慢,其响应曲线也较为平缓(导数或斜率较小)。这就意味着1.QR2调节过程中的杆角速度和小车速度V较小。我们直接观察杆角速度和小车速度V的响应曲线也可以发现,1.QR2的性能指标显然好于1.QR1,譬如:1.QR2中的杆角速度W的超调量只有0.05rads,调节时间只有约为2s,优于1.QRlfi<JO.lrad/s和4s;1.QR2中的小车速度V的超调量只有约0.02ms,调节时间只有约为2s,优于1.QRl中的0.15ms和6s。这些正是由于我们重视了杆角速度和小车速度V的性能指标的结果。但与此同时,我们发现控制量的性能指标却变差。1.QR2中的控制力f的初始峰值约为5N,超调量约0.5N,劣于1.QRI中的约2N和约0.3No1.QR3:我们选择如下所示的加权矩阵对该系统进行1.QR调节:Q=U000;000010O10;0000,R=100o利用MAT1.AB中的Iqro语句就可以计算出其对应的反馈矩阵K:K=-0.1000-0.6363-24.8343-6.9173。1.QR3:Q=l0 0 0;0 0 0 0 ;0 0 1 0 ;0 0 0 0R=100K=-0.1000 -0.6363 -24.8343 -6.91731.QRl:Q=l000;0000;00I0;0000R=lK=-1.0000-2.1480-31.8896-8.9086与1.QRI中的加权矩阵Q,R相比,1.QR3中我们仅对R作了变化,对调节过程中的消耗的控制能量加大了权重,这就意味着我们更注重控制力f的性能指标。图37,图38,图39分别是1.QRl与1.QR3杆的摆角0,小车的位移X,控制力f的变化响应图。其中左边为1.QRl的结果图,右边为1.QR3的结果图。图37杆的摆角O变化响应图(1.QRI与1.QR3比较)图38小车位移X变化响应图(1.QRl与1.QR3比较)1。12u =Q61820 5O 246810府 1618 JO图39控制力f变化响应图(1.QRI与1.QR3比较)通过以上的结果我们可以看出,1.QR3状态反馈也可以在系统受到干扰偏离稳态值的情况下调节系统回到稳态值。对于瞬态性能,我们观察控制力f变化响应图可以发现,1.QR3的暂态性能指标明显好于1.QR1,譬如:1.QR3中的控制力f的峰值约为1N,超调量几乎没有,调节时间只有约为1s,优于1.QRl中的约2N,约-0.4N和3s;这正是由于我们重视了调节过程中消耗的控制能量性能指标的结果。1.QR4:我们选择如下所示的加权矩阵对该系统进行1.QR调节:Q=IOOOO0;0OO0;0000;0000J,R=lo利用MAT1.AB中的lqr()语句就可以计算出其对应的反馈矩阵K:K=-10.0000-10.4002 -63.9831 -I7.99111.QRl:Q=l 000;0000 ;00 1 0;0000R=LUK=-1.0000 -2.1480 -31.8896 -8.9086J1.QR4:Q=1(X)0 0 0;0 0 0 0 ;0 0 I 0 ;0 0 0 0R=lK=-l 0.0000-10.4002 -63.9831 -17.9911 与1.QRI中的加权矩阵Q,R相比,1.QR4中我们对Q作了变化,对小车位移X加大了权重,这就意味着我们更注重这个分量的性能指标。图40,图41,图42分别是1.QRl与1.QR4杆的摆角0,小车的位移X,控制力f的变化响应图。其中左边为1.QRl的结果图,右边为1.QR4的结果图。图40杆的摆角0变化响应图(1.QRl与1.QR4比较)图41小车位移X变化响应图(1.QRl与LQR4比较)图42控制力f变化响应图(1.QRl与1.QR4比较)通过以上的结果我们可以看出,1.QR4状态反馈也可以在系统受到干扰偏离稳态值的情况下调节系统回到稳态值。对于瞬态性能,我们观察小车位移X变化响应图可以发现,1.QR4的暂态性能指标明显好于1.QR1,譬如:1.QR4中的小车位移X的调节时间只有约为2s,优于1.QRl中的6s;这正是由于我们重视了小车位移X的性能指标的结果。但是正是由于我们重视了小车位移X的性能指标,相对来说就忽视了杆的摆角O的性能指标,譬如:1.QR4中的杆的摆角的超调量有0.07rads,劣于1.QRI中的O.O3rads;同时,我们发现控制量的性能指标变差。1.QR4中的控制力f的初始峰值约为5N,超调量约I.7N,调节时间约3s,劣于1.QRl中的约2N,约0.3N和2s。通过以上所作的大量的仿真试验,我们可以看出加权阵Q、R与性能指标间有如下关系: 当Q阵中某一分量的权值增大时,与其相对应的分量的暂态响应过程好转,调节时间显著下降,系统快速性得到明显提高;与此同时,也引进了一些振荡,而控制量的幅值明显增大。这表明要求输入能量增大,即要提高暂态性能,必须以比较大的能量消耗为代价。 当R(t)阵中某一元素的权值增大时控制量幅值显著减小,表明能量消耗随R(t)增大而减小,其对应的暂态性能指标有所改善,但并不显著。由以上分析可得Q、R(t)阵选取时应遵循的基本原则为::如果想提高控制的快速响应特性,则可增大Q(t)中相应分量的比重;如果想有效地抑制控制量的幅值及其引起的能量消耗,则可提高R(t)中相应分量的比重;Q(t)、R的选择是相互制约的。以上得到的是改变加权矩阵Q,R对于不同分量加权时所产生的性能指标上的差异,下面我们来看一下当加权矩阵Q,R中的其中一个值进行变化时,系统的性能指标的变化是否会产生很大的不连续性。这就需要我们假定加权矩阵Q,R中的其中一个值从小到大变化时,譬如从0起,每次加1直到100,来观察系统各状态分量在系统调节过程中的性能指标的变化是否连续。但由于这里篇幅的限制,我们以反馈矩阵K的变化是否连续来代替系统各状态分量在系统调节过程中的性能指标的变化是否连续。我们可以得到结果如图43,图44,图45,图46,图47所示:反愦矩阵随加权矩阵Q变化的图示(Gm从0到IOo)-10-20-30-40-50卸-70叫WqPg>il果强魅102030405060708090100加权矩阵Q中的QIl分量图43反馈矩阵K随加权矩阵Q变化的图示(QIl从。到100)反馈矩阵K随加权矩阵Q变化的图示(Q22从口到10。)102030405060708090100加权矩阵Q中的Q22分量口-10-20-30加-50-60-70-80-90图44反馈矩阵K随加权矩阵Q变化的图示(Q22从0到100)图44表示当对小车速度V的暂态误差权重逐渐增大时,反馈矩阵K的变化情况。图43表示当对小车位移X的暂态误差权重逐渐增大时,反馈矩阵K的变化情况。反愦矩阵K随加权矩阵Q变化的图示(Q33从口到100)102030405060708090100加权矩阵Q中的Q33分量口-5-10-15-20-25-30-35-40图45反馈矩阵K随加权矩阵Q变化的图示(Q33从0到100)图45表示当对杆的摆角0的暂态误差权重逐渐增大时,反馈矩阵K的变化情况。反馈矩阵K随加权矩阵Q变化的图示(Q44从O到100)102030405060708090100加权矩阵Q中的Q44分量-5-10-15-20-25-30-35-40-45图46反馈矩阵K随加权矩阵Q变化的图示(Q44从0到100)图46表示当对杆角速度w的暂态误差权重逐渐增大时,反馈矩阵K的变化情况。图47反馈矩阵K随加权矩阵Q变化的图示(QIl从O到100)图47表示当对消耗的控制能量的权重逐渐增大时,反馈矩阵K的变化情况。通过以上的结果可以看出,对于1.QR线性二次性状态反馈调节器,当我们逐渐改变其加权矩阵Q,R的某一权重值时,其引起的反馈矩阵K的变化基本上是连续的,没有一些很大的跳跃,这也就说明了其调节过程的性能指标的变化是连续的。下面我们对该系统加上一个微小的持续随机干扰信号,其信号波形如图10所示,这就意味着系统始终受到一个随机干扰。我们对由1.QRl所得到的状态反馈控制系统进行仿真。我们依然认为在初始时,系统受到了一个干扰而偏离了稳态值,即X0=0.10.20.020.01图48,图49,图50,图51,图52分别是杆的摆角9,小车的位移X,杆的角速度W,小车速度V,控制力f的变化响应图。图48带有随机干扰的杆的摆角变化响应图图49带有随机干扰的杆的小车位移X变化响应图图51带有随机干扰的小车速度V变化响应图通过以上的结果我们可以看出,在系统受到微小的持续随机干扰的情况下,以1.QR状态反馈构成的反馈系统也可以在系统受到干扰偏离稳态值的情况下调节系统回到稳态值。系统调节的瞬态性能与没有持续随机干扰时的情况基本相同。对于稳态性能,则要稍差一些。通过放大的图形可以看出,它们的稳态误差基本都保持在5%左右,是可以接受的。3.1.QY线性二次型输出反馈最优控制法对于线性连续系统,提出二次型目标