按关键词阅读: 动态 动态规划法 课件 PPT 规划
由此可见 , 一般情况下 , 多级决策过程包括两个过程:倒向“建档”及顺向“查档” , 而大量的计算工作是花费在建立“档案库”上,二、最优性原理,在前例的分级决策过程中 , 实际上已应用了这样一个基本原理:设一个过程由 点开始 , 经 点到达 点 , 如图9-2所示 , 如果 为最优过程 , 则 段也必定是一个最优过程 。
7、 。
我们把这原理叙述如下,一个最优决策具有这样的性质 , 不论初始状态和初始决策怎样, 其余的决策对于第一次决策所造成的状态来说 , 必需构成一个 最优决策 。
称此为最优性原理 。
它也可简单地叙述为:最优轨迹的第二段 , 本身亦是最优轨迹,最优性原理是动态规划法的基础和核心 。
动态规划法就是对一个多级过程 , 应用最优性原理 , 进行分级决策 , 求出最优控制的一种数学方法,3、 多级决策过程的函数方程,应用动态规划法求解过程的最优决策时 , 首先要根据最优性原理将多级决策过程表示成如下数学表达式,9-1,上式表明 , 为使 级决策过程达到最小消耗 , 第一级决策应根据两部分消耗之和最小的原则作出 。
第一部分 是第一级决策的一步消耗 , 第二 。
8、部分 为由下一步到达点 作起点至终点的最小消耗 。
式(7-1)称为多级决策过程的函数方程 , 它是最优性原理的数学表达形式 。
在上述路线问题中 ,至 的四级决策过程的函数方程可表示成,9-2,由表7-1可知,第二节 动态规划法解离散系统的 最优控制问题,设系统状态方程为,式中 ,为 维状态向量 ,为 维控制向量 , 设 为每一步转移中的性能指标,9-3,第一步 , 系统初始状态 在 作用下转移至, 即,要求选择控制, 使 达最小 。
这是一个一级决策过程,9-4,9-6,第二步 , 系统在 作用下由 转移到, 转移中的性能指标为, 则两步转移的总性能指标为,这里 , 因为 已知 , 而, 因此在上述两步转移的总性能指标中 , 只 。
9、有 及 未知 。
现在要求选择 及, 使两步性能指标达极小 。
这就是二级决策问题,依次类推 , 系统状态由 作起点进行 步转移 , 则 步转移的总性能指标为,现在要求选择 使性能指标 达最小 , 这就是 级决策问题 。
我们可以应用动态规划法来求解 。
根据最优性原理 , 对 级最优决策过程来说 , 不论第一级控制向量 怎样选定 , 余下的 级过程 , 从 产生的状态 作为起点 , 必须构成 级最优过程,9-7,如果我们用 表示 级过程的性能指标的极小值 ,表示 级过程性能指标的极小值 , 则我们就可以列写出级决策过程的函数方程为,由此可见 , 第一级决策实质上是函数,对第一级的控制决策 求极值的问题 。
求解递推方程(9-8) , 就可解得最优控制决策 。
10、,9-8,例9-1 设离散系统状态方程为,初始条件为, 控制变量 不受限制 , 性能指标为,求最优控制, 使 达最小,解: 为简单起见 , 设, 则这是一个二步控制问题 , 性能指标 可表示成,首先考虑最后一步 , 即由某状态 出发到达 的一步 , 如采用控制, 则有,或,求最优控制使 为极小, 则有,解得,可见 为 的函数 。
相应的最优性能指标及 为,再考虑倒数第二步 , 即由初始状态 出发到达 的一步 , 如采用控制, 则有,令,有,相应的最优性能指标及 为,最后得最优控制为,最优轨线为,最优性能指标为,上述离散型动态规划可近似地用来求解连续系统的最优控制问题,设连续系统状态方程为,9-9,给定 , 性能指标为,9-10, 。
11、9-11,求最优控制, 使 为最小,由于函数方程是一个递推方程 , 故特别适合于求解离散系统的最优控制问题 。
为此要把连续过程问题转化成一个多级决策过程 。
首先将时间间隔 分成 段 , 每段为, 为使尽量符合连续过程的实际情况 ,应取足够大 ,取足够小 。
接着应将连续状态方程进行离散化 , 使之用下列有限差分方程来近似表示,9-12,这样 , 就把研究连续过程问题近似转化成了 级决策过程 。
下面就可按离散过程一样建立函数方程 , 用递推求解方法逐级进行最优决策 , 求出最优控制序列来,9-14,这里 , 假设在每段时间 内 ,及 保持常值 。
同时 , 将积分型的性能指标用以下序列和的形式来近似,第三节 动态规划法解离散线性二次型问题, 。
12、设离散线性系统状态方程为,9-15,性能指标为二次型,9-16,式中 ,均为对称矩阵 ,为正定矩阵 ,为正半定矩阵 。
求最优控制序列 使 为最小,现在我们用动态规划法来求解 。
来源:(未知)
【学习资料】网址:/a/2021/0323/0021755883.html
标题:动态规划法|《动态规划法》PPT课件( 二 )