按关键词阅读: 动态 动态规划法 课件 PPT 规划
从初始端开始 , 经过 级决策得到的最优性能指标可表示为,9-17,9-18,根据最优性原理 , 可以建立函数方程如下,假设二次型问题的最优性能指标为状态的二次函数,9-20,上式对 成立 , 代入式(9-19)得,9-21,将系统状态方程代入 , 得,9-22,设 不受约束 , 则令,9-23,式中,现在需要确定 , 将 式(9-24)代入式(9-22) , 并利用 的假设 , 则式(9-22)可写成,上式对任意状态变量都满足 , 由此可得离散系统的黎卡提方 。
13、程,9-27,第四节 动态规划法解连续系统的最优控制问题,用离散动态规划法求解连续系统最优控制问题时 , 可能会由于离散化过程而造成一定误差 。
应用最优性原理 , 对连续系统也可建立起相应的函数方程 , 经过变换 , 最后得到一个一阶非线性偏微分方程 , 解之可得连续形式的最优控制即最优决策,设连续系统状态方程为,性能指标为,9-30,求最优控制, 使为最小,我们知道 , 对应最优控制 及最优轨线, 性能指标将取极小值 , 且为系统初始状态 及初始时刻 的函数 , 以表示 , 则可写成,9-31,9-32,设时刻 在区间 内 , 则根据最优性原理 , 从 到 这一段过程必须构成最优过程 , 这一段过程的性能指标极小值可表示为,将 这段最优过程 。
14、分成二步 , 第一步 由 到 ,是一很小的时间间隔 , 第二步由 至, 于是有,9-34,9-35,根据最优性原理 , 从 到 这一段过程也应当构成最优过程 , 其性能指标极小值可表示为,这样 , 式(9-35)就变成,9-36,9-37,因为 很小 , 上式可写成,9-38,将 用台劳级数展开,9-39,式中 ,为二次及二次以上各项 , 代入式(9-38)得,9-40,由于 不是 的函数 , 从而 亦不是 的函数 , 因此不受最小化运算的影响 , 可从最小化运算符号析出 , 于是有,9-41,简化上式 , 并以 除之 , 再取, 则,9-42,定义下列函数,9-43,式(9-45)称为哈密尔顿-雅可比方程 。
当 不受限制时 , 可由,9-46,可以解出 来 。
再将 代回式(9-48) , 就可获得最优控制。
这是一个状态反馈控制规律 , 由此可以实现闭环最优控制 。
最后同 代入系统状态方程 , 就可解得,例9-2 设系统状态方程为,初始状态为,不受约束 , 性能指标为,试求, 使 为最小,解 根据式(9-45)、式(9-43)有,由于 不受约束 , 可以根据 来求, 得,为解此偏微分方程 , 设:, 代入上式 , 得,因而,联立解得,从而可很方便地实现闭环状态反馈最优控制 。
来源:(未知)
【学习资料】网址:/a/2021/0323/0021755883.html
标题:动态规划法|《动态规划法》PPT课件( 三 )