迭代动态规划算法的改进.docx

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

迭代动态规划算法的改进

l) 将区问,[0j

ft]分成P个时间段,每役时问的长度为L(L=1t

/P)

选择N个初妢高俶控制变世值,N取奇数昏首先 在P段内绘每个时问段设定一个估计初始值u°,生成N个控制壶平均分布在沪 附近(控制域r内):

伈[H叩-IJ]*r,H=2儿,护 l},形成N·tp 维的控制变堂初妗矩阵U(N盯.

使用从第2步得到的控制矩 阵U中的无索作为控制变壶侮以Xo为初始

状态值在每个尉间段对应代入状态方程,得到N叩个状态阿格点,存储这些网格点的值..

从彖后一个时间段P段开始勹,对应时间区间从tf -L到廿,对于每个同格

点用M个可行的控制变昼值(如果有m个控制变垦,则有M四个可行控制变广值)J·分别代入状态方程1 得到tl处对应的性能指标.I..对于每个网格点选择使

性能指标J羡优的可行控制变昼u, 存储该控制变昼但为笫 5步使用贮

退后到r-l时间段,对应的时间区间从ft

-2L到It

-L户对于每个网格点

用M(或矿 )个可行的控钳变昼值分别从 t广让到,1t-L代人状态方程巴,选择

第4步获得的设近网格点对应的控制变曼,从1t-L到t1继续迭代,得到行处对

应的性能指标J..对于每个网格点选择使性能指标J晟优的可行控制变圣 U, 并

存储该位昏

对于P-2:rP 刁,直到1(对应的初始时刻为0),室复以上这样的过程.每个网格点保存使性能指标 J为最优的对应控制策略u尸井比较t=1时N个网格点对应的性能指标J 找到J最优的网格点生成时代入的 u作为做优策略矿暑

通过乘以一个销翍因子a缩小可行控制变昼值的区域,比如,产 =a叶(i

指迭代指数)电

8} 使用在步骤(6)中获得的录优策略";,;作为初始值忙,小增加迭代指数到i+].

然后转到步骤(2)日继续迭代以上的程序 然后检查结杲,记录每步迭代性能指标

J和i以及致优控制策略,直至找到满足楠度的最优控制策略亭

为方便直观理婚,其离做过程如图2.]所示[Tao.H..LiuX今2006]:'

.署,-

.r...早?

i? ;-· ,.

-『..

卓卓嗣

,,1

成-,让l)仁

) -?1

崔喻*.. * 叱-2i,初

屯·一儿,切氏

`=10芞叩 l fr-ii 哼?-i 归 哼p 1!.

图2F.I 迭代动态规划算法离散示意图(N;;::3,M=3}

击此可见r 迭代动态规划算法首先进行网格离傲,形成冈格结构后从所有粉段的录后一个开始反向积分寻找每个网格点的栽优控制变登可行值} 在后面一段的每一个网格确定其录优控制策略后 ,以此策略为基础遐步前移求解 9 直到初始状态点,此时已经得到后面各个阶段的嵌优控制策咯心以上过程中涉及多次微分方程求解过程,如果能将此过程的速度和特度提高日则对整个迭代动态规划算法的效率将产生有效改进作用3 在本京中将以4阶RungdKu廿a方法为对照参考生分别运用单步做分方程数值方法和多步微分方程数值方法进行计算比较胪其中单步部分选取改进Euler方法,多步部分选择脆式 Ad邸E方法.

立基于四阶RungdKutta的迭代动态规划算法

22.1四阶R吨 eKutta\方法的原理

即 e...Kutta方法是用于求焙常敬分方程的重要一类隐式或者显示迭代方法 卞它基于微分中值定理由数学家卡尔龙格和马丁.威尔海姆.库塔干l900年左右发明.经典四阶R皿驴-Ku血方法的一种常用格式如下[石瑞民,20凹]:

k1- f(x1,y』),

k2=/(气中心,

丸=f

xi +h y, hK汴

(2.l)

『( -,+-

2

|九=f伐+九y,+航)古 .

h

加 气片十一(Ir,+2kl+2比+幻)温

6

,2.2算例应用

算例一;催化剂混合反应最佳配比 问超(])问题描述

在长度一定(

假设为

1-

}的管式反应器中,A B两种催化剂发生反应,反应

式如下:

A仁 .B=C {2..2)

其中B是副产物,C是目标产物..动态优化的目标是求斛沿管长方向的录佳的催化剂混合方案使得产物0 勺收率晟大,描述为数学模型如下式所示(il =l2):

旺叮.r,

J

文档评论(0)

hao187 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体武汉豪锦宏商务信息咨询服务有限公司
IP属地上海
统一社会信用代码/组织机构代码
91420100MA4F3KHG8Q

1亿VIP精品文档

相关文档