基于深度强化学习的六足机器人运动规划.pdf

1、本文档共11页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第2卷第4期智能科学与技术学报Vol.2No.4

2020年12月ChineseJournalofIntelligentScienceandTechnologyDecember2020

基于深度强化学习的六足机器人运动规划

11221

傅汇乔，唐开强，邓归洲，王鑫鹏，陈春林

（1.南京大学工程管理学院，江苏南京210046；2.西南科技大学制造科学与工程学院，四川绵阳621010）

摘要：六足机器人拥有多个冗余自由度，适用于复杂的非结构环境。离散环境作为非结构环境的一个苛刻特例，

需要六足机器人具备更加高效可靠的运动策略。以平面随机梅花桩为例，设定随机起始点与目标区域，利用深度

强化学习算法进行训练，并得到六足机器人在平面梅花桩环境中的运动策略。为了加快训练进程，采用具有优先

经验重放机制的深度确定性策略梯度算法。最后在真实环境中进行验证，实验结果表明，所规划的运动策略能让

六足机器人在平面梅花桩环境中高效平稳地从起始点运动到目标区域。为六足机器人在真实离散环境中的精确运

动规划奠定了基础。

关键词：六足机器人；运动规划；深度强化学习

中图分类号：TP242.6

文献标识码：A

doi:10.11959/j.issn.2096−6652.202039

Motionplanningforhexapodrobotusingdeep

reinforcementlearning

11221

FUHuiqiao,TANGKaiqiang,DENGGuizhou,WANGXinpeng,CHENChunlin

1.SchoolofManagementandEngineering,NanjingUniversity,Nanjing210046,China

2.SchoolofManufacturingScienceandEngineering,SouthwestUniversityofScienceandTechnology,Mianyang621010,China

Abstract:Hexapodrobothavemultipleredundantdegreesoffreedomandaresuitableforcomplexunstructuredenvi-

ronments.Discreteenvironments,asaharshspecialcaseofunstructuredenvironments,requirehexapodrobotstohave

moreefficientandreliablemotionstrategies.Aplanerandomplum-blossompileenvironmentwastakenasanexample.A

randomstartingpointandatargetareawereset,andthedeepreinforcementlearningalgorithmwasappliedtoplanamo-

tionstrategyforahexapodrobotintheplanepl

文档好才是真的好

咨询Ta 进入空间

更多 >