F-对抗搜索-人工智能(AI).ppt

下载文档 降价啦

92
0
约8.64千字
约 75页
2017-08-19 发布于安徽
举报
版权申诉
保障服务

F-对抗搜索-人工智能(AI).ppt

1、本文档共75页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

对抗搜索和博弈Adversarial Search and Game Playing (要做出好的决策，就必须尊重你的对手) RN: Chap. 6 博弈（如国际象棋、围棋）由于敌我双方交替行棋的相互影响，使得问题本身具有了不确定性很多世纪以来，人类用博弈来挑战人的智能极限近来，出现了许多成功的博弈程序，能够与人对弈一些特别的设定双人游戏，交替走棋，确定的环境，完全可观察，零和，时间限制 State space Initial state Successor function: 对于每一个状态能够执行哪些动作及相应得到的状态默认情况下，假设MAX和MIN交替走棋，且设定MAX先走第一步，也即初始状态 Terminal test: 分辨是否最终状态，如果是，那么MAX赢、输还是和？所有的状态都是完全可观察的对手的变数由于对手(MIN)的动作带来了问题的不确定性，这是我方(MAX) 做决策时需要考虑的问题博弈由于对手(MIN)的动作带来了问题的不确定性，这是我方(MAX) 做决策时需要考虑的问题 MIN 希望 MAX 失利 (反之亦然) 如果无视MIN的应对，那么MAX没有任何希望能够胜出 (对于 MIN亦然) 每一个回合，必须在有限的时间内做出行动决策状态空间非常大：在有限的时间内只能对空间的一小块进行探索博弈树Game Tree 博弈树Game Tree 选择一步走棋: 基本思想将当前状态作为初始状态，建立一个深度为h的搜索树， h（horizon，称为视野）是在有限时间内能够考虑到的最大深度对所有叶节点状态进行评价由叶节点回推至根节点，选择其中最好的一个动作决策（假设对手MIN的应对总是给MAX带来最坏的结果） ? 极大极小算法 Minimax algorithm 评价函数Evaluation Function 函数 e: 状态 s ? 数值 e(s) e(s) 即为估计状态s对于MAX来说“好”的程度的启发式信息 e(s) 0 意味着状态s对于MAX来说是有利的(数值越大越有利) e(s) 0意味着状态s对于MIN 来说是有利的 e(s) = 0 意味着状态 s 是中立的例子: Tic-tac-Toe 评价函数的构造通常采用“特征”的加权和构造评价函数: 特征可能是每种类型棋子的数量可能的走棋数量 …… p133 值的回推为什么使用回推值? 在每一个非叶节点N，回推值就是MAX到达深度时能够获得的最大值（总是认为对手MIN的应对是最好的） e(STATE(N))可以对节点N的状态”好”的程度进行估计，而回推值则是一个更好的估计极大极小算法Minimax Algorithm 从当前状态（MAX走棋）开始，扩展博弈树到深度h 对博弈树的每一个叶节点计算评价函数值由叶节点开始至根节点计算回推值: MAX节点取得其后继的最大评价值 MIN节点取得其后继的最小评价值选择能够得到最大回推值的走棋博弈过程 (MAX) 到达最终状态前重复以下步骤采用极大极小方法选择一步走棋按1的决策走棋观察MIN的应对走棋还能做得更好吗？是的 ! 能够做得更好 ! Example Example Example Example Example Example a - b 剪枝Alpha-Beta Pruning 采用深度优先方法探索博弈树只要有可能就回推 a 和 b 的值把那些不会改变最终决策的分支剪去 a - b 算法当节点N以下的搜索完成（或剪枝中止）时，更新N的父节点的a或b值当一个MAX节点N的a 值? N 的MIN祖先节点的b值，则节点 N 以下的搜索中止当一个MIN节点N的b值? N 的MAX祖先节点的a 值，则节点 N 以下的搜索中止 Example Example Example Example Example Example Example Example Example Example Example Example Example Example Example Example Example Example Example Example Example Example Example Example Example Example Example 剪枝让我们得了多少好处？考虑以下两种情况: 剪枝让我们得了多少好处？假设博弈树有着均一的分支因子b 极大极小检查O(bh) 个节点，这也是a－b的最坏情况 a－b 带来的好处最大，当: MAX节点的MIN子节点按照回推值递减顺序排列 MIN 节点的MAX子节点按照回推值递增顺序排列 a－b 检查O(bh/2) 个节点 [Knuth and Moor