- 1、本文档共246页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * 博弈树特点: (1)博弈的初始状态是初始节点; (2)博弈树的“与”节点和“或”节点是逐层交替出现的; (3)整个博弈过程始终站在某一方的立场上,所以能使自己一方获胜的终局都是本原问题,相应的节点也是可解节点,所有使对方获胜的节点都是不可解节点。 第二百二十三页,共二百四十六页。 * * 在人工智能中可以采用搜索方法来求解博弈问题,下面就来讨论博弈中两种最基本的搜索方法。 第二百二十四页,共二百四十六页。 * * 极大极小过程 极大极小过程是考虑双方对弈若干步之后,从可能的走法中选一步相对好的走法来走,即在有限的搜索深度范围内进行求解。 为此,需要定义一个静态估价函数f,以便对棋局的态势做出评估。 第二百二十五页,共二百四十六页。 * * 这个函数可以根据棋局的态势特征进行定义。假定对弈双方分别为MAX和MIN,规定: 有利于MAX方的态势:f(p)取正值 有利于MIN方的态势:f(p)取负值 态势均衡的时候:f(p)取零 其中p代表棋局。 第二百二十六页,共二百四十六页。 * * MINMAX基本思想: (1)当轮到MIN走步的节点时(取与时),MAX应考虑最坏的情况(即f(p)取极小值)。 (2)当轮到MAX走步的节点时(取或时),MAX应考虑最好的情况(即f(p)取极大值)。 (3)评价往回倒推时,对应于两位棋手的对抗策略,交替使用(1)和(2)两种方法传递倒推值。 所以这种方法称为极大极小过程。 第二百二十七页,共二百四十六页。 * * 下图 所示是向前看两步,共四层的博弈树,用□表示MAX,用○表示MIN,端节点上的数字表示它对应的估价函数的值。在MIN处用圆弧连接,用0表示其子节点取估值最小的格局。 图中节点处的数字,在端节点是估价函数的值,称它为静态值,在MIN处取最小值,在MAX处取最大值,最后MAX选择箭头方向的走步。 第二百二十八页,共二百四十六页。 * * 用一字棋说明极大极小过程,设只进行两层,即每方只走一步。 一字棋游戏规则如下:设有一个三行三列的棋盘,如图所示,两个棋手轮流走步,每个棋手走步时往空格上摆一个自己的棋子,谁先使自己的棋子成三子一线为赢。设MAX方的棋子用×标记,MIN方的棋子用○标记,并规定MAX方先走步。 第二百二十九页,共二百四十六页。 * * 为了不致于生成太大的博弈树,假设每次仅扩展两层。估价函数定义如下: 设棋局为P,估价函数为e(P)。 (1)若格局p对任何一方都不是获胜的(胜负未定),则 e(p) = (棋局P上有可能使MAX成为三子成一线的状态的数目) –(棋局P上有可能使MIN成为三子成一线的状态的数目)= e(+p)-e(-p) (2)若p是MAX必胜的棋局,则 e(p) = +∞ (3)若p是MIN必胜的棋局,则 e(p) = -∞ 第二百三十页,共二百四十六页。 * * 若p为下图所示,且 e(P)=e(+P)-e(-P)=5-4=1 第二百三十一页,共二百四十六页。 * * 假设由MAX先走棋,且我们站在MAX立场上。下图给出了MAX的第一着走棋生成的博弈树。图中节点旁的数字分别表示相应节点的静态估值或倒推值。由图可以看出,对于MAX来说最好的一着棋是S3,因为S3比S1和S2有较大的估值。 第二百三十二页,共二百四十六页。 * * α-β过程 上面讨论的极大极小过程先生成一棵博弈搜索树,而且会生成规定深度内的所有节点,然后再进行估值的倒推计算,这样使得生成博弈树和估计值的倒推计算两个过程完全分离,因此搜索效率较低。 如果能边生成博弈树,边进行估值的计算,则可能不必生成规定深度内的所有节点,以减少搜索的次数,这就是下面要讨论的α-β过程。 第二百三十三页,共二百四十六页。 * * 考虑:如果边生成博弈树,边进行估值的计算会带来什么好处。 第二百三十四页,共二百四十六页。 * * α-β过程就是把生成后继和倒推值估计结合起来,及时剪掉一些无用分支,以此来提高算法的效率。 下面仍然用一字棋进行说明。现将原图左边所示的一部分重画在图中。 第二百三十五页,共二百四十六页。 * * 与或图的启发式搜索 2、搜索循环 选择和扩展LGS中的局部解图; ⑧精化新局部解图代价的估计 用公式f(n) = K + h(n1) + h(n2) + … + h(nk)取代原先的f(n); 递归地作用到初始节点n0; ⑨传递新局部解图中节点的能解性 标记作为终节点的子节点为能解节点; 递归地传递节点的能解性到初始节点n0 。 f(n)=h(n) 第一百九十一页,共二百四十六页。 * * 第一百九十二页,共二百四十六页。 * * 与或图的启
您可能关注的文档
- 现代金融体系中的资本市场.ppt
- 优秀销售人员应具有的基本技能.ppt
- 新员工培训与引导.ppt
- 职业生涯演示.ppt
- 生产数据管理维护流程.ppt
- 胜华元品牌提案.ppt
- 实用礼仪礼貌培训课件.ppt
- 人力资源管理者的新角色与价值定位概述.ppt
- 人性管理-为你的员工量体裁衣).ppt
- 谁会成为创业者.ppt
- 2024_2025学年九年级化学上册第五单元化学方程式基础过关卷含解析新版新人教版.docx
- 2024_2025年新教材高中地理第三章地球上的大气单元素养检测含解析湘教版必修第一册.docx
- 高中语文第5课苏轼词两首__念奴娇赤壁怀古教案4新人教版必修4.doc
- 2024_2025年新教材高中物理第4章力与平衡章末检测含解析鲁科版必修第一册.doc
- 高中语文第一单元第3课大堰河__我的保姆学案1新人教版必修1.doc
- 2024_2025学年高中语文第二单元新闻6喜看稻菽千重浪检测含解析粤教版必修5.doc
- 2024_2025学年新教材高中历史第九单元中华人民共和国成立和社会主义革命与建设第27课社会主义建设在探索中曲折发展梯度作业含解析新人教版必修中外历史纲要上.doc
- 2024_2025学年新教材高中英语Unit2Let’scelebrate第4课时Writing_介绍节日学案含解析外研版必修第二册.doc
- 2024_2025学年新教材高中生物第6章细胞的生命历程2细胞的分化课后作业含解析新人教版必修1.doc
- 2024_2025年新教材高中生物课时检测4细胞中的无机物含解析新人教版必修1.doc
文档评论(0)