CH15-对策论基础.pptVIP

下载本文档

1
0
约1.66千字
约 29页
2018-02-13 发布于河北
举报
版权申诉

CH15-对策论基础.ppt

1、本文档共29页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

CH15-对策论基础

第15章对策论基础 Game Theory也可译为博弈论，是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。 1994年诺贝尔经济学奖授给了三位博弈论专家：纳什、泽尔腾、海萨尼。博弈论已经成为当代经济学的基石。二人有限零和对策是对策论(Game Theory)最基本的内容。第一节基本概念一、对策现象与对策论 1. 对策现象 ①下棋:围棋源于我国殷代。 1 -1 0 1 0 -1 -1 1 0 A 石头剪子石头剪子布布赢 B 猜手:小孩A与B猜手,若规定赢得1分，平得0分，输得 -1分，则 A的赢得可用右表来表示。 ③ 齐王赛马：齐王与大将田忌赛马，各自的马都分为三等，但齐王的同等马均强于田忌。孙膑给田忌出主意，用下----上，上----中，中----下，结果田忌胜出。 ② 2 . 对策论的产生 1944年，纽曼与曼彻斯特发表了题为《对策论和经济行为》。二次大战前后，由于军事需要，抽象成数学模型。 50年代是对策论发展的鼎盛时期，纳什和夏普利等提出了讨价还价模型和合作对策的“核”的概念。同时，非合作对策也开始创立。纳什于1950和1951年发表了两篇关于非合作对策的文章，图克于1950年定义了“囚徒困境”问题。 60年代，泽尔腾（1965）引入动态分析，提出“精练纳什均衡”概念。海萨尼（1967-1968）则把不完全信息引入对策论的研究。二、对策问题的组成 1.局中人（参加者）：一局对策的参加者，理性假设。 2.策略：局中人在一局对策中对付对手的一个完整的方案。策略集：局中人在一局对策中所有策略的全体。记为S （分为有限和无限）问:田忌和齐王的S=? 3. 局势：在一局对策中，每个局中人都选定一策略后的各策略总和。 4. 赢得函数：局势给定后，局中人的得失（是局势的函数）。如在二人对策中,设 M 第二节矩阵对策的最优纯策略一、矩阵对策二、理智局中人的选择在矩阵对策中，局中人将如何选取自己的策略呢？三、最优纯策略与鞍点对策值的含义？纯策略的含义？定理1：例1 例2 例3 第三节矩阵对策的混合策略与混合扩充一、基本概念混合策略解的含义是什么？使用期望收益法获得的混合策略的解表示：多次重复决策时采用纯策略的频率或者，单次决策时对纯策略的偏好即：期望收益不依赖对手的行为 6.混合扩充的解与值分析*式：例题 β1 β2 α1 1 3 α2 4 2 分析左式：也可以写成：进一步：性质1：二、性质性质2：松紧定理例4：猜手游戏该对策问题无纯策略最优，在混合策略下求解：解：由性质1 可假设X，Y的所有分量均为非零，则左式等号成立性质3： ① ② 优势原则例：用优超原理求解下列对策 a3 a2 a4a1 β2 β3,4,5 a3 a5 解得：x=（0,0,1/3,2/3,0）y=(1/2,1/2,0,0,0) V=5 β1 β2 a3 a4 性质4：性质5：三、基本定理与LP解法定理2：证：基本定理：G在混合扩充中一定有解。 LP解法：基本定理的证明过程同时给出了矩阵对策的LP解法。例6：先应用优超原理化简A 解法一: 解法二：2×2矩阵可以直接按公式计算：作业 P475 15.13(2) 求解如下的混合策略决策问题 Y1 Y2 X1 4 2 X2 0 10 X=（10/12, 2/12） Y=(8/12, 4/12) 对策值是该决策执行无限次的期望结果。 * 对策值是该决策执行无限次的期望结果。 *