- 1、本文档共117页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《经济博弈论2》PPT课件
也就是: 博弈方1的混合策略 博弈方2的混合策略 当博弈方1以(0.8,0.2)的概率随机选择A和B,博弈方2以(0.8,0.2)的概率随机选择C和D时,由于谁都无法通过单独改变自己随机选择的概率分布改善自己的期望得益,因此这个混合策略组合是稳定的。 (0.8,0.2)本博弈唯一的混合策略那什均衡。 双方多次重复该博弈的期望得益 当双方采用该策略组合时,虽不能确定单独一次博弈的结果究竟会是四组得益中的哪一组,但双方进行该博弈的期望得益,就是多次独立重复该博弈的平均结果,分别为: 策略 得益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6 四、齐威王田忌赛马 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 上中下 上中下 上中下 上中下 上中下 上中下 上 中 下 上 中 下 上 中 下 上 中 下 上 中 下 上 中 下 田 忌 齐 威 王 得益矩阵 本博弈中两博奕方的利益也是完全冲突对立的,也是一个严格竞争的零和博弈,不会有纯策略那什均衡,也是一个混合策略博弈问题。 可设齐威王的策略从上到下分别称为 和 ,田忌的策略从左到右分别称为策略 和 。 设齐王分别以概率 随机选择相应策略,则田忌采用g、h、i、j、k、和l的期望得益分别为 齐王为使田忌无机可乘,所选概率分布必须使这6个期望得益相等。 同样,田忌以概率 随机选择相应策略,则该6个概率也必须使齐王选择各纯策略的期望得益相等,因而 得 。齐王和田忌都以1/6的相同概率随机选择各自的6个纯策略,构成本博弈唯一的混合策略那什均衡。 多次进行这样的赛马,齐王平均每次能赢得田忌一千金铜,这时因为齐王三匹马的实力略胜田忌三匹马总体实力一筹的缘故。 五、小偷和守卫的博弈 背景介绍:一小偷欲偷窃,有一守卫看守仓库,如果小偷偷窃时看守在睡觉,则小偷就能能得手,偷得价值为V的赃物;如果小偷偷窃时守卫没有睡觉,则小偷就会被抓。设小偷被抓住后要坐牢,负效用为-P,守卫睡觉而未遭偷窃有S的正效用,因睡觉被窃要被解雇,其负效用为-D。而如果小偷不偷,则它们既无得也无失,守卫不睡意味着出一份力挣一分钱,他也没有得失。 根据上述假设双方博弈矩阵如下: 五、小偷和守卫的博弈 V,-D -P,0 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 在一次性的博弈中没有自动实现的均衡性策略组合,也无法预测博弈的结果。 这个博弈除了双方得益没有猜硬币那么对成称外,本质特征与猜硬币博弈是相同的。 决策原则:不能让对方猜到自己的策略,应该以随机的方式选择策略,并且随机选择两种策略的概率不能让对方有机可乘。 可以用原来代数的方法分析,也可以用下面图解的方法来解决这个问题。 0 - D - D’ 守卫 得益((睡) S Pt 小偷 偷的概率 1 横轴表示小偷偷的策略概率 它分布在0-1之间。不偷的概率 纵轴反映对应与小偷“偷”策略的不同概率,守卫选择“睡”策略的期望得益。 图中从S到-D连线的纵坐标就是在横坐标对应的小偷“偷”窃概率下,守卫选择“睡”的期望得益 易知:该线与横轴的交点 就是小偷选择“偷”窃概率的最佳水平,选择“不偷”的概率则为 1- 加重对守卫的处罚效果将会怎样? 首先,S到-D连线上每一点的纵坐标,就是在小偷选择该点横坐标表示的”偷“窃概率 时,守卫选择”睡“觉策略的期望得益 假设小偷的”偷“窃概率大于 时,此时守卫”睡“觉的期望得益小于0,因此他会百分之百选择不睡,小偷偷一次被抓一次,所以对小偷来说大于 的”偷“的概率是不可取的。 反之,守卫的期望得益会大于0,守卫天天睡大觉是合算的。此时,小偷选择作案的频率会增加,在不被抓的前提下,作案频率增加,小偷的收益也会增加,一旦达到均衡点,小偷的策略会选择改变。因此,均衡点是小偷以概率 和 分别选择“偷”和“不偷”。此时,守卫“睡”与“不睡”的期望得益都等于0
文档评论(0)