多目标决策1、2.ppt

下载文档

18
0
约1.58万字
约 66页
2018-02-28 发布于山东
举报
版权申诉
保障服务

多目标决策1、2.ppt

1、本文档共66页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 4）机遇当量法的基本步骤（1）从风险决策模型中选择收益最大和收益最小的两个后果作为简单机遇的两个后果；（2）对风险决策模型中的每一个后果，估算选定简单机遇其中一个后果发生的概率π。（3）将原风险决策模型中的每一后果用估算的相当简单机遇替代，得到只有两个后果的决策模型；（4）在只有两个后果的决策模型中，分别计算两个后果发生的概率，得到进一步简化的决策模型；（5）对简化的决策模型，利用期望收益最大准则做出决策。 5、几个效用术语 1）后果效用对某一非确定型决策模型，若规定一个简单机遇的两个后果x*和x*，在上例中，x*= - 10000，x*= 30000，则该决策模型中的每一个后果的效用等于该简单机遇中后果x*发生的概率。在上例中，各后果的效用分别为： u(4000)=0.5, u(14000)=0.75, u(-10000)=0, u(30000)=1 2) 标准机遇具有后果x*和x*的机遇称为标准机遇。 3）当量机遇某一后果的当量机遇是与该后果相当的标准机遇 4）效用函数描述风险决策模型的各个后果与其后果效用的关系函数。 6、冒险厌恶、冒险中立和冒险倾向者的效用函数效用函数的曲线形状反映了决策者对风险的态度。效用函数曲线的横坐标是后果值，纵坐标是后果效用。对于某一特定的后果值区间（x1, x2）,有 1）决策者在后果值区间（x1, x2）是冒险中立者，当且仅当其效用函数在区间（x1, x2）是线性的； 2）决策者在后果值区间（x1, x2）是冒险厌恶者，当且仅当其效用函数在区间（x1, x2）是向上凸的； 3）决策者在后果值区间（x1, x2）是冒险倾向者，当且仅当其效用函数在区间（x1, x2）是向下凸的； * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 2.4 有试验风险型决策---贝叶斯决策 2.4.1 摸坛试验坛1 3红球 7绿球一张纸条坛 2 8红球 2绿球一张纸条表2.15 摸坛试验的自然状态概率与各行为方案的后果表一、无情报试验e0 决策者应选a1，即他应猜坛 a1 猜坛1 a2 猜坛2 二、非全情报试验ei 1、非全情报试验e1 为了计算摸一个球抽样试验后出现坛1（自然状态?1）和坛2（自然状态?2）的概率，我们令 1）R和G分别表示摸到的球是红球和绿球事件； 2）P（R）和P（G）分别表示摸到的球是红球和绿球的概率； 3）P（R/?1）和P（G/?1）分别表示从坛中摸到的球是红球和绿球的概率； 4）P（R/?2）和P（G/?2）分别表示从坛中摸到的球是红球和绿球的概率； 5）P（?1/R）和P（?2/R）分别表示摸到的球是红球后出现坛（自然状态?1）和坛（自然状态?2）的概率； 6）P（?1/G）和P（?2/G）分别表示摸到的球是绿球后出现坛（自然状态?1）和坛（自然状态?2）的概率；则 P（R/?1）=0.3, P（R/?1）=0.7 P（R/?2）=0.8, P（G/?2）=0.2 由全概率公式可得 P（R）= P（R/?1）P（?1）+ P（R/?2）P（?2） =0.3*0.75+0.8*0.25=0.425 P（G）= P（G/?1）P（?1）+ P（G/?2）P（?2） =0.7*0.75+0.2*0.25=0.575 由贝叶斯公式可得同理可得 P（?2/R）=0.47, P（?1/G）=0.91, P（?2/G）=0.09 根据上述计算结果，可做出非全情报试验e1的决策树如图2.3 从图2.3中，我们可以得到如下结论： 1）如果摸到一个球为红球，则要采取行为方案a1(猜坛)，其期望收益值为23.5； 2）如果摸到一个球为绿球，则要采取行为方案a2(猜坛)，其期望收益值为21.9； 3）摸一个球所获得的情报价值为22.5-16.25=6.3元； 4）由于摸一个球所获得的情报价值（6.3元）大于摸一个球所付出的费用（5元），所以，摸一个球的抽样试验是有利的。图2.3 非全情报试验e1的决策树 2、非全情报试验e2 图2.4 非全情报试验e2的决策树从图2.4中，我们可以得到如下结论： 1）如果摸到2个球为红球，则要采取行为方案a2(猜坛)，其期望收益值为38； 2）如果摸到2个球为绿球，则要采取行为方案a1(猜坛)，其期望收益值为24.3； 3）如果摸到2个球为一个红球和绿球，则要采取行为方案a1(猜坛)，其期望收益值为18； 4）摸2个球所获得的情报价值为2