博弈论里的囚徒困境怎么解决

如题所述

举报该问题

推荐答案 2019-09-03

20190903 数学05

温馨提示：答案为网友推荐，仅供参考

当前网址：http://77.wendadaohang.com/zd/3Wp38pqWv88p833GYI.html

其他回答

第1个回答 2019-08-27

当两个参与者Player同时有对对方的最佳反馈时（即达到纳什均衡，也就是同时认罪），就可以得到囚徒困境的最佳结果。

其实两个囚犯如果都否认犯罪，那么便能获得最少的判刑。但是两个囚犯都在关在不同的地方，双方也无法碰面，所以无法确信对方是否会背叛自己。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低，所以二人的理性思考都会得出相同的结论——选择背叛。

因此，这场博弈中只有一种可能能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑8年。

扩展资料

囚徒困境经典例子

1950年，由就职于兰德公司的梅里尔·弗勒德（MerrillFlood）和梅尔文·德雷希尔（MelvinDresher）拟定出相关困境的理论，后来由顾问艾伯特·塔克（AlbertTucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：

警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：

若一人认罪并作证检控对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。

若二人都保持沉默（相关术语称互相“合作”），则二人同样判监1年。

若二人都互相检举（相关术语称互相“背叛”），则二人同样判监8年。

参考资料来源：百度百科-囚徒困境

本回答被网友采纳

第2个回答推荐于2018-04-30

囚徒困境：

　　警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：

若一人认罪并作证检举对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。

若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。

若二人都互相检举（互相“背叛”），则二人同样判监2年。

因此，甲乙二人的支付矩阵为：

　　从支付矩阵中可以看到，甲乙的纳什均衡为同时认罪；但其实甲乙二人同时沉默才能使得判刑时间最短。因此想要跳出囚徒困境，甲乙二人必须充分地信任对方，才能同时保持沉默，使得各自的支付最大。

本回答被网友采纳

第3个回答推荐于2017-09-22

Prisoner's

Dilemma 囚徒困境是game theory中经典的问题。

当两个参与者Player同时有对对方的最佳反馈best response formula时，（即达到纳什均衡Nash Equillibrium），我们就可以得到囚徒困境的最佳结果outcome.

图中显示的是囚徒困境的例子，注意囚徒困境的格式是固定的，即U1（背叛，合作）>U1（合作，合作）>U1(背叛，背叛)>U1（合作，背叛）。U1指的是player 1 的utility（收益）。在这个例子里是（5,0）>(3,3)>(1,1)>(0,5),在这里我们只看5>3>1>0因为这是player1的utility.

下文的BR指的是best response(最佳方案)

从图中我们可以看出，BR1（player2合作）=背叛（5）BR1（player2背叛）=背叛（1）

同理 BR2（player1合作）=背叛（5）BR2（player1背叛）=背叛（1）、

从上面可得，这个例子中唯一的纳什均衡是（背叛，背叛）=（1,1）在当前游戏是simoutanious game的前提条件下，无论对方用什么方案，我都想背叛，因为我不能保证其他的Player在我合作的时候背叛我以获得更高的payoff（收益）。

=，=手打的，自己写的东西。

本回答被提问者和网友采纳

第4个回答 2019-12-23

1、利用无限次重复博弈（例如，经典的针锋相对策略、冷酷策略等）
2、利用信息不完全（例如，声誉效用、个体类型等）
3、利用心智模型，放松主体假定（例如带有同情的博弈）
4、本方可以采取一些措施（如降低本方的收益，签协议）让对方有理由相信你没有动机产生偏离，从而有动机产生合作

历史上曾经有人在真实环境中做过囚徒困境的实验，发现重复博弈后的结果就是趋于合作。
其实经典博弈论中的“个体绝对理性”假设实在是太强了，因此后来有人就提出了“有限理性”的假设，即人们的计算能力是有限的，不可能用数学去计算分析完博弈的所有结果后再做出选择（因为很多情况下人们并不知道该怎么分析），而只是依据经验做出选择，然后再对结果进行学习（举例来说，如果你没学过博弈论，你可能就不知道该如何“理性”地分析囚徒困境，你所做的只是依据经验做出选择）。这个思想其实和生物进化论的思想差不多（或者机器学习也类似），其中的一个概念就是evolutionarily stable strategy。因此博弈论在某些方面还不够完善，它还不太适合来进行“预测”

1 2 下一页

相似回答

博弈论里的囚徒困境怎么解决答：在博弈论中的经典难题——囚徒困境中，当两个参与者（Player）面临无法直接交流的情况，他们面临着一个看似难以解决的问题。如果双方都选择否认犯罪，那么将会得到较轻的判决。然而，由于彼此隔离，无法确认对方的决定，从个人利益出发，每个人都倾向于选择告发对方以换取较短的刑期。因此，理性推理的结果往...

破解囚徒困境的做法包括答：破解囚徒困境的做法包括：1. 以牙还牙策略：每一次都复制对方上一步的策略，这是囚徒困境中的一个经典最优策略。2. 宽容的以牙还牙策略：在对方第一次背叛时选择宽容，第二次背叛时才采用以牙还牙策略。这种策略能够避免因操作失误或理解偏差而导致的局势错判，确保游戏的持续进行。囚徒困境是博弈论中的非...

囚徒困境的最佳策略是什么?答：1、对方由于操作失误而产生背叛。2、自己对对方操作的理解发生偏差。基于这两种情况，宽容的以牙还牙策略是最优解，即在对方第一次背叛时我们选择宽容，第二次背叛时采用以牙还牙策略，这样就避免了因上面说的两种失误而产生的局势错判，充分保证了游戏的持续进行。囚徒困境是博弈论的非零和博弈中具代表性的...

博弈论里的囚徒困境怎么解决答：打破前提，就可以破解囚徒困境了！很简单，不断重复！不断重复！一提到囚徒困境，很多人只知道，两个囚犯都会坦白，因为这样对个人收益最大！并且这种选择只有一次！两个人进行这次试验后，不会再相遇！就算我出卖你，那我也没什么后顾之忧！是吧？OK，那我们增加一个条件，进行100次这样的实验，而且在...

囚徒困境博弈(博弈论中的经典案例)答：囚徒困境博弈的解决方法囚徒困境博弈存在一个困境，即每个囚犯都有动机去背叛对方，但是如果两个囚犯都选择背叛，那么他们的刑期会比都选择合作的情况更长。因此，解决这个困境的关键是如何让两个囚犯都选择合作。在博弈论中，有一个重要的概念叫做“纳什均衡”。纳什均衡是指在博弈中，每个玩家都做出了最...

博弈论里的囚徒困境怎么解决视频时间 03:07

博弈论中的囚徒困境答：首先明确一点——没有人关心集体最优。博弈论的一个基本假设是人们是理性的（可以理解为自私的），因此囚徒困境的出现并不难理解。即使对于两个人来说，两人都不坦白的总效果是最好的，但其中一个人如果知道对方不会坦白，为什么会不选择早早交代以获得自由呢？囚徒困境的均衡是一种更稳定的均衡，因为...

大家正在搜

囚徒困境最佳解决方法囚徒困境怎么破解囚徒困境破解方法博弈论囚徒困境的三种解决方法博弈论囚徒困境告诉我们什么博弈论精髓100句打破囚徒困境的方法囚徒困境最优策略是什么囚徒困境能否打破