博弈论里的囚徒困境怎么解决

如题所述

20190903 数学05

温馨提示:答案为网友推荐,仅供参考
第1个回答  2019-08-27

当两个参与者Player同时有对对方的最佳反馈时(即达到纳什均衡,也就是同时认罪),就可以得到囚徒困境的最佳结果。

其实两个囚犯如果都否认犯罪,那么便能获得最少的判刑。但是两个囚犯都在关在不同的地方,双方也无法碰面,所以无法确信对方是否会背叛自己。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低,所以二人的理性思考都会得出相同的结论——选择背叛。

因此,这场博弈中只有一种可能能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。

扩展资料

囚徒困境经典例子

1950年,由就职于兰德公司的梅里尔·弗勒德(MerrillFlood)和梅尔文·德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(AlbertTucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:

警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。

若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。

参考资料来源:百度百科-囚徒困境

本回答被网友采纳
第2个回答  推荐于2018-04-30

囚徒困境:

  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

    若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

    若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。

    若二人都互相检举(互相“背叛”),则二人同样判监2年。

因此,甲乙二人的支付矩阵为:

  从支付矩阵中可以看到,甲乙的纳什均衡为同时认罪;但其实甲乙二人同时沉默才能使得判刑时间最短。因此想要跳出囚徒困境,甲乙二人必须充分地信任对方,才能同时保持沉默,使得各自的支付最大。

本回答被网友采纳
第3个回答  推荐于2017-09-22

Prisoner's

Dilemma 囚徒困境是game theory中经典的问题。


当两个参与者Player同时有对对方的最佳反馈best response formula时,(即达到纳什均衡Nash Equillibrium),我们就可以得到囚徒困境的最佳结果outcome.


图中显示的是囚徒困境的例子,注意囚徒困境的格式是固定的,即U1(背叛,合作)>U1(合作,合作)>U1(背叛,背叛)>U1(合作,背叛)。U1指的是player 1 的utility(收益)。在这个例子里是(5,0)>(3,3)>(1,1)>(0,5),在这里我们只看5>3>1>0因为这是player1的utility.


下文的BR指的是best response(最佳方案)

从图中我们可以看出,BR1(player2合作)=背叛(5)BR1(player2背叛)=背叛(1) 

同理                             BR2(player1合作)=背叛(5)BR2(player1背叛)=背叛(1)、


从上面可得,这个例子中唯一的纳什均衡是(背叛,背叛)=(1,1) 在当前游戏是simoutanious game的前提条件下,无论对方用什么方案,我都想背叛,因为我不能保证其他的Player在我合作的时候背叛我以获得更高的payoff(收益)。



=,=手打的,自己写的东西。

本回答被提问者和网友采纳
第4个回答  2019-12-23
1、利用无限次重复博弈(例如,经典的针锋相对策略、冷酷策略等)
2、利用信息不完全(例如,声誉效用、个体类型等)
3、利用心智模型,放松主体假定(例如带有同情的博弈)
4、本方可以采取一些措施(如降低本方的收益,签协议)让对方有理由相信你没有动机产生偏离,从而有动机产生合作

历史上曾经有人在真实环境中做过囚徒困境的实验,发现重复博弈后的结果就是趋于合作。
其实经典博弈论中的“个体绝对理性”假设实在是太强了,因此后来有人就提出了“有限理性”的假设,即人们的计算能力是有限的,不可能用数学去计算分析完博弈的所有结果后再做出选择(因为很多情况下人们并不知道该怎么分析),而只是依据经验做出选择,然后再对结果进行学习(举例来说,如果你没学过博弈论,你可能就不知道该如何“理性”地分析囚徒困境,你所做的只是依据经验做出选择)。这个思想其实和生物进化论的思想差不多(或者机器学习也类似),其中的一个概念就是evolutionarily stable strategy。因此博弈论在某些方面还不够完善,它还不太适合来进行“预测”
相似回答