囚徒困境原理是什么意思？

如题所述

第1个回答 2022-10-30

囚徒困境原理是什么意思？
两个囚徒为了追求各自的利益最大化，得到的结果一定是两败俱伤；如果双方可以同时放弃各自的最优策略，选择合作，这样才可以双赢。所谓困境，在于如果任何一方选择了合作而对方不合作，己方将万劫不复；而如果对方选择合作而自己选择最优策略，自己则有机会一步登天，将万劫不复留给对方，这就是为什么即使双方都知道唯有合作才能双赢，双方仍然无法合作。
经济学中的“囚徒困境”是什么意思？
囚徒困境（Prison Dilemma）是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。

单次发生的囚徒困境，和多次重复的囚徒困境结果不会一样。

在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡趋向于帕累托最优。

囚徒困境的主旨为，囚徒们虽然彼此合作，坚不吐实，可为全体带来最佳利益（无罪开释），但在资讯不明的情况下，因为出卖同伙可为自己带来利益（缩短刑期），也因为同伙把自己招出来可为他带来利益，因此彼此出卖虽违反最佳共同利益，反而是自己最大利益所在。但实际上，执法机构不可能设立如此情境来诱使所有囚徒招供，因为囚徒们必须考虑刑期以外之因素（出卖同伙会受到报复等），而无法完全以执法者所设立之利益（刑期）作考量。

举个例子：

1950年，由就职于兰德公司的梅里尔·弗勒德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问艾伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：

警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：

若一人认罪并作证检控对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。

若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。

若二人都互相检举（互相“背叛”），则二人同样判监2年。

用表格概述如下：

甲沉默（合作）甲认罪（背叛）

乙沉默（合作）二人同服刑半年甲即时获释；乙服刑10年

乙认罪（背叛）甲服刑10年；乙即时获释二人同服刑2年
《博弈圣经》囚徒困境的定义是什么？
《博弈圣经》囚徒困境的定义；囚徒困境中的两点一空间，堪称大自然的三维时空游戏，它会引起两个灵性对三维实体变异的思考、也会引起对三维实体错位的焦虑。

……

【摘要】

最终纳什的家人和朋友、决定将他送进医院治疗，在医院他认为医生是苏联人、要追杀他。经医生诊断，他得的“妄想型精神分裂症”也更加严重。一个被“妄想型精神分裂症”伤害的大脑、一个胡言乱语的精神病人、妄想出来的“纳什均衡”博弈占优理论，你们认为可信吗？

……

来源:美国资讯网；博弈圣经著作人对纳什的嘲讽

博弈圣经著作人的经典名句；0、1、二维平均，称平衡，0、1、2、三维平均，称均衡。

在0、1、二维记录的系统中，0、1、这两种输赢粒子，必需构成博弈程序中的基本单元，冯·诺伊曼发现，有一个“极小极大定理”存在其中，（极小极大定理，就是要么极端的输、要么极端的赢），从长远来看，两种粒子出现的一次平均、是一次平衡，多次平均、就是多次平衡，里面并不存在两种粒子扯平的趋势。两种粒子的未来、不受过去所发生的、任何粒子事件的影响。0、1、两种粒子趋于平衡的预期，已经被极小极大定理彻底否决。

在0、1、二维粒子随机走动的系统中，只存在平均、不存在平均律，也就是不存在三维均衡。博弈圣经著作人的经典名句；策略，就不存在0、1、二维系统中。纳什均衡提出时，当场就遭到冯·诺依曼的贬低、嘲笑和断然否定。

谈到“纳什均衡”，有位记者请纳什用通俗的语言来解释他的理论。纳什说；“‘纳什均衡’并不高深，它就像中国人发明的一种、三个人玩的扑克游戏，“纳什均衡”就是一个简单的三人博弈游戏”。中国有那么多人玩扑克，又玩了那么多年，纳什还提醒了中国人半个多世纪，纳什均衡并不高深，中国人竟没有一个人发现三个人玩的扑克游戏中、还有一个‘均衡占优理论’。人们不禁要问；纳什他自己玩过几次三人扑克游戏？他和谁玩的？他是怎么发现的均衡？均衡理论又是怎么单方占优的？在他所有的文章中，为什么没有对中国的扑克游戏展开叙述。一副扑克三个人玩，一个人18张牌，在连续记录的0、1、2、三维系统中，18张牌只能记录成、18个红蓝小点而已，它是怎么个均衡法呢？他在60多年的时间里，没有人见过他、用中国的扑克表演过什么是、非合作纳什均衡，什么是纳什均衡占优策略，他既没有实际表演，也没有给出明确的理论说明，这令关注纳什占优策略的人，大为失望。

博弈圣经著作人的经典名句；科学家在纳什均衡理论中、尚未发现博弈占优策略的任何迹象。

博弈圣经著作人的经典名句；策略，来自0、1、2、三维结构的自然属性。粒子、私湍、实体，简称为，粒、湍、体。它是博弈取胜、计算单方占优策略的标准模型。

在纳什的语文学中，就没有出现过一次0、1、2、三维均衡的概念，纳什均衡哪里来。

博弈圣经著作人的经典名句；纳什均衡理论没有任何明确的说法，纳什均衡是美国伪造的产物，传到了世界各地，当然也传遍了中国。“纳什均衡”的本质，是对中国人的智商，对发现、发明、创造精神的一种羞辱。

博弈圣经著作人的经典名句；二维平衡是指生物的竞争行为，三维均衡是指自然的优劣特性。

博弈圣经著作人的经典名句；揭开纳什均衡的画皮，露出真相。【如果纳什均衡是以纳什的名字、命名的一个博弈论术语；假如我把纳什名字去掉、只剩下均衡一词、均衡也就是纯净的博弈论术语；倘若所有博弈论的文章中、都把纳什名字去掉只剩下均衡；再读一篇篇博弈论文章、也都是围绕着均衡一词展开的叙述；发现通篇文章逻辑不通、词意变异、不知所云；只要是属于纳什均衡的理论文章、去掉纳什名字之后、纳什的鬼魅就出现了；通篇文章，捕风捉影、张冠李戴、以讹......
什么是囚徒困境
囚徒困境的故事讲的是，两个嫌疑犯作案后被警察抓住，分别关在不同的屋子里接受审讯。警察知道两人有罪，但缺乏足够的证据。警察告诉每个人：如果两人都抵赖，各判刑一年；如果两人都坦白，各判八范；如果两人中一个坦白而另一个抵赖，坦白的放出去，抵赖的判十年。于是，每个囚徒都面临两种选择：坦白或抵赖。然而，不管同伙选择什么，每个囚徒的最优选择是坦白：如果同伙抵赖、自己坦白的话放出去，不坦白的话判一年，坦白比不坦白好；如果同伙坦白、自己坦白的话判八年，不坦白的话判十年，坦白还是比不坦白好。结果，两个嫌疑犯都选择坦白，各判刑八年。如果两人都抵赖，各判一年，显然这个结果好。但这个帕累托改进办不到，因为它不能满足人类的理性要求。囚徒困境所反映出的深刻问题是，人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。
什么是囚徒困境？
什么是囚徒困境呢？它的具体内容是什么呢？　　囚徒困境简介　　囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。　　单次发生的囚徒困境，和多次重复的囚徒困境结果不会一样。　　在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡趋向于帕累托最优。　　经典的囚徒困境　　1950年，由就职于兰德公司的梅里尔·弗拉德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问阿尔伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：　　警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：　　若一人认罪并作证检举对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。　　若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。　　若二人都互相检举（互相“背叛”），则二人同样判监2年。　　如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。　　囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：　　若对方沉默、背叛会让我获释，所以会选择背叛。　　若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。　　二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。　　这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。
囚徒困境现象告诉我们什么？
囚徒困境现象告诉我们：个人理性和集体理性之间存在矛盾，个人理性的正确选择会降低大家的福利。

相似回答

囚徒困境原理是什么意思?答：所谓困境，在于如果任何一方选择了合作而对方不合作，己方将万劫不复；而如果对方选择合作而自己选择最优策略，自己则有机会一步登天，将万劫不复留给对方，这就是为什么即使双方都知道唯有合作才能双赢，双方仍然无法合作。

囚徒困境原理详细分析答：1、囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择；2、困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，会频繁出现类似情况；3、单次发生的囚徒困境，和多次重复的囚徒困境结果不一样，在重复的囚徒困境中，博弈被反复进行，每个参与者都有机会去惩罚另一...

囚徒困境问题是由谁在什么文献中最先提出的。。求教答：1.囚徒困境（prisoner's dilemma ）：两个被捕的囚徒之间的一种特殊博弈，说明为什么甚至在合作对双方都有利时，保持合作也是困难的。（源自曼昆《经济学原理》第五版，北京大学出版社）2.1950年，由就职于兰德公司的梅里尔·弗勒德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的...

什么是博弈?什么是囚徒困境?它在垄断竞争中有何作用?答：囚徒困境是博弈论中的一个经典模型。囚犯困境模型的假设条件是：甲乙两个被怀疑为合谋偷窃的嫌疑犯被警方捉获，但警方对他们偷窃的证据并不充分。他们每一个人都被单独囚禁并单独进行审讯，即双方无法互相通信息。警方向这两个嫌疑犯交代的量刑原则是：如果一方坦白，另一方不坦白，则坦白者从宽处理，判刑...

什么是博弈?什么是囚徒困境?它在垄断竞争中有何作用?答：简单点说，就是人与人之间为了谋取利益而竞争。用比较书面话的语言来表述：博弈是指在一定的游戏规则约束下，基于直接相互作用的环境条件，各参与人依靠所掌握的信息，选择各自策略（行动），以实现利益最大化和风险成本最小化的过程。2、什么是囚徒困境？囚徒困境并不是一楼所谓的“囚徒身心皆受困”，...

博弈论十大定律答：博弈论十大定律是重复博弈、囚徒困境、智猪博弈、枪手博弈、斗鸡博弈、蜈蚣博弈、海盗分金、鹰鸽博弈、建立互惠形式、零和游戏原理。1、重复博弈是指在博弈中，双方会采取尽量与对方合作的态度，通过重复博弈来追求长远的利益。这种策略可以使得双方都获得好处，因为重复博弈增加了双方的了解和信任，降低了...

协和谬误与囚徒困境的区别是什么答：第二个区别在于对于策略的选择，协和谬误是为了不浪费沉没成本而做出的选择。囚徒困境是为了将来获得更大的利益而做出的选择。第三是对将来的指导性。协和谬误告诉了我们一个道理（在做决定的时候要尽量不考虑沉没成本）。囚徒困境告诉我们一个原理，尽量让不合作的代价变高收益变低才会使合作保持。

大家正在搜

囚徒困境为什么是困境举例说明什么是囚徒困境囚徒困境的原理囚徒困境说明了什么问题囚徒困境又叫什么如何理解囚徒困境囚徒困境产生的原因囚徒困境根本原因对囚徒困境的理解