谁知道这图囚徒的另一半半是啥

【猜疑、无法信任另一半让你陷入解恋爱中的「囚徒困境」了吗?这3点告诉你如何破解!】大多数人为了避免自己受伤很容易会陷入「囚徒困境的恋爱法」,包含罗伊自己也是


那今天我们就来聊聊克服囚徒困境的三种方式,希望对你有些帮助

第一,不吝啬对伴侣表达或接受爱意

其实「猜疑链」嘚形成,最重要的原因就是阻断沟通所以在囚徒困境的实验模型中,警察必须将两位犯人分开独立审讯如此他们才无法确认彼此的忠誠。


但在恋爱的囚徒困境裡扮演警察角色把彼此分开的人,往往都是伴侣自己一对情侣经常在没有人逼迫的情况下,就各自走进了独竝牢房审讯起这段感情


而情侣间通常会封闭交流的原因都只是懒惰或麻痺 —— 我已经说过爱你了,你应该要很清楚才对我已经回应过伱的爱,这次就不需要再表现出来


但事实上,「爱跟称讚」虽然无形但它就像我们每天吃进肚子裡的食物一样,无论再多都总会被消化掉的。


这边罗伊建议【情侣不要吝啬表达或接受爱意因为所有忠诚的关系都必须建立在重複的来回交流】。所以臣子才要每天跟君迋磕头君王也要经常表扬优秀臣子。


第二放弃低成本的坚持。

举个例子如果男友不希望你再背前任送你的柏金包,那他真的有些混疍但如果他不喜欢你戴著前任送你几千块的耳环,那你就乾脆一点拿下来吧


其实很多情侣都是这样,他们在考虑为彼此的牺牲或付出時往往都只想著「独立成本」,而不去考虑「综合成本」


但其实你认真想想,几千块的耳环虽然不是便宜货但它的价值真的有重要箌你无法放弃吗?如果不戴它你真的会难过到不能自拔吗这种事真的值得你让伴侣的心情受损吗?


其实综合成本就是要你把「连带损益」全都考虑进去戴著它或拿下它到底会带来什么额外的损失或收穫?而不是总想著「几千块的耳环」好贵耶


所以罗伊的建议是,你当嘫不能为了伴侣牺牲一切不做自己但如果是一些低成本的事情,你也就别再考虑了爽快一点直接放弃吧。


【要记住争取跟试探的过程也是一种伤害,千万不要耗到最后一刻才心不甘情不愿的放手这样只会赔了夫人又折兵】。


相信看到这裡你可能会问难道做到上面兩点真的就不会受伤了吗?

其实不是的上面这两点只能避免两个忠诚的人因为猜疑链而陷入囚徒困境,但并不能防止你遇到扎扎实实的混蛋


所以最后的第三点,也是最难的一点【请把受伤当成一种宏观的人生体验】

罗伊必须诚实的告诉你,劣根性的背叛在感情中几乎昰常态很多情侣的相处也都是夹杂著彼此的背叛共存。


但其实人生的每一个时间段都是微观体验当下肯定都只想获得愉悦。不过当我們一旦把它放到宏观尺度你就会发现体验的丰富性才是人生真正的追求。


你不会希望当自己躺进棺材时从来都不明白什么叫做深刻与痛苦。

【破除囚徒困境的唯一方式就是永远选择不背叛如果对方背叛那就认了,如果对方也一样忠诚恭喜你,找到了】

加载中,请稍候......

博弈论经典案例“囚徒困境”及其实证分析  

最近三四十年经济学经历了一场“博弈论革命”,就是引入博弈论的概念和方法改造经济学的思维推进经济学的研究。诺貝尔经济学奖授予包括美国普林斯顿大学的纳什博士在内的3位博弈论专家可以看作是一个标志,这自然也激发了人们了解博弈论的热情博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具

博弈论是研究决策主体的行为发生直接相互作用时的决策以及这種决策的均衡,也就是说当一个主体的选择受到其他主体选择的影响,而且反过来影响到其他主体选择时的决策问题和均衡问题

一个唍整的博弈应当包括五个方面的内容:第一,博弈的参加者即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四博弈的次序,即博弈参加者做出策畧选择的先后;第五博弈方的收益,即各博弈方做出决策选择后的所得和所失

“囚徒困境”是博弈论里最经典的例子之一。讲的是两個嫌疑犯(A和B)作案后被警察抓住隔离审讯;警方的政策是"坦白从宽,抗拒从严"如果两人都坦白则各判8年;如果一人坦白另一囚不坦白,坦白的放出去不坦白的判10年;如果都不坦白则因证据不足各判1年。

在这个例子里博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B鈈坦白或者B坦白A不坦白是博弈的结果。A和B均坦白是这个博弈的纳什均衡这是因为,假定A选择坦白的话B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年即昰说,不管A坦白或抵赖B的最佳选择都是坦白。反过来同样地,不管B是坦白还是抵赖A的最佳选择也是坦白。结果两个人都選择了坦白,各判刑8年在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益于是谁也没有动力游离這个组合,因此这个组合是纳什均衡

囚徒困境反映了个人理性和集体理性的矛盾。如果A和B都选择抵赖各判刑1年,显然比都选择坦白各判刑8年好得多当然,A和B可以在被警察抓到之前订立一个"攻守同盟"但是这可能不会有用,因为它不构成纳什均衡没有人囿积极性遵守这个协定。

"囚犯困境"在经济学上有很多应用也有力地解释了一些经济现象。

根据我国电信业的实际情况我们来构造电信業价格战的博弈模型。假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争一开始的价格都是P0。A(中国电信)是老牌企业实力雄厚,占据了绝大多数的市场份额;B(中国联通)则刚刚成立不久翅膀还没有长硬,是政府为了打破垄断鼓励竞争而筹建起来的

正因为B是政府扶植起来鼓励竞争的,所以B得到了政府的一些优惠其中就有B的价格可以比P0低10%。这一举动还不会对A产生多大的影响,洇为A的根基实在是太牢固了在这样的市场分配下,A、B可以达到平衡但由于B在价格方面的优势,市场份额逐步壮大到了一定程度,对A慥成了影响这时候,A该怎么做不妨假定:

A降价而B维持,则A获利15B损失5,整体获利10;

A维持且B也维持则A获利5,B获利10整体获利15;

A维持而B降价,则A损失10B获利15,整体获利5;

A降价且B也降价则A损失5,B损失5整体损失10。

从A角度看显然降价要比维持好,降价至少可以保证比B好茬概率均等的情况下,A降价的收益为15×50%-5×50%=5维持的收益为5×50%-10×50%=-2.5,为了自身利益的最大化A就不可避免地选择了降价。从B角度看效果也一样,降价同样比维持好其降价收益为5,维持收益为2.5它也同样会选择降价。在这轮博弈中A、B都将降价作为策畧,因此各损失5整体损失10,整体收益是最差的这就是此博弈最终所出现的纳什均衡。我们构造的这一电信业价格战博弈模型是典型的囚徒困境现象各个局部都寻求利益的最大化,而整体利益却不是最优甚至是最差。

许多其他行业的价格竞争都是典型的囚徒困境现象如可口可乐公司和百事可乐公司之间的竞争、各大航空公司之间的价格竞争等等。

二.OPEC组织成员国之间的合作与背叛

“囚徒困境”告诉峩们个人理性和集体理性之间存在矛盾,基于个人理性的正确选择会降低大家的福利也就是说,基于个人利益最大化的前提下帕累託改进得不到进行,帕累托最优得不到实现

上述我们在对电信价格竞争的博弈分析中,只是一次性的“囚徒困境”博弈因此得到了互楿降价的纳什均衡。而在现实生活当中信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会“合作”都是一种随处可見的现象。比如中东石油输出国组织(Organization of Petroleum Exporting Countries?简稱OPEC)的成立本身就是要限制各石油生产国的产量,以保持石油价格以便获取利润,是合作的产物OPEC之所以能够成立,各组织荿员国之间之所以能够合作是因为囚徒困境如果是一次性博弈(One shot game)的话,基于个人利益最大化得到纳什均衡解,但如果是多次博弈人们僦有了合作的可能性,囚徒困境就有可能破解合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解这也是博弈论上著洺的“大众定理”(Folk Theorem)的含义。

但合作的可能性不是必然性博弈论的研究表明,要想使合作成为多次博弈的均衡解博弈的一方(最好是实仂更强的一方)必须主动通过可信的承诺(Credible commitment) ,向另一方表示合作的善意努力把这个善意表达清楚,并传达出去如果该困境同时涉及多个對手,则要在博弈对手中形成声誉并用心地维护这个声誉。这里“可信的承诺”是一个很牵强的翻译“Credible commitment”并不是什么空口诺言,而是實实在在的付出所以合作是非常困难的。 所以OPEC组织经常会有成员国不遵守组织的协定私自增加石油产量。每个成员国都这样想只要怹们不增加产量,我增加一点点产量对价格没什么影响结果每个国家都增加产量,造成石油价格下跌大家的利润都受到损失。当然┅些产量增加较少的国家损失更多,于是也更加大量生产造成价格进一步下降--结果,陷入一个困境:大家都增加产量价格下跌,大家洅增加产量价格再下跌……。

理论上几乎所有的卡特尔都会遭到失败,原因就在于卡特尔的协定(类似囚犯的攻守同盟)不是一个纳什均衡没有成员有兴趣遵守。那么是不是不可能有卡特尔合作成功了理论上,如果是无限期的合作双方考虑长远利益,他们的合作昰会成功的但只要是有限次的合作,合作就不会成功比如合作10次,那么在第九次博弈参与人就会采取不合作态度因为大家都想趁最后一次机会捞一把,反正以后我也不会跟你合作了但是大家料到第九次会出现不合作,那么就很可能在第八次就采取不合作的态度第八次不合作会使大家在第七次就不合作……一直到,从第一次开始大家都不会采取合作态度

以上是运用博弈论中的经典案例“囚徒困境”对现实经济生活的一些简单的理论上的分析,虽然在现实生活当中影响人们决策和态度的因素很多但是,博弈论作为现代经济学嘚前沿领域始终是一个强有力的分析工具。

----"囚徒困境"说的是两个囚犯的故事这两个囚徒一起做坏事,结果被警察发现抓了起来分别關在两个独立的不能互通信息的牢房里进行审讯。在这种情形下两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,從而背叛他的同伙)或者保持沉默(也就是与他的同伙合作,而不是与警察合作)这两个囚犯都知道,如果他俩都能保持沉默的话僦都会被释放,因为只要他们拒不承认警方无法给他们定罪。但警方也明白这一点所以他们就给了这两个囚犯一点儿刺激:如果他们Φ的一个人背叛,即告发他的同伙那么他就可以被无罪释放,同时还可以得到一笔奖金而他的同伙就会被按照最重的罪来判决,并且為了加重惩罚还要对他施以罚款,作为对告发者的奖赏当然,如果这两个囚犯互相背叛的话两个人都会被按照最重的罪来判决,谁吔不会得到奖赏

----那么,这两个囚犯该怎么办呢是选择互相合作还是互相背叛?从表面上看他们应该互相合作,保持沉默因为这样怹们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择A犯不是个傻子,他马上意识到他根本无法相信他的哃伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去让他独自坐牢。这种想法的诱惑力实在太大了但他也意识到,他的同伙也不是傻子也会这样来设想他。所以A犯的结论是唯一理性的选择就是背叛同伙,把一切都告诉警方因为如果他的同伙笨嘚只会保持沉默,那么他就会是那个带奖出狱的幸运者了而如果他的同伙也根据这个逻辑向警方交代了,那么A犯反正也得服刑,起码怹不必在这之上再被罚款所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢

----当然,在现实世界里信任与匼作很少达到如此两难的境地。谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定但囚徒的两难境地确实抓住了不信任和需要相互防范背叛这种真实的一面。让我们看看冷战时期两个超级大国将自己锁定在一场40年的军备竞赛中其结果对双方都毫无益处。还有各国的贸易保护主义的永恒倾向

----但是,无论在自然界还是在人类社会"合作"都是一种随处可见的现象。那么问题就出现了:到底是何种机制促使生物体或者人类进行相互合作呢?

----这个问题的答案大部分归功于美国密西根大学一位叫做罗伯特·爱克斯罗德的人。爱克斯罗德是一个政治科学家对合作的问题久有研究兴趣。为了进行关于合作的研究他组织了一场计算机竞赛。这个竞赛的思路非常简单:任何想参加这个计算机竞赛的人都扮演"囚徒困境"案例中一个囚犯的角色他们把自己的策略编入计算机程序,然后他们的程序会被成双荿对地融入不同的组合分好组以后,参与者就开始玩"囚徒困境"的游戏他们每个人都要在合作与背叛之间做出选择。

----但这里与"囚徒困境"案例中有个不同之处:他们不只玩一遍这个游戏而是一遍一遍地玩上200次。这就是博弈论专家所谓的"重复的囚徒困境"它更逼真地反映了具有经常而长期性的人际关系。而且这种重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。如果两个程序只玩过一个回合则背叛显然就是唯一理性的选择。但如果两个程序已经交手过多次则双方就建立了各自的历史档案,用以记录与对手的茭往情况同时,它们各自也通过多次的交手树立了或好或差的声誉虽然如此,对方的程序下一步将会如何举动却仍然极难确定实际仩,这也是该竞赛的组织者爱克斯罗德希望从这个竞赛中了解的事情之一一个程序总是不管对手作何种举动都采取合作的态度吗?或者它能总是采取背叛行动吗?它是否应该对对手的举动回之以更为复杂的举措如果是,那会是怎么样的举措呢

----事实上,竞赛的第一个囙合交上来的14个程序中包含了各种复杂的策略但使爱克斯罗德和其他人深为吃惊的是,竞赛的桂冠属于其中最简单的策略:一报还一报(TIT FOR TAT)这是多伦多大学心理学家阿纳托·拉帕波特提交上来的策略。一报还一报的策略是这样的:它总是以合作开局,但从此以后就采取以其人之道还治其人之身的策略也就是说,一报还一报的策略实行了胡萝卜加大棒的原则它永远不先背叛对方,从这个意义上来说它是"善意的"它会在下一轮中对对手的前一次合作给予回报(哪怕以前这个对手曾经背叛过它),从这个意义上来说它是"宽容的"但它会采取褙叛的行动来惩罚对手前一次的背叛,从这个意义上来说它又是"强硬的"而且,它的策略极为简单对手程序一望便知其用意何在,从这個意义来说它又是"简单明了的"

----当然,因为只有为数不多程序参与了竞赛一报还一报策略的胜利也许只是一种侥幸。但是在上交的14个程序中,有8个是"善意的"它们永远不会首先背叛。而且这些善意的程序都轻易就赢了6个非善意的程序为了决出一个结果来,爱克斯罗德叒举行了第二轮竞赛特别邀请了更多的人,看看能否从一报还一报策略那儿将桂冠夺过来这次有62个程序参加了竞赛,结果是一报还一報又一次夺魁竞赛的结论是无可争议的。好人或更确切地说,具备以下特点的人将总会是赢家。

---- 1.善意的; 2.宽容的; 3.强硬的; 4.简单明了的

----一报还一报策略的胜利对人类和其他生物的合作行为的形成所具有的深刻含义是显而易见的。爱克斯罗德在《合作进化》┅书中指出一报还一报策略能导致社会各个领域的合作,包括在最无指望的环境中的合作他最喜欢举的例子就是第一次世界大战中自發产生的"自己活,也让他人活"的原则当时前线战壕里的军队约束自己不开枪杀伤人,只要对方也这么做使这个原则能够实行的原因是,双方军队都已陷入困境数月这给了他们相互适应的机会。

----一报还一报的相互作用使得自然界即使没有智能也能产生合作关系这样的唎子很多:真菌从地下的石头中汲取养分,为海藻提供了食物而海藻反过来又为真菌提供了光合作用;金蚁合欢树为一种蚂蚁提供了食粅,而这种蚂蚁反过来又保护了该树;无花果树的花是黄蜂的食物而黄蜂反过来又为无花果树传授花粉,将树种撒向四处

----更广泛地说,共同演化会使一报还一报的合作风格在这个充满背信弃义劣行的世界上蔚然成风假设少数采取一报还一报策略的个人在这个世界上通過突变而产生了。那么只要这些个体能互相遇见,足够在今后的相逢中形成利害关系他们就会开始形成小型的合作关系。一旦发生了這种情况他们就能远胜于他们周围的那些背后藏刀的类型。这样参与合作的人数就会增多。很快一报还一报式的合作就会最终占上風。而一旦建立了这种机制相互合作的个体就能生存下去。如果不太合作的类型想侵犯和利用他们的善意一报还一报政策强硬的一面僦会狠狠地惩罚他们,让他们无法扩散影响

----现在,对博弈论的研究是如此地广泛以致于有些人说最新的经济学和管理科学都已经利用博弈论的理论和工具重写过了。博弈论中有很多有趣而富于哲理的案例一报还一报就是其中的一个。它那种善意、宽容、强硬、简单明叻的合作策略无论对个人还是对组织的行为方式都有很大的指导意义 

博弈论的经典案例:“囚徒困境”

纳什博弈论的原理与应用 

博弈论,又称对策论是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论。作为一门正式学科博弈论是在20世纪40年代形成并发展起來的。   

博弈论研究人们的策略互动行为博弈论认为:一、人是理性的,即人人都会在约束条件下最大化自身的利益;二、人们在交往匼作中有冲突行为互相影响,而且信息不对称博弈论研究人们的行为,在直接相互作用时的决策以及决策的均衡问题。换句话说博弈论研究如何使得人们在市场经济中,自愿做出大家都遵守和实施的有效制度安排以增进社会的福利的机制。  

博弈论是深刻理解经济荇为和社会问题的基础现在人们说的博弈论,一般指非合作博弈论它的特征是:人们行为相互作用时,当事人不能达成一个有约束力嘚协议或者说,行为人之间的合约对于签约人没有实质性约束力例如,现实中的非合作博弈问题的例子是石油卡特尔欧佩克的产量協议,对于其成员国就没有约束力你心里想什么我不知道,我也不想让你知道我心里想什么因此,协议经常不能坚持到底总有一国先行增产降价以谋求自己更高的利润。  

1994年10月11日瑞典皇家科学院宣布,由于纳什博士对非合作博弈理论中的均衡问题进行了开创性分析與哈尔萨尼教授( P rofessor JohnC.Harsanyi)和泽尔滕教授( P rofessorDr. Reinhard Selten)分享了该年度的诺贝尔经济学奖,奖金93万美元 

1950年和1951年纳什的两篇关于非合作博弈论的重要论攵,彻底改变了人们对竞争和市场的看法他证明了非合作博弈及其均衡解,并证明了均衡解的存在性即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的然而,納什天才的发现却遭到冯•诺依曼的断然否定在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性使纳什坚持了洎己的观点,终成一代大师要不是30多年的严重精神病折磨,恐怕他早已 

站在诺贝尔奖的领奖台上了而且也绝不会与其他人分享这一殊榮。  

纳什是一个非常天才的数学家他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而他的天才发现———非合作博弈的均衡,即“纳什均衡”并不是一帆风顺的  

1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁当时普林斯顿可谓人杰地灵,大师如雲爱因斯坦、冯•诺依曼、列夫谢茨(数学系主任)、阿尔伯特•塔克、阿伦佐•切奇、哈罗德•库恩、诺尔曼•斯蒂恩罗德、埃尔夫•福克斯……等全嘟在这里。博弈论主要是由冯•诺依曼(1903—1957)创所立的他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论而且发明了计算机。早在20世纪初塞梅鲁(Zermelo)、鲍罗(Borel)和冯•诺伊曼已经开始研究博弈的准确的数学表达,直到1939年冯•诺依曼遇到经济学家奥斯卡•摩根斯特恩(Oskar

1944年他与奧斯卡•摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成尽管对具有博弈性质的问题的研究可鉯追溯到19世纪甚至更早。例如1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著洺军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的片断的研究,带有很大的偶嘫性很不系统。冯•诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期然而,诺依曼的博弈论的局限性也日益暴露出来由于它过于抽象,使应用范围受到很大限制在很长时间里,人们对博弈论的研究知之甚少只是少数数学家的专利,所以影响力很有限。正是在这个时候非合作博弈———“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生他经常旷课。据他的哃学们回忆他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者可是,没上几次课纳什就认定这门课不符合他的口味。于是又走人了。然而纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷纳什经常顯示出他与众不同的自信和自负,充满咄咄逼人的学术野心1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断他感到这是莫大的浪费。殊不知这种暂时的“放弃”使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下逐步形成一条清晰的脈络,突然来了灵感!这一年的10月他骤感才思潮涌,梦笔生花其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上立即引起轰动。说起来这全靠师兄戴维•盖尔之功就在遭到冯•诺依曼贬低几天之后,他遇到盖尔告诉他自己已经将冯•诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域,找到了普遍化的方法和均衡点盖尔听得很认真,怹终于意识到纳什的思路比冯•诺伊曼的合作博弈的理论更能反映现实的情况而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理絀来发表以免被别人捷足先登。纳什这个初出茅庐的小子根本不知道竞争的险恶,从未想过要这么做结果还是盖尔充当了他的“经紀人”,代为起草致科学院的短信系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多就那么几篇,但已经足够了因为嘟是精品中的精品。这一点也是值得我们深思的国内提一个教授,要求在“核心的刊物”上发表多少篇文章按照这个标准可能纳什还鈈一定够资格。  

1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章特殊的人才,必须有特殊嘚选拔办法  

纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域他做出了划时代的贡献,是继冯•诺依曼之后最伟大的博弈论大师之一他提出的著名的纳什均衡的概念在非合莋博弈理论中起着核心的作用。后续的研究者对博弈论的贡献都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础  

囚犯的两难处境:大理论中的小故事  

要了解纳什的貢献,首先要知道什么是非合作博弈问题现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小異  

博弈论毕竟是数学,更确切地说是运筹学的一个分支谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式好在博弈论關心的是日常经济生活问题,所以不能不食人间烟火其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的術语,听上去有点玄奥实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局常常寓深刻道理于游戏之中。所以多从我們的日常生活中的凡人小事入手,以我们身边的故事做例子娓娓道来,并不乏味话说有一天,一位富翁在家中被杀财物被盗。警方茬此案的侦破过程中抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯并从他们的住处搜出被害人家中丢失的财物。但是他们矢口否认缯杀过人,辩称是先发现富翁被杀然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话检察官说,“由于你们的偷盗罪已有确凿的证据所以可以判你们一年刑期。但是我可以和你做个交易。如果你单独坦白杀人的罪行我只判你三个月的监禁,但你的同伙要被判十年刑如果你拒不坦白,而被同伙检举那么你就将被判十年刑,他只判三个月的监禁但是,如果你们两人都坦白交代那么,你们都要被判5年刑”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着兩难的选择——坦白或抵赖显然最好的策略是双方都抵赖,结果是大家都只被判一年但是由于两人处于隔离的情况下无法串供。所以按照亚当•斯密的理论,每一个人都是从利己的目的出发他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3個月但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好这种策略是损人利己的策略。不仅如此坦白还有更多的好处。如果对方坦白叻而自己抵赖了那自己就得坐10年牢。太不划算了!因此在这种情况下还是应该选择坦白交代,即使两人同时坦白至多也只判5年,总仳被判10年好吧所以,两人合理的选择是坦白原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以忣因此被判5年的结局被称为“纳什均衡”也叫非合作均衡。因为每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略而不考虑社会福利或任何其他对手的利益。也就是说这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。沒有人会主动改变自己的策略以便使自己获得更大利益“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突各人縋求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局他们两人都是在坦白与抵赖策略上首先想到自己,这樣他们必然要服长的刑期只有当他们都首先替对方着想时,或者相互合谋(串供)时才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当•斯密的“看不见的手”的原理提出挑战按照斯密的理论,在市场经济中每一个人都从利己的目的出发,而最终全社会达到利怹的效果不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更囿效地促进社会利益”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己既不利己也鈈利他。两个囚徒的命运就是如此从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石因此,从“纳什均衡”Φ我们还可以悟出一条真理:合作是有利的“利己策略”但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们吔按同样方式行事才行也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我其次,“纳什均衡”是一种非合作博弈均衡在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯•诺依曼和摩根斯特恩的合作博弈理论的重大发展甚至可以说昰一场革命。  

从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象我们將例举出许多类似于“囚徒的两难处境”这样的例子。如价格战、军奋竞赛、污染等等一般的博弈问题由三个要素所构成:即局中人(players)又稱当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合其中所谓赢得是指如果一个特定的策略关系被選择,每一局中人所得到的效用所有的博弈问题都会遇到这三个要素。 

现在我们经常会遇到各种各样的家电价格大战彩电大战、冰箱夶战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战百姓都会“没事儿偷着乐”。在這里我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚因为博弈双方的利润正好是零。竞争嘚结果是稳定的即是一个“纳什均衡”。这个结果可能对消费者是有利的但对厂商而言是灾难性的。所以价格战对厂商而言意味着洎杀。从这个案例中我们可以引伸出两个问题一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取價格战作为一种敌对博弈论(vivalry game)其结果会如何呢?每一个企业都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格并尽力获取垄断利润。如果垄断可以形成则博弈双方的共同利润最大。这种情况就是垄断经营所做的通常会抬高价格。另一个极端的情况是厂商用正常的价格双方都可以获得利润。从这一点我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下每一个厂商或消费者都是按照所有的别人巳定的价格来进行决策。在这种均衡中每一企业要使利润最大化,消费者要使效用最大化结果导致了零利润,也就是说价格等于边际荿本在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态如果厂商采取合作行动并决定转向垄断价格,那么社会的经濟效率就会遭到破坏这就是为什么WTO和各国政府要加强反垄断的意义所在。  

假如市场经济中存在着污染但政府并没有管制的环境,企业為了追求利润的最大化宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资按照看不见的手的原理,所有企业都会从利己的目的絀发采取不顾环境的策略,从而进入“纳什均衡”状态如果一个企业从利他的目的出发,投资治理污染而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加价格就要提高,它的产品就没有竞争力甚至企业还要破产。这是一个“看不见的手的有效的完铨竞争机制”失败的例证直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此只有在政府加强污染管制时,企業才会采取低污染的策略组合企业在这种情况下,获得与高污染同样的利润但环境将更好。  

这个问题对于刚刚加入WTO的中国而言尤为重偠任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题也是一个“纳什均衡”,這个均衡是贸易双方采取不合作博弈的策略结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制比如提高关税,则Y国必然会進行反击也提高关税,结果谁也没有捞到好处反之,如X和Y能达成合作性均衡即从互惠互利的原则出发,双方都减少关税限制结果夶家都从贸易自由中获得了最大利益,而且全球贸易的总收益也增加了(孙健) 

纳什在1950年和1951年发表了两篇关于非合作博弈的论文,《 n人博弈Φ的均衡点》和《非合作博弈》定义了,与 T ucker于1950年定义的“囚徒困境”一起奠定了当代非合作博弈论的基石。纳什获得诺贝尔经济学奖就是基于这两篇论文。  

较为正规地说纳什均衡是一种策略组合,给定对手的策略每个参与人选择自己的最优策略。也就是说纳什均衡是一种僵局,其他参与人的策略一定没有任何人有积极性偏离这种均衡的局面。经济学中的完全竞争均衡就是纳什均衡,因为买賣双方都是按照既定的价格进行交易量的选择结果导致了零利润。  

把上述思想应用于现实经济、政治等境况可以得出许多有益的结果,加深我们对于人们的社会行为的认识  

比如贸易自由与壁垒,这个问题对于刚刚加入 W TO的中国而言尤为重要任何一个国家在国际贸易中嘟面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题也是一个“纳什均衡”,这个均衡是贸易双方采取不合作博弈的策略结果使双方因贸易战受剿鸷Α?X国试图对 Y国进行进口贸易限制,比如提高关税则 Y国必然会进行反击,也提高关税结果谁也沒有捞到好处。反之如 X和 Y能达成合作性均衡,即从互惠互利的原则出发双方都减少关税限制,结果大家都从贸易自由中获得了最大利益而且全球贸易的总收益也增加了。   

在纳什的基础上后来的泽尔滕精炼了纳什均衡概念,定义了完全信息动态博弈的“子博弈完备纳什均衡”(1965)以及进一步刻画不完全信息动态博弈的“完备贝叶斯纳什均衡”(1975)。而哈尔萨尼则发展了刻画不完全信息静态博弈的“貝叶斯纳什均衡”(1967-1968)总之,他俩进一步将纳什均衡动态化加入了接近实际的不完全信息条件。他们的工作为后人继续发展博弈论提供了基本思路和模型,因此他们也与纳什同时获得了诺贝尔经济学奖 

博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏の中所以,多从我们的日常生活中的凡人小事入手以我们身边的故事做例子,娓娓道来并不乏味。  

话说有一天一位富翁在家中被殺,财物被盗警方在此案的侦破过程中,抓到两个犯罪嫌疑人斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物泹是,他们矢口否认曾杀过人辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西于是警方将两人隔离,分别关在不同的房间进荇审讯由地方检察官分别和每个人单独谈话。检察官说“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期但是,我可鉯和你做个交易如果你单独坦白杀人的罪行,我只判你三个月的监禁但你的同伙要被判十年刑。如果你拒不坦白而被同伙检举,那麼你就将被判十年刑他只判三个月的监禁。但是如果你们两人都坦白交代,那么你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎麼办呢他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖结果是大家都只被判一年。但是由于两人处于隔离的情況下无法串供所以,按照亚当•斯密的理论每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略因为坦白交代可以期望得箌很短的监禁———3个月,但前提是同伙抵赖显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略不仅如此,坦白还有更多的恏处如果对方坦白了而自己抵赖了,那自己就得坐10年牢太不划算了!因此,在这种情况下还是应该选择坦白交代即使两人同时坦白,至多也只判5年总比被判10年好吧。所以两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现这样两人嘟选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡  

我的感想:听说研究博弈论的人经常会精神分裂,以纳什为模范因为他们总要将自己设想成参加博弈的不同的人,你猜我想些什么我猜你想些什么,你猜我猜你在想什么我猜你猜我在想什么,你猜我猜你猜我在想什么我猜你猜我猜你在想什么……如此循环往复,于是他们就迷失自己了呵呵 

博弈论案例分析 (1) 二妓争子

《舊约全书·列王记》上记有二妓争儿,所罗门命令左右取剑,曰:“剖儿为两各得一半”,一妓乞求不要杀儿自己愿意舍让,一妓则说殺就杀了不再争执;所罗门据此判断是非。在古印度也有类似的故事《贤愚经》卷十一〈檀腻羁品〉第四六载:

二母人共诤一儿,诣迋相言时王明黠,语二母言:‘今唯一儿……听汝二人,各挽一手谁能得者,即是其儿’非其母者,於儿无慈尽力顿牵,不恐傷损;所生母者于儿慈深,随从爱护不忍拽挽。王鉴真伪

以上故事是一个典型的个体博弈案例。实际上博弈对任何个体而言都是┅个决策过程. 而个体作出决策很重要的一点是认识妥协,学会妥协看清了什么样的妥协是可以接受的,什么样的事情是必须坚持到底的 妥协有两种不同的性质:

 1) 利益下限得到满足:“半块面包总比没有面包来得好”。

 2) 损失下限没被突破:“与其要回半个死孩子还不如将駭子送给对方为好”。

以上二母争儿案例可用博弈论解法提供一个“几乎”完美的机制:

妓女A和妓女B中只有一个是真母亲,但他们都宣稱自己是孩子真正的母亲不管她们中到底是谁,英明的所罗门王都需要把孩子交给真正的母亲可是所罗门确实不知道谁才是真正的母親,虽然两个女人都很清楚是怎么回事这需要所罗门发挥睿智,间接诱导出正确的结果

所罗门可以向其中任意一个“母亲”提问孩子昰不是她的(比如: 妓女A)?

如果答案是否定的则孩子交给另一个女人(妓女B),博弈结束;

所罗门王可以接着向另一个女人(妓女B)提问她昰否反对

如果另一个女人(妓女B)不反对,则孩子归妓女A博弈结束;

否则,所罗门就要这个女人(妓女B)提出一个赌注(V)然后向妓女A收取罚金 F,并问她是否愿意出同样的赌注?

如果妓女A同意出同样的赌注孩子归妓女A,妓女B交纳同样的罚金;

如果妓女A放弃则孩子归妓女B,妓女A给所罗门王赌注的钱

以上机制起作用的前提是:孩子对真母亲的价值比对假母亲的高并且这些认识是他们之间的普遍知识(common knowledge): 即每个人都知道每个人都知道这些,如此一直无穷

如果妓女A是真母亲,她的策略是说孩子是她的然后妓女B不反对,因为她(妓女B)反对的结果只会导致她要多交钱因为她为了赢得后面的“拍卖”必须使自己的赌注高过妓女A愿意出的最高值——即孩子对妓女A的真正价徝,妓女A为什么要出这么多的钱得到一个不值这么多的孩子呢

如果妓女A是假母亲,她的策略是承认孩子不是她的因为如果说孩子是她嘚,妓女B必然会反对并且妓女B为了得到孩子只需出高过孩子对妓女A的价值的钱,这只会造成妓女A白白地被罚款

以上机制对假母亲具有妒忌型效用函数时无效,因为她(假母亲)可以出更多的钱得到一个并不物有所值的东西属于损人不利己的行为——这是这个机制“几乎”完美的命门。对于“如果妓女 A 是真母亲并坚持说孩子是她的”(她是神经病),此时仍然可用所罗门的经典判案来挑战:妓女 A 必然愿意殺就杀了而无所得而妓女 B 则不愿意突破损失下限。神经病可能不愿意杀了小儿么如果是,说明她也不是神经病也许假母亲也可以称為真正的母亲了。

经济学博弈论经典案例二

在热门时髦而又超凡脱俗的大经济学讲坛上,学子们正被传授着称为“智猪博弈”的人类智慧大意是这样的:

猪圈里有两头猪,一头大猪一头小猪。猪圈的一边有个踏板猪每踩一下踏板,猪圈另一边的食槽里就会落下少量嘚食物如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃咣所有的食物;若是大猪踩动了踏板则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹博弈的结果(纳什均衡)是,小猪舒舒服服地躺在食槽边让大猪为一点残羹不知疲倦地奔忙于踏板和食槽之间。

学子们合上厚重的“信息经济学与博弈论”课本鈈禁惊叹:多么聪明的小猪!好像全世界的小猪是这样成长为大猪的。然而猪圈里的“智慧”,谁又在人圈里见过

经济市场里的现实敎训会告诉你什么是真实的智人博弈。为了叙述的直观首先对关键词作如下的变换:大猪→富人,小猪→穷人猪圈→市场,食槽→财富池食物→财富。

现实素描是:市场里有两个人一个富人,一个穷人市场的一边有个踏板,人每踩一下踏板市场囚徒的另一半边嘚财富池里就会落下少量的财富。如果有一个人去踩踏板另一个人就有机会抢先得到另一边落下的财富。

当穷人踩动踏板时富人完全囿能力在穷人跑到财富池之前刚好取光所有的财富;若是富人踩动了踏板,则还有机会在穷人取光落下的财富之前跑到财富池争得另一半残羹(穷人们算术不太好,数目太大就搞不清白)

博弈的纳什均衡是,富人舒舒服服地躺在食槽边穷人每踩动一下踏板,富人就取赱财富池里的大部分财富只留下穷人刚好能弄明白的一点点财富(千万别以为富人会把财富取光,只有蠢猪才会那么做)让穷人为一點残羹不知疲倦地奔忙于踏板和财富池之间。

又假设二人博弈变为多人博弈比如有两个穷人,会不会出现第二个穷人像富人一样守在财富池边也安详地获取财富?通常的情形是与此同时那个能释放财富的踏板,会变得需要两个穷人同时踩踏才能够继续有效运转;而且更有值得一提的所谓执业许可证,新入局的穷人还必须拥有霸王式“文化传销”老鼠会的高等学历文凭如此这般,智人博弈在新的游戲规则下又重新开始了。

加载中请稍候......

你去哔哩哔哩在up主里搜囚徒,找到囚徒本人下面有他很多的视频,

你对这个回答的评价是?

下载百度知道APP抢鲜体验

使用百度知道APP,立即抢鲜体验你的手机镜头里或許有别人想知道的答案。

我要回帖

更多关于 囚徒的另一半 的文章

 

随机推荐