预示着另一方必输。栗子小说 m.lizi.tw然而生活中的大多数对局情况都是非零和的,不是此消彼长的关系,而是双方都可以做得很好或是很差。双方达成合作是极有可能的,只是并不一定都能实现而已。人们在很多情况下都倾向于采用相对标准,把对方的成功与自己的成功对立起来,认为对方成功了自己就一定失败。这种标准的直接后果就是会引起人的嫉妒心,导致自己选择的策略企图抵消对方已经得到的优势。在囚徒困境的模式下,抵消对方优势的唯一途径就是通过背叛来实现。如此便会进入一个恶性循环的怪圈,背叛会导致更多的背叛和双方都受到惩罚的结局。因此说,嫉妒的出发点是自我保护,但其结果却是自我毁灭。在任何一局非零和的博弈中,你没有必要非得比对方做得更好。要求自己比对方做得好不是一个很好的标准除非你的目的是消灭对方,因为这个目的在大多数情况下是不可能或者说很难实现的。尤其是当你要和许多不同的对手打交道时,就更不要去嫉妒对方的成功。因为在重复囚徒困境中,其他人的成功是你成功的前提。举一个大家都比较常见的例子,一家商店从供应商那儿买商品,妒忌供应商的利润是完全没有必要的。任何由妒忌而引起的企图通过不按时付账等不合作行为来减少供方利润的做法,都是对自己不利的鲁莽举动,都将激起供方的诸如拖延发货、不愿意打折扣或者不提供市场变化的信息等报复行为。而商店就会因此付出极大的代价,为自己的妒忌心理埋单。第二,不要首先背叛,耍小聪明。真实实验和理论分析的结果都表明,只要对方有意合作,你也积极配合,促成合作就会有好处。表明对方是否有合作意愿的最好的特征就是对方的出发点是否善良,是否不首先背叛。当对方使用一些不善良的出发点行事时,会使用相当复杂的方法来试探这个出发点是否能逃脱对方的惩罚。比如尝试在第一步背叛,等第一步出现结果发现对方进行报复的话,就马上撤回。或者是在背叛前等待十几步,看对方是否能被哄骗或被偶尔占便宜。如果能的话,那就更频繁地、肆无忌惮地增加背叛的砝码,直到受到对方的反击才被迫撤回。但是实验结果表明,这些尝试背叛策略的表现都不怎么好。因为他没有考虑自己的行为可能引起的对方的变化。对方对你所采取的策略是有反应的,会把你的行为看做你是否会回报合作的信号。你自己的行为会映射到你自己身上,自食其果,由此而导致的冲突的代价是很高的。
第15节:第一篇从囚徒困境讲起
当然,你也可以尝试一种比较保险的方式,即先背叛对方直到对方合作,才开始合作。然而,实验结果表明,这是一个理论上较保险,而实际上很有风险的策略,因为你的最初的背叛就可能引起对方的报复,使你处于要么被占便宜,要么彼此背叛、两败俱伤的两难境地。如果你发现对方报复了,再惩罚对方的报复,而对方再对你的惩罚进行报复这种循环就会一直延续下去,后果可想而知。有的参与者会耍一些小聪明,比如采取相当复杂的策略,以至于打乱对方的常规思维,让对方摸不到自己的思路而陷入不知所措的困境。作为对方而言,也会采用一个随机的策略,其行为效果就是对对方选择不反应。如果你给对方的感觉是无反应的,对方当然就猜不透你是如何想的,就受不到与你合作的激励,也就不会去积极地促成合作。因此,策略复杂到不可理解是非常危险的。三、一报还一报现在,人们对博弈论的研究非常广泛,以至于有些人形象地说最新的经济学和管理科学都已经用博弈论的理论和工具重新写过了。这虽说有些夸张,但也绝非言过其实,博弈论在现代生活中确实占了很大比重。小说站
www.xsz.tw博弈论中的参与者有很多有趣且富于哲理的选择策略,适用于重复博弈的一报还一报就是其中之一。一报还一报策略大致是这样的:它总是以合作开局,再进一步合作,但从此以后就采取以其人之道还治其人之身的策略,采用对方上一步的选择。也就是说,一报还一报意味着在对方每背叛一次之后,自己就背叛一次,而永远不先背叛对方。一报还一报是一种综合了善意性、宽容性、报复性强硬性、适应性和清晰性的合作策略,无论对于个人还是对于组织,其行为方式都有很大的指导意义。总的来说,它比竞赛中的其他策略做得都好。一报还一报策略放弃了占他人便宜的可能性,永远不先背叛对方,把自己的利益建立在他人的损失之上。从这一特点来看,它是善意的。因为采用试图占便宜的出发点而引来的问题是多种多样的。首先,如果一个策略用背叛来试探是否可以占他人的便宜,那么它可能要受到因破坏游戏规则而被报复的风险;其次,若双方的报复反击一旦开始,就会陷入恶性循环之中,双方都很难全身而退,得到解脱。而一报还一报的这种善意性可防止博弈参与者陷入不必要的麻烦。一报还一报的善意性永远不先背叛对方使得其从来没有一次在游戏中使运用者比对方得到更多的好处。事实上,他也不可能比对方多得好处。因为它总是让对方先背叛,这就注定了他策略使用者的背叛次数肯定比对方少。所以一报还一报不是得到与对方一样多的好处,就是比对方略少。一报还一报之所以会获得比其他任何策略更多的总体利益,就是因为它不是靠打击对方,而是靠从对方引出对双方都有好处的行为。
第16节:第一篇从囚徒困境讲起
一报还一报策略还给出了一个简单但又很有力量的建议:无论对方的选择是合作还是背叛,自己都要回报会在下一轮中对对手的前一次合作给予简单的回报哪怕以前这个对手曾经背叛过他,并且一报还一报总是在对方每次背叛之后只背叛一次。这点足以说明其具有宽容性。它的这种宽容性有助于重新恢复合作。一报还一报的策略会采取背叛的行动来惩罚对手前一次的背叛,从这个意义上来说它又是报复性强硬性的。一报还一报从不首先背叛对方,但是不管过去相处的关系如何好,它总能被对方的一个背叛所激怒,而迅速作出反应,给予相同程度的报复行为。它的这种报复性使对方试着背叛一次之后就不敢再背叛,增大了转向合作的概率。一报还一报能在众多的策略中独占鳌头,比其他任何策略表现得都好,足以说明它是一个很具适应性的策略,它不仅可与最初的各种策略相处得很好,而且能与那些可能在未来群体中占较大份额的成功策略相处得很好。它只会在与其他成功的策略相互交流中繁荣起来,而绝不会毁坏自己得到进一步改善的基础。任何想占一报还一报便宜的策略最终将伤害自己,屈服于一报还一报。一报还一报在竞赛中能够得到成功的另一个重要原因是它具有很大的清晰性,极易被对方理解,从而引出长期合作。让对方清楚地意识到你愿意合作是一报还一报成功的诀窍所在。当你选用一报还一报策略时,对方很容易去理解你在干什么,接下来要干什么,是打算合作还是想要背叛,以根据你的反应来作出相应的回应。在博弈的过程中,你的任何一次背叛,都容易被对方意识到,进而可能迫使对方采取一对一的报复。而你所做的任何一次促进合作的努力,对方也会在第一时间感受到。此时,对方能容易地发现应付你的一报还一报的最好方式就是与你达成合作,互利互惠。台湾小说网
www.192.tw当你遇到对方使用一报还一报策略时,也只有马上与他合作才是最佳选择,这样你将可以在下一步博弈中得到合作。一报还一报策略的伟大胜利,对人类和其他生物合作行为的形成是具有深刻含义的。爱克斯罗德在合作进化一书中指出一报还一报策略能导致社会各个领域的合作,包括在最无指望的环境中的合作。举个最明显的例子就是在第一次世界大战中自己活,也让他人活原则的产生。当时在作战前线的战壕里,军队纪律规定自己的士兵不准乱开枪杀人,希望促使对方也这么做。结果证明,这个原则得到了很好的实行,给了当时陷入困境数月的双方军队以相互了解、相互适应的机会。即使是一报还一报这种有效的破解囚徒困境的策略,也不是万能的,也难免会产生使双方都陷入两败俱伤的危险。首先,当一报还一报策略重复使用,纠缠在一起的时候,就会陷入循环报复的局面,致使博弈双方都难以脱身。其次,由于一报还一报的核心是对对方的任何行为都要给予及时有效的回报,就是说当遭遇他人侵犯时也一定会以牙还牙,毫不妥协。但需强调一点的是,这种策略的前提是人不犯我,我不犯人,这样可以大大降低博弈参与者相互伤害的几率。总的来说,一报还一报策略利还是大于弊,目前应该算是一种有效的破解囚徒困境的理想策略。
第17节:第二篇纳什均衡:谁都不能改变策略
第二篇纳什均衡:谁都不能改变策略诺贝尔经济学奖获得者、著名经济学家保罗萨缪尔森有句至理名言:你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词:供给与需求。后来,博弈论专家坎多瑞引申说:这只鹦鹉要成为现代经济学家,还必须再多学一个词:纳什均衡。纳什均衡,是指在一组策略组合中,所有的参与者都面临这样一种情况:当其他人不改变策略时,他此时的策略是最好的。如果某个人单独改变策略,那么他的支付就将会降低。纳什均衡状态是市场力量相互作用下博弈的一种稳定结局。一、爱心护天才约翰纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为非合作博弈1950的博士论文。该博士论文导致了n人博弈中的均衡点1950和非合作博弈1951两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献,是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。在一种纳什均衡的情况下,所有局中人的预期都得到满足,他们所选择的策略都是最优的。纳什提出了对该均衡概念的两种解释:一种基于理性;另一种基于统计总体。据理性解释,局中人都被设想为是理性的,他们有关于博弈的结构,包括所有局中人有关可能结果的偏好的完全信息,在这种情况下,完全信息是常识。既然所有局中人都有关于各自策略选择和偏好的完全信息,他们也就都能计算各自的有关每一组预期的最优策略选择。假如所有局中人都预期同意纳什均衡的话,那么,对谁也不会有改变其策略的激励。纳什的第二种解释依据统计总体作出的解释适用于所谓的进化博弈。这类博弈,为了了解自然淘汰原理在物种间和物种内策略上的相互影响上如何发挥作用,也已经在生物学中提出了。纳什证明,在局中人人数有限的每一类博弈中都存在某种混合策略的均衡。
第18节:第二篇纳什均衡:谁都不能改变策略
1994年瑞典皇家科学院贺词1994年诺贝尔经济学奖,授予了三位对博弈论作出奠基性贡献的学者:美国数学家纳什、美国经济学家约翰海萨尼和德国波恩大学教授莱茵哈德泽尔腾。这标志着博弈论已经成为现代经济学的一个重要组成部分。大名鼎鼎的纳什和库恩是普林斯顿大学数学系塔克教授的学生。现在凡博弈论著作都必讲的囚徒困境,就出于塔克教授在斯坦福大学的一次讲演。他的学生纳什则从囚徒困境中得到启发,发展得出了在博弈论中占据核心位置的纳什均衡。纳什的一生富有传奇色彩。他在1950年7月13日22岁生日那天获得数学哲学博士学位,1957与来自萨尔瓦多的阿丽莎结了婚,第二年他们回到麻省理工学院,纳什得到了终身学位。纳什不到30岁就已经闻名遐迩,曾被美国著名的财富杂志推举为同时活跃在纯数学和应用数学两个领域的天才数学家中最杰出的人物、美国最耀眼的科学新星。可在盛名的顶峰,在学术生涯向巅峰攀升的大好年华,病魔袭击了纳什。他得了妄想性精神分裂症。这使他在以后的生活里,长期饱受着思维与情绪错乱的困扰,偏执型精神分裂症使他几乎成为一个废人。从1959年开始,纳什在上课的时候会语无伦次,演讲的时候会说一些毫无意义的内容。因为实在无法继续工作,辞去了在麻省理工学院的教职。纳什完全被病魔所控制,往昔才华横溢的天才少年,变成了一个衣着怪异、喜欢在黑板上乱写乱画留下些稀奇古怪的信息、热衷于给政治人物写一些奇怪的信、游荡在普林斯顿大学数学系和物理学系所在的范氏大楼的、满怀忧伤的幽灵。在亲人、朋友的照顾和普林斯顿人们的呼唤下,经历了长期病痛折磨的纳什竟然在20世纪80年代,病情有了好转,后来竟奇迹般地康复了。他不但可以与人正常交谈,而且还能够灵活使用在被精神分裂症折磨的30年里不断更新换代的计算机。差不多就在这个时候,纳什成为1985年经济学诺贝尔奖候选人,但是最终没能获奖。究其原因,与其说是因为瑞典皇家科学院对他贡献的认识尚且不足,还不如说是人们对他当时的心智状态仍存有疑虑,毕竟纳什因精神病不能工作是众所周知的事实。而获奖者又必须到瑞典首都斯德哥尔摩面对国王和王后向瑞典皇家科学院发表一篇通俗、得体的答词。人们担心那时神志不是完全清醒的纳什做不到。此外,获奖者总得有个头衔才说得过去,而恰恰在那时,纳什什么都没有。当时间走近1994年的时候,博弈论获奖的形势更加有利,是瓜熟蒂落的时候了。但纳什此时还是什么头衔也没有。在这个紧要关口,出于同一师门的纳什的同学、普林斯顿大学数学系和经济学系著名的数理经济学家库恩教授发挥了特殊的作用。库恩等人向诺贝尔委员会申明,如果因为身体状况就剥夺纳什当之无愧的诺贝尔奖,那实在需要过分的勇气。待库恩等人的坚持有了初步的正面回应后,库恩又向普林斯顿大学数学系建议,给予纳什访问研究合作者的身份。库恩教授的所有努力没有白费。纳什终于在1994年走上了诺贝尔经济学奖的领奖台。
第19节:第二篇纳什均衡:谁都不能改变策略
二、为什么对手总喜欢做你的邻居社会、政治、经济等各个领域的任何一次博弈最终总会形成一个结果,达到一种平衡,比如一件衣服在买卖双方讨价还价后成交,这个成交价就是买方与卖方的平衡点。这样的结果被称为博弈均衡。纳什均衡又称为非合作博弈均衡,是由美国数学家纳什提出的、一种最常见的、也是最重要的博弈均衡,是博弈论第一个重量级的概念。纳什均衡主要描述博弈参与者的这样一种均衡:在这一均衡下,每个参与者都确信,任何一方单独改变策略,偏离目前的均衡位置,都不会得到好处。为了进一步说明纳什均衡的意义,让我们来看日常生活中一些司空见惯的现象。在每个大大小小的城市街道上,经常会见到这么一个大家都很熟悉的现象:某一地段上的商店十分拥挤,形成一个繁荣的商业中心区,但另一些地段却十分冷僻,没什么商店。再仔细观察,你就会发现一个更有意思的现象:往往同类型的商家总是聚集在一起,比如肯德基、麦当劳两家百年老店总是紧紧相邻;沃尔玛、家乐福总是相隔不远,相依为伴;安利、雅芳往往隔路而望这是什么缘故呢纳什均衡理论能够对这些现象作出科学的解释。我们以一个简单的例子对其进行具体阐述。假设有一条笔直的公路,在公路上每天行驶着大量来往的车辆,并且车流量在公路上是均匀分布的假设的一种理想分布。现在设想有两家快餐店a、b要在这条公路上选择一个位置开张,招揽来往车辆。他们所卖的东西口味差不多,价格也相当。那么,两家快餐店开在公路的哪个具体位置好呢为了分析的需要,我们要对该模型作一个合乎逻辑的假定:因为食物口味相近,价格也无多大悬殊,车辆司机到哪个快餐店购买食物,就看哪个快餐店距离自己比较近。反正东西、价格都一样,何必舍近求远呢。根据这个原则,两个快餐店应该怎样确定最后的位置呢也许你马上会说把这条公路从0到1四等分,快餐店a设在14的位置,快餐店b设在34的位置,不就是最好的策略选择吗的确,从资源的最佳配置来看,这种均匀散布的情况是最优的,每家快餐店都拥有12的顾客量。同时,对于开车的司机来说,这种策略的敲定,会使司机到快餐店的总的距离最短,可大大节省吃饭的时间。然而,人生不如意之事十有**,天并不总能遂人之愿。快餐店老板作为当代生意人,自然是精明之至的,用经济学术语来说,就是具有绝对的经济理性。只要手段合法,他们总是希望自己的顾客尽可能地多,生意尽可能地红火,至于其他人的生意好坏则与己无关。也就是说,快餐店老板肯定不会考虑另一快餐店生意的好坏和车辆司机的方便,而只会以自己的赢利为目的,这就决定了他们当然都不会安于这样的位置安排。
第20节:第二篇纳什均衡:谁都不能改变策略
出于这种理性,a快餐店的老板会想:如果我将快餐店的位置从14点处稍微向中间的12点处移一点,那么我的势力范围就会比先前所定的位于14点处那种方案要大。相应的,b快餐店的地盘就会缩小,我肯定会从b快餐店夺取部分顾客,生意会更红火。这对于快餐店a单方面来说无疑是一个好主意。所以,原来位于14点处的a快餐店就有了向12点处移动来扩大自己地盘的激励。当然,b快餐店的老板也不甘示弱,作为一个经济理性人,也会有将自己的快餐店从34点处向中间的12点处移动的激励,好扩大自己的地盘,争取更多的顾客。可见,原来a快餐店在14处、b快餐店在34处的配置,不是稳定的配置。那么,究竟到哪个位置上才是稳定的位置呢不难想象,在两个快餐店定位的市场竞争博弈中,位于14点处的a快餐店要向中间的12点处靠,位于34点处的b快餐店也要向中间的12点处挤,双方博弈的最后结局将是两家快餐店设置在位于中点的12附近的位置,两家相依为邻且相安无事地做快餐生意。这是纳什均衡的位置。如果不是两家快餐店,而是很多家快餐店,也很容易对其进行分析得到结果:这些快餐店仍然会在公路的12点处附近设店达到纳什均衡。因为在这个位置,哪家快餐店要是单独移开一点,就会丧失12点的市场份额,所以谁都不会偏离中点的
...