:第一篇从囚徒困境讲起
在这里,博弈的决策主体参与者就是两个嫌疑犯汤姆和杰克。栗子小说 m.lizi.tw他们每个人都有两个选择,即坦白和抵赖。这两个嫌疑犯该怎么办呢他们面临着两难的选择坦白还是抵赖。显然最好的选择是两人都选择抵赖,都得到最好的结果只判刑1年杀人罪按照疑罪从无原则,证据不足无法成立,只能是以偷盗罪各判每人1年徒刑。但是由于两人处于隔离的情况下没有串供的条件,所以他们不得不仔细地考虑对方可能采取什么策略,对方采取的策略对自己有什么影响。心理较量就这样开始了,汤姆和杰克都是绝对的精明人,都只在乎减少自己的刑期,并不关心自己的选择会对对方产生什么影响,对方因为自己的决策又将被判多少年徒刑。汤姆会这样推理:假如杰克选择抵赖的话,我只要坦白,马上就可以无罪释放,获得自由;而我若抵赖则要坐牢1年,显然坦白比抵赖要划算得多;假如杰克选择坦白的话,我若抵赖,则要坐30年牢,坦白却只坐15年牢,显然还是选择坦白为上策。所以说,无论杰克选择抵赖还是坦白,我的最佳选择都是坦白,还是坦白交代了吧。同样,杰克也跟汤姆一样会算计,也会如此推理。囚徒困境之所以称为困境,就是因为这个博弈的最终结局对两个参与者来说都是最坏的结果,两个嫌疑犯双双选择坦白,结果皆被判刑15年。这对他们个人来说都是从自身利益出发的最佳选择,符合他们的个体理性选择。因为坦白交代者可能会得到无罪释放前提是对方选择抵赖,显然要比自己抵赖可能会独自承受30年徒期前提是对方选择坦白要好。而原本对双方都有利的策略两个人都抵赖和结局每人被判1年徒刑就不会出现。囚徒困境是典型的非合作博弈的范例,为我们探讨合作是怎样形成的提供了极为形象的解说方式,其产生不良后果的原因是因为囚犯两人都从利己目的出发,最终导致结果损人不利己,合作没有产生。反过来就使我们看到:彼此达成合作是最好的利己策略,但合作必须符合以下黄金定律:己所不欲,勿施于人前提是人所不欲,勿施于我。基于此基础之上的合作才能形成一个和谐的良好的社会环境。在囚徒困境中,最好的策略直接取决于对方所采用的策略,取决于对方所采取的策略为发展双方合作留出多大的余地。**于对方所用策略之外的、从利己目的出发的最好的决策是不存在的。实际上,囚徒困境是现实生活中许多现象的一个抽象概括,有着广泛而深刻的意义。同一行业不同企业之间的激烈的价格竞争就是典型的囚徒困境现象,任何一个企业都以对方为敌手,只关心自己的利益。在价格博弈中,只要以对方为敌手,那么不管对方采取怎样的决策,自己总是认为采取低价策略会占便宜,就如同囚徒困境中的犯罪嫌疑人始终认为自己选择坦白为最佳决策一样,这就促使双方都采取低价策略。如可口可乐公司和百事可乐公司之间的价格竞争、各大航空公司之间的价格战,等等。
第9节:第一篇从囚徒困境讲起
如果彼此都清楚这种前景,双方勾结或合作起来,共同制定比较高的价格,那么双方都可以避免价格大战并获得较高的利润。但是这些联盟或者说是协议往往处于利益驱动的囚徒困境之中,双赢也就成为泡影。不同企业之间五花八门的价格联盟总是非常短命,道理也就在这里。二、大家的事情由谁管农村某地有一个只有上官、欧阳两户人家的小居民点。由于地处偏僻,道路情况不好,使得两户人家与外界的交通十分困难,急需修一条通向外界的好路。假设修这条路的成本为4个单位,每户从修好的这条路上获得的好处为3个单位。台湾小说网
www.192.tw如果没有中间人协调,上官、欧阳两家就各自打着是否修路的小算盘:若两家共同出钱联合修路,每家平均分摊修路成本2个单位,则每户农家获得的好处为1个单位321;当只有其中一户人家出钱修路而另一家坐享其成时,修路的那户人家付出4个单位的成本,却只得到3个单位的好处,获得的纯赢利为1个单位34=1,也就是得不偿失,倒贴1个单位,结果是亏损的,而坐享其成的一家却仍然可以使用修好的公路修路人并没有拥有路的占有权,总不能因为修了路就不让邻居走,白白获得3个单位303的好处;如果上官、欧阳两家都不修路,两家的纯赢利皆为0。归纳起来,是否修路的得失情况如下表所示:对上官家来说,若欧阳家修路,我家也修路,会获得1个单位的好处,而我家不修路,则会获得3个单位的好处,显然修路是劣势战略。若欧阳家不修路,我家修路,则净亏损1个单位,而我家不修路,则不赢也不亏,修路还是劣势战略,因而上官家决定不出钱修路。同理,欧阳家也会选择不修路。最终修路博弈的结局将是:两家都不动手,大家都得零。这就应了英国历史学家麦考莱的一句话:大家的事情反而无人管。一般情况下,若上官只有欧阳一家邻居,欧阳也只有上官一家邻居,他们两家多半会互帮互助,关系比较好,自然会好好商量修路的问题,合力把路修好,大家都得到方便。但是如果出现极端情形,如两家有仇,那就另当别论了。但是,这两种情形都不在博弈论讨论的范围之内。如果不附加说明,博弈论讨论所牵涉的参与者,都是经济学上所讲的理性人:他们并没有私人恩怨,也不是世代友好,而只是具有人的自私本性,但并不刻意损害他人。公共品和私人品的性质不一样。私人品是纯属私有私用,别人很难占到什么便宜。但公共品就不一样了,不管由谁提供出来,大家都可以共享。典型的如公园里的长椅,只要有人出钱出力设置好了,所有行人都可以坐下休息,哪怕他没有为此做出丝毫贡献。那么,这长椅由谁来设置呢恩惠于大家的公共性的事情又由谁来管呢
第10节:第一篇从囚徒困境讲起
这就是公共品供给的囚徒困境:如果大家都只考虑到自己的得失,只打自己的小九九,结果是谁也不付出,得过且过,也就排除了合作双赢的前景。所以,公共品问题一定要有人协调和管理,大家的事情要有专人进行协调管理。其实,这就是政府的主要职能之一。对于一个国家来说,最重要的公共品是国防公安、基础设施、科教文卫等。政府责无旁贷地要用来自纳税人的钱,把文化教育、基础设施和国防公安等属于大家的事情做好。在修路博弈中,为了解决这条通往外界的公路的修建问题,需要政府牵头,强制性地分别向上官、欧阳两家各征税2个单位,然后投入4个单位的成本修建好这条给两家都带来好处的公路。有句俗语不是说:要想富,先修路。路修好了,就可以使两户居民的生活水平在一定程度得到很大的改善。通常也只有政府出面,大家才能走出谁都不愿意去修建公共设施的囚徒困境。当然了,羊毛出在羊身上,公民税收是必不可少的,因此大家都要承担自觉纳税的义务。三、选a还是选b选a还是选b这个问题,不仅让富有实战经验的商人们苦恼不堪,也同样折磨着商学院的天之骄子们。一位教授让自己班上的27名学生进行一个博弈游戏。结果这个博弈把他们所有人都带入了囚徒困境。游戏规则如下:假设每一个学生都是一家企业的老板,现在他必须决定自己应该选择a代表着生产高质量的商品来维持较高价格,还是选择b代表着生产假货以通过别人所失来换取自己所得。栗子小说 m.lizi.tw游戏规定学生选择a可奖励2元,选择b可奖励2.15元,但选择a将产生总体收益:1个学生选择a,总体收益为2元;2个学生选择a,则总体收益是42x24元,依次类推选择b将无总体收益可言。同时,将选择a的学生所产生的总体收益的总金额平均分给每一个学生包括选择b的学生。这是一个教授事先就设计好的博弈,确保每个选择b的学生总比选择a的学生多得0.15元。这个假定也有其现实意义,因为生产质次的假货所付出的成本总比生产高质量的商品要低,反过来,其利润当然要高。但是,选择b的人数越多,就意味着选择a的人数越少,则他们的总收益就会越少,总体收益越少,分到每个人手中的收益就越少。这个假设也有道理:随着市场上假货的增多,消费者便会逐步地认清它们的面目,就会理性地不再购买它们,这就直接导致了假货生产者利润的减少游戏中指选择b的学生。并且,市场上出现的假货太多,市场秩序就会混乱,该产品的信誉就会降低,这也直接降低了高质量产品生产者的利益游戏中指选择a的学生。
第11节:第一篇从囚徒困境讲起
假设27名学生都选择a,那么他们每人各得2元,且总体收益是542x2754元。将54元平均分配给27个学生,也就是每人254272元,则每个学生最后的实际所得为4224元。假设有1个学生有了自私自利的打算,偷偷改变主意,选择b,那么,选择a的学生就有26名,每人各得2元,总体收益是52元2x2652,将52元平均分配给全班27个学生,每人各分得1.952271.9元,则选择a的学生最后的实际所得为3.921.93.9元,比原来少得0.1元;而选择b的那个学生最后可得4.052.151.94.05元,比原来多了0.05元。假设有2个学生改变主意,改选b,则有25名学生选择a,每人各得2元,总体收益是502x2550元,将50元平均分配给27个学生,每人可分得1.8550271.85元,则选择a的25名学生最后每人各得3.8521.853.85元;而选择b的那2个学生最后每人各得42.151.854元。假设有3个学生改选b,那么,选择a的学生就有24名,每人各得2元,总体收益是482x2448元,48元平均分配给全班27个学生,每人可分得1.7848271.78元,则选择a的学生每人各得3.7821.783.78元;而选择b的3个学生每人各得3.932.151.783.93元。假设全班27个学生一致选择自私的策略,尽可能使自己的收益达到最大,统统选择b,则总体收益是0元,最后每个学生各得2.15元。由以上分析可以看出,当只有一个学生选择b的时候,该学生能获得最大收益4.05元,其余26名学生相对会蒙受一点损失,只能获得3.9元。反过来,如果他们进行合作,协同行动,不惜将个人的收益减至最小,都选择a的时候,则每个人都能获得最大收益4元,选择b的学生人数越多,每个人的总体收益越少。演练这个博弈的时候,起初每个学生都被相互隔离开,不允许讨论,单独做选择。结果全班27名学生无疑都像囚徒困境中的囚徒一样,都是聪明绝顶的理性人,个个都精于算计,为了多获得0.05元,不约而同地都选择了b。后来教授允许学生之间相互讨论,以便达成合谋。结果同意合作而选择a的学生总数从3人到14人不等。在最后的一次带有约束性协议的博弈里,只有4个学生愿意选择a,此时,全体学生的总收益是65.45;2x42.15x2742x465.45元,比全体学生成功合作可以得到的总收益1082x272x27108元减少了42.5510865.4542.55元。这个游戏也可以看做是非合作性博弈的又一典型模式,并且比囚徒困境更深刻地揭示了人自私自利的本性。这一模式代表了处于相同困境状态下,各方都不知道别人的选择,因而只能猜测每个人都是绝对的理性人,最后必将背叛其他人,从自己的利益出发,作出最利于自己的选择的一种情况。
第12节:第一篇从囚徒困境讲起
处于困境的他们与困境之间是一种不可逆转的关系,也就是说当他们无法通过自己的力量去左右局势,获得集体收益最大时,就只能在困境的局势下想办法尽可能让自己的损失最小,收益最大。这个游戏在现实社会中也很有代表性。比如,某村有一块公共草地可供牧人放牧,每个牧民都只知道增加自己养羊的数目,从而可以增加收入。由于是共属大家的公共草地,没有人会去关心草地的承载极限,于是羊越来越多,草越来越少,最后草地空了,草没了,羊也没了。这是一个带有悲剧性的博弈过程。当出现类似情况的时候,就需要有外界力量对其进行干预,制定相应规则,从而使草地得到最大限度的利用,大家才能真正得到实惠。四、激励优秀,淘汰低效企业老板为促使员工之间互相竞争,有时候会故意在员工之间形成囚徒困境的局面,以刺激他们努力工作。为了形成这种激励员工卖力工作的囚徒困境,老板可以采取这一策略:奖励表现最优秀的员工,并淘汰表现未达工作标准的员工。假如员工都接受了这场博弈,那么他们就可能会兢兢业业地工作。假设公司开发出一种新产品,招聘了20位业务员来对它进行推销,此时作为公司老板的你,要如何决定每个业务员的工作量呢由于这种产品过去在市场上从来没有卖过,所以你根本无法估计能干又勤奋的业务员每个月到底该卖多少。唯一解决的办法就是根据相对绩效标准来评估每个业务员的表现,也就是拿他们的工作业绩进行相互比较,给予销售量高的推销员以额外的奖励。此时,相对的绩效评估标准将会使员工陷入积极工作的囚徒困境中。以两个员工甲、乙之间的博弈为例,甲、乙都可以选择每月工作20天或25天。虽然由于此项工作本身的特殊性,跑外的推销员不比坐办公室上班的员工,老板无法准确判断这两个员工的实际工作时间,但是他们也不是全然就没有了管束,老板在每月月底就可以看到其销售成绩,据此对他这个月的工作状况进行考核。一般情况下,每月工作25天的员工所推销出去的产品会比每月工作20天的员工多。对公司而言,只要两个员工的工作时间一样,就会得到相同的评价。在这种情况下,两个员工若要得到相同的评价,很可能会选择集体偷懒,因为每个人都偷懒时,大家的表现就会不相上下,显然会选每月工作20天,而不会选每月工作25天。当然,两个员工都会失去成为业务精英的机会,但放弃这个机会而换取舒适的工作环境也许很值得。不过,老板针对此种情况而设计的囚徒困境却迫使他们不得不延长工作时间。假如甲每月工作20天,乙工作25天,乙就会得到优等的评价,获得奖励;要是甲每月工作25天,但乙每月只工作20天,那么乙将会受到老板的批评,饭碗可能也保不住了。所以对甲、乙来说,每月工作25天都是他们的最佳选择。
第13节:第一篇从囚徒困境讲起
虽然员工们都想要轻松度日,在工作中偷懒,但当公司老板以相对的评估标准来衡量员工工作业绩时,囚徒困境的产生就使得某一员工很难说服别人一起偷懒。退一步想,假如员工互相串通,集体偷懒,相对标准所形成的囚徒困境遭到瓦解,老板要怎么做才能激励员工努力工作呢此时,你就必须采取客观的绩效评估标准,把表现不佳的人毫不留情地开除。一、合作的约束严格囚徒困境形成的前提条件,是参与博弈的各方不可以进行合作,不能够制定有约束力的合作协议。但是在实际生活中,相互合作是社会文明的基础,这已得到先哲们的认可,哲学家卢梭不就写了社会契约论一书吗他就肯定地认为契约是整个人类社会存在的前提条件之一。联系到社会生活实际,兴修水利、组织国防、创建企业等不都是因合作而产生的吗当然,我们现在所说的以签订协议的方式来破解囚徒困境是存在一定的限定条件的,即博弈必须重复若干次,至少大于一次。对于一次性的博弈而言,签订协议是毫无意义的。何谓重复博弈、一次性博弈以恋爱博弈为例,重复博弈是指男女双方在长期交往的过程中,随时都在进行着的博弈,因为相爱的过程中任何一个时点都是有可能分手的。无数爱情故事中的悲欢离合、精彩跌宕正是重复博弈模型的表现。而那种素不相识的一对男女,偶尔在酒吧中相遇,于是宾馆订房、玩乐一场,拂晓之后就各自分道扬镳的一夜情,就是典型的一次性博弈。囚徒困境一旦从一次性博弈转化为重复博弈,情况就会发生很大的变化。举个例子,意大利的黑手党大家应该不会陌生吧,其组织严密,对待背叛者的惩罚非常残忍。若一个黑手党成员告发其他黑手党成员,一定会被组织谋杀。假设前面所讲的囚徒困境故事的主人公汤姆和杰克都是黑手党成员,他们绝对不会像故事中所讲的囚徒那样,而极有可能宁愿被判处终身囚禁,也不愿意背叛对方,出狱之后被同伙干掉。实际上,在重复型的囚徒困境中,签订合作协议并不是很困难,困难的是这个合作协议达成之后,是否对博弈各方具有很强的约束力,能够使得博弈参与者都不会有私自改变主意的动机。比如由爱情而引出的婚姻,俗话说婚姻是走向爱情的坟墓,但从博弈论的角度来看,婚姻恰恰是男女双方签订的一种具有一定约束力的协议,一旦某方背叛婚姻,他或她就会受到家庭的压力和社会舆论的谴责。现在,博弈专家已经用数学证明,在无数次重复博弈的情况下,合作可能是相对稳固的一种状态。因为任何一次背叛都会导致对方在下一轮博弈中进行报复,而双方都采取合作态度则会带来合作收益,使双方都相安无事地处下去。
第14节:第一篇从囚徒困境讲起
二、你不必每次都赢在囚徒困境中,我们已经知道了这样一个道理:从个体的眼光看,目标是在与对手的一系列对局中尽可能地最大化自己的利益。这使得博弈参与者会受到背叛利益的短期诱惑,总是想赢对方,结果可能得不偿失。因为对方也会全力反击,招致双方都难以全身而退,造成两败俱伤的局面。此时,若双方都没有继续对抗下去的意愿,但开弓没有回头箭,也只能咬紧牙关,硬着头皮撑下去。但是通过与对方建立双方合作的模式却可以使双方都得到更多的长期好处。在陷入囚徒困境中应如何表现,才能尽可能地与对手达成合作,以下是对参与者的两个简单的建议:第一,不要嫉妒。在大多数博弈中,人们都习惯于考虑零和对局,即一方赢,就
...