第三卷第十三章第四节 罗伯特?奥曼与重复博弈
开心一刻
有这样一个实验,同样还是囚徒困境,但实验的条件进行了一定的调整:
假设甲、乙两个对手进行囚徒困境博弈,在整个博弈中,甲、乙双方都使坏,双方的效用都是1分。但要是甲、乙两个一直都不使坏,双方的效用就是2分。假如甲、乙其中一个开始使坏,对手就会跟着使坏,于是双方就会形成只得1分报酬的僵局。唯一不同的是甲、乙进行的是将重复1000次的博弈。
在这种情况下,即使博弈持续到第999次,甲、乙二人都选择合作,到了最后一回合先动的甲肯定要使坏,而乙很可能预知甲使坏而在前一回合开始使坏。如果我们把这个逻辑一直往回推,可以证明甲在第一回合就应该选择使坏。因此,就算这个囚徒困境博弈进行1000亿次,只要这个博弈存在确定的最后一次,则理性的参与者在每个回合都应该会选择使坏。
如果将实验的条件再次进行调整:在所有条件不变的情况下,将甲、乙两个对手的博弈从1000次调整为无限次,情况将如何?
参照上面的实验,甲、乙二人从理性的角度考虑,都会以牺牲对方的利益来使自己获利。但当实验条件变为无限次之后,如果二人仍坚持选择“背叛”的话,无疑各自的效用永远只有1分;相反,如果二人选择“合作”的话,效用可以达到2分,而且因为所谓的“最后一次”消失了,也就不存在“最后的背叛”问题了。因此,从理性的角度来看,甲、乙二人都会选择“合作”,而不是“背叛”。
开心学博弈
博弈论认为,当两个博弈者陷入有限次数重复博弈中的囚徒困境时,他们一般会选择使坏。然而,当这种有限次数的重复博弈变为无限次数的博弈之后,情况就发生了巨大的变化:背叛不再是明智的选择,相反,合作才是。因为在这种无限次的重复博弈中,实际上形成了一种“低头不见抬头见”的关系,人们基于长远利益的考虑,会从自私走向合作。
此处提到的“有限次重复博弈”和“无限次重复博弈”,共同构成了重复博弈。且不论其结果究竟如何,重复博弈的产生本身就已经是一个非常伟大的发现。对“重复博弈”作出过重大贡献的是罗伯特?奥曼。2005年,他与托马斯?克罗姆比?谢林共同获得诺贝尔经济学奖。罗伯特?奥曼指出,原来对抗的博弈可以因为反复进行而达到一种合作的状态,并且保持一段时间内的默契,给博弈的参与双方都带来好处。另外,罗伯特?奥曼还向人们指出了信息在博弈中的作用。具体来说,就是告诉我们一个事件或者关于博弈的某种信息是不是所谓的“公共知识”,对于博弈的发展进程有着举足轻重的影响。除此之外,他还提出和讨论了“信念”在博弈中的作用。