第三卷第三章 智猪博弈:聪明的小猪有免费的午餐

第三卷第三章第一节 辛苦的大猪与幸福的小猪

开心一刻

猪圈里有两头猪同在一个食槽里进食,一头大猪,一头小猪(假设它们都是有着认识和实现自身目标的充分理性的“智猪”)。猪圈两头距离很远,一头安装了一只控制饲料供应的踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一头就会有相当于10份的饲料进槽,而踩踏板以及跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的饲料。

这两头猪各有两个选择:自己去踩踏板或等待另一头猪踩踏板。其中选择自己踩踏板的猪不仅要付出劳动,消耗掉2份饲料,而且由于踏板远离饲料,它将比另一头猪后到食槽,从而减少吃到饲料的数量。下面假定:若两头猪都选择等待,那就都吃不到饲料,即双方得益均为0;若小猪踩踏板,大猪将吃到9份的饲料,小猪只能吃到1份的饲料,最后双方得益为[9,-1](小猪付出劳动之后消耗掉2分饲料);若大猪踩踏板,大猪和小猪将分别吃到6份和4份的饲料,最后双方得益为[4,4];若两头猪同时踩踏板,同时跑向食槽,大猪吃到7份的饲料,小猪吃到3份的饲料,即双方得益为[5,1]。

开心学博弈

由上面的分析中可以看出:小猪踩踏板只能得到1份甚至有可能损失1份饲料,不踩踏板反而有可能得到4份饲料。对小猪而言,无论大猪是否踩动踏板,小猪都不去踩踏板,而舒舒服服地等在食槽边,就是最好的选择。

小猪选定了等待之后,大猪便只剩下了两个选择:等待就吃不到;踩踏板得到4份。所以,踩踏板就变成了大猪的优势策略。当大猪知道小猪不会去踩动踏板,自己亲自去踩踏板总比不踩强,只好为自己的4份饲料不知疲倦地奔忙于踏板和食槽之间。

如果采用重复剔除劣势策略的方法,那么,首先,无论大猪选择什么策略,选择踩踏板对小猪都是一个严格劣策略,应该加以剔除。在剔除小猪踩踏板这一选择后的新博弈中,小猪只有等待一个选择,而大猪则有两个可供选择的策略。在大猪这两个可供选择的策略中,选择等待是一个严格劣策略,我们再剔除新博弈中大猪的严格劣策略——等待。剩下的新博弈中只有小猪等待、大猪踩踏板这一个可供选择的策略。

这就是博弈论中,十分形象生动的博弈模型——“智猪博弈”。智猪博弈与囚徒困境的不同之处在于:囚徒困境中的犯罪嫌疑人都有自己的严格优势策略;智猪博弈中,只有小猪有严格优势策略,而大猪没有。智猪博弈存在的基础,就是双方都无法摆脱共存局面,必有一方要付出代价换取双方的利益。一旦有一方的力量足够打破这种平衡,共存的局面便不复存在,期望将重新被设定,智猪博弈的局面也随之被破解。

用我们日常的话来讲,智猪博弈就是一个不同期望值之间的博弈。有一方的期望值低于另一方的期望值,而且这种期望值容易实现,那么另一方就大可做那只坐享其成的“智猪”。所以,期望值在这个博弈里是关键,也就是我们所说的目标是否合理,是解决这个僵持状态的关键。


状态提示:第132章
本章阅读结束,请阅读下一章
回到顶部