博弈是什么意思？它是一场理性游戏

OStack程序员社区-中国程序员成长平台 › 门户 ›资讯

原作者: [db:作者] 来自: [db:来源] 收藏邀请

博弈是什么意思？它是一场理性游戏

先来看一道有趣的题目：

海盗船上有座次分别为1,2,3,4,5的五个海盗，有一天他们抢到了100枚金币，他们决定按以下规则进行分赃：

由老大即1号提出分配方案
剩余海盗对该方案进行投票表决
若有超过半数（不含半数）海盗同意，就按照该方案进行分配；否则就将老大丢进海里喂鲨鱼，再由老二即2号来充当老大继续提出分配方案，如此类推

海盗们遵循如下行事逻辑：

海盗贪生胜过贪财，若是没命了给再多钱也不干
海盗贪权，但更贪财。若是拿到相同的金币，海盗更想弄死老大然后自己来当老大，但只要能多拿一个金币，海盗就会拥护老大的分配方案

问：若你是海盗老大，你会提出怎样的分配方案？有没有最佳的分配方案？（答案见文底）

这是我当年选的一门关于博弈论的选修课程，老师在第一节课上提出的入门问题。他告诉我们：博弈并不是大国、大组织所特有的，它来源于英语‘game’，是所有理性人的理性游戏。

这里的理性人和经济学假设中追逐利益最大化的理性人不同，他是指有具体可量化行事逻辑的人。比如说一个人如果义气为大，不管有多少利益他都不背叛朋友，那么他在博弈论中也算是理性人。不理性的人指的是没有具体行事逻辑的人，比如你问他A还是B，他说等我先抛个硬币。

理性游戏也不是公平的游戏，他是指游戏的参与者事先都清楚游戏的规则，哪怕游戏明显偏袒其中一方，只要参与者都事先知道，那这也算是理性的游戏。

博弈论就是对各种博弈的研究，它想弄清楚各种各样的博弈最终都会演化到什么地步，好指导我们在博弈中做出最佳的选择、攫取到最大的利益。

查理·芒格曾说过：我们需要学习那些重要学科的重要理论，因为这些理论具有最大的确定性以及普适性，这是获得智慧所付出的机会成本最小的路径。

博弈论就是这样的一个重要学科，它的很多重要理论都对我们所处的世界有很强的解释力。下面就让我们来看看其中几个经典的博弈案例。

囚徒困境

假如，有两个罪犯被捕，但警察手上并没有足够的证据只能依靠两人的口供来定罪，为取得证据警察告诉囚徒：如果两人都抵赖，因证据不足各判刑一年；如果两人都坦白，各判三年；如果两人中一个坦白而另一个抵赖，坦白的从宽放出去，抵赖的从严判六年。

这时两个囚徒就会面临一场博弈，他们的策略收益表如下：

理论上，囚徒甲与乙都选择抗拒就能得到整体的最好结果（两者的收益和最大），但在实际情况中，这并非是他们各自利益的最优解。

在甲看来：如果乙坦白（对应上表第二列），甲应该选择坦白（3年

这就是囚徒困境，代表着一类合作虽然对团体有利，但各成员为了追逐各自利益而无法达成合作的困局。这种困局在现实生活中也十分常见，比如在剧场电影院等公众场合是否站起来观看、学生是否课外补习，是否疯狂刷题、各国是否减排环保、国家之间的军备竞赛……

这个困境无法从内部解决，也就是对博弈双方来说这是无解的。唯一的办法就是引入外部力量，强行将博弈带到对双方有利的合作点上，比如说电影院规定所有人只能坐着看电影、教育部禁止校外补习…..

智猪博弈

假如猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会因来回跑动付出2个单位的成本。按钮和猪食槽在相反位置，按按钮的猪不仅要付出2个单位的成本，也丧失了先到槽边进食的机会。

若小猪先到槽边进食，因为缺乏竞争，但进食的速度一般，最终大小猪吃到食物的比率是6∶4；若同时到槽边进食，而大猪进食速度更快，最终大小猪收益比是7∶3；若大猪先到槽边进食，大猪会霸占几乎所有的猪食，最终大小猪收益比9∶1。

同样，我们在分析这个博弈的时候可以画出双方的决策收益表格。

博弈是什么意思？它是一场理性游戏

这个博弈就和囚徒困境有所不同，囚徒困境中的两个囚徒无论是谁都清楚自己坦白优于抗拒，最后就会达成双方都坦白的均衡点。而在智猪博弈之中大猪并没有所谓的最佳策略，小猪行动时大猪应该等待（9>5）。而小猪等待时大猪应该行动（4>0）。

但是我们从小猪的角度思考，那等待就应该是他的最佳策略，无论大猪是否行动，小猪都应该等待（4>1 , 0>-1）。在大猪明白小猪是不会动的时候，大猪只能选择行动因为这对它更有益，从而也能抵达‘大猪行动，小猪等待’的均衡点。

这就是智猪博弈，它启示我们在博弈中还需要站在对方的角度上来思考问题，虽然我方可能并没有最佳策略，但对方可能就有，这时我们只能在对方的最佳策略的基础上来构建均衡点。

智猪博弈对应的是社会中常见的‘搭便车’现象，虽然从表面上来看，努力行动的人在吃亏而‘搭便车’的人占了大便宜，但这是博弈的均衡点，也是双方理论上能达成的最佳结果，我们也没有其它办法。

鹰鸽博弈

上述的两个经典博弈案例都是有均衡点的，即如若没有外力的干扰，博弈只会向着均衡点的方向发展，而鹰鸽博弈就没有明确的均衡点。

鹰鸽博弈是说：假设森林中的一群老虎有两种不同的个性，一种是鹰派，它们天生好胜不愿让步，一派为鸽派，它们就比较好说话愿意妥协。在两只老虎遇到了同一只猎物时，若是鹰派碰上鹰派，那没什么好谈的，直接动手，最终就会两败俱伤；若是鹰派碰上鸽派，那么鸽派就会退让，食物归属鹰派；若是鸽派碰上鸽派，那么它们就会共享食物。

同样，我们也能给出两者之间的决策收益表。

博弈是什么意思？它是一场理性游戏

从这个博弈的决策收益表中我们就无法直接得出一个老虎究竟是鹰派更好还是鸽派更好。若是在这群老虎中只有鹰派，那么新加入的老虎就应该当一个鸽派；反之，若这群老虎全是鸽派，那新加入的老虎就应该当一个鹰派。

但在实际情况中，一群老虎中是既有鹰派也有鸽派，这时新加入的老虎应该如何选择呢？我们可以做一个简单的模型计算，假设这群老虎之中的鹰派占比为X，新老虎为鹰派的收益就是：

-1*X+2*（1-X）=2-3X

新老虎为鸽派的收益就是：

0*X+1*(1-X)=1-X

若想让当鹰派的收益大于当鸽派，解上述简单的不等式就可以得出：X<1/2，即鹰派的占比应该小于1/2。所以新老虎在加入鹰派多的虎群时应该选择当鸽派，在加入鸽派多的虎群时应该选择当鹰派。

在这种博弈中，没有均衡点，我们做出的决策应该考虑所处的环境。这个博弈在生活中非常常见，以至于我们在生活中如果看到了一个好斗不愿让步的人，我们就会说他是一个‘鹰派’。

有人说“机会是我们自己争取的！”，也有人说“忍一时风平浪静，退一步海阔天空”。他们所说的都是对的，但都有其适用条件，更准确的表述应该是：在鹰派占多数的世界中我们要做一个鸽派，而在鸽派占多数的世界里我们要做一个鹰派。

当然这只是最简单的模型，现在还有很多像是‘外鹰内鸽’‘外鸽内鹰’‘六分鹰四分鸽’的说法，毕竟每个人在不同的条件下体现出来的性格也会有所不同，但这就不是我想讨论的内容了。

柠檬市场

这个博弈是脱身于美国的二手车市场。在英语的俗语中，柠檬代表次品，而桃子代表优品，当时在一个美国的二手车市场中，出现了劣品驱逐良品，市场中全是次品从而导致二手车市场的萎缩。经济学家对这种市场调节作用失灵导致的市场萎缩十分感兴趣，进行大量的研究最终提出柠檬市场的博弈与非对称信息学。

在这个二手车市场中，有两种类型的车，一类是次品称为柠檬，另一类是优品称为桃子。桃子售价3000，柠檬售价1000，在正常交易中，桃子与柠檬都有市场，预算充足的消费者可能更想买桃子，手头紧的也可以买柠檬。

但这个市场存在信息不对称，换句话讲就是卖家很清楚自己的车是柠檬还是桃子，而买家一般很难看出来。这就给了某些居心不良的商人以次充好的机会，他们就会把柠檬当成桃子卖，而一旦市场里面的桃子中掺杂了柠檬，买家就不愿意再花3000的高价了，买家心里清楚这市场中的桃子并不都是桃子，有买到柠檬的风险，这时他们就会只愿意出价2500以分摊买到柠檬的风险。

而且买家的出价会随着市场中的柠檬在桃子中所占比例的增加而减少，这就会不断压缩桃子的利润空间，一旦这个价格降低到卖家卖桃子的心理承受范围之下的话，就没有人愿意卖桃子了。这时市场中就全是柠檬，市场也逐渐萎缩。

这就是柠檬市场的博弈，它不像上述事例是一个简单的一次性博弈，而是双方在多次连续博弈后出现的结果。类似的，还有劣币驱逐良币等其他现象，一旦信息不对称的市场中出现了劣质产品，它们就会不断压缩优质产品的生存空间，这也就是我们俗语中的“一颗老鼠屎，坏了一锅粥”。

博弈是一场很有意思的游戏，博弈论则是一门很有解释力的学问。以上的几个故事都是博弈论的入门级案例，如果想了解更多可以看一些博弈论的科普书，这并不需要太多的数理基础。

教我博弈论的老师曾说：“人总是事前自诩聪明，事后自诩无辜”。事前总以为自己什么都能算到，别人吃亏那是活该因为没我聪明；而一旦事后发现吃亏的是自己，就开始埋怨对方卑鄙无耻不讲道德，我之所以失败都是因为我无辜善良，干不出这种事情。

可是这只是我们无奈的自我安慰，因为如果你能预测到对手的策略，你一定不会傻傻地等着不利于你的博弈结果，而是比他更无耻更不讲道德，然后再一次自诩聪明罢了。

在研究博弈的学者看来：“preference is personality.”翻译过来就是‘偏好即人品！’这世上既没有聪明人也没有善良的人，他们都是有着不同偏好的人，不过是其中有的人喜欢长期的未来的收益，而有的人喜欢帮助他人、喜欢建立美好的社区罢了，他们并没有高下之分。

偏好是我们做出决策的原动力，知道博弈参与者的偏好与博弈的约束条件和规则，我们就能根据博弈论有效地推出博弈的最终结果。所以，学点博弈论能给我们一个新的看待世界的视角。

正文完！

海盗分金博弈结果（逆向思维）：

若前四个海盗都被丢进海里喂鲨鱼，5号分配方案一定是自己拿100枚金币，这是5的最优解，满足了5的所有愿望（活着，拿走全部的金币，当老大）
若前3个海盗被丢进海里喂鲨鱼，4号无论出什么方案都不能说服5号，因为5自己有最优分配方案，故5会拒绝从而把4丢进海里
若前两个海盗被丢进海里喂鲨鱼，3无论提出什么方案，4都会同意因为活着是第一驱动力，而5会反对理由同上，结果是3被丢进海里
若只有老大被丢进海里喂鲨鱼，2无论提出什么方案，3与4都会同意因为他们不想死，5一定会反对但没有用，所以2比1这个方案一定会通过，故2号能肆无忌惮地拿走全部的金币，而这也是2的最优解，所以2不会同意1的任何方案
考虑所有海盗都活着的情况，若1拿走全部的金币，在3,4,5看来和2的方案没区别，他们会遵循好杀原则投反对票把1杀死，所以1得收买3,4,5给他们一人一枚金币，这样3,4,5,就会支持1，方案就能够3比1通过

故1最佳的分金策略是97,0,1,1,1