非零和博弈(纳什均衡): 真的存在共赢吗?
Table of Contents
1. 非零和博弈
双方得失加起来不是零, 也不是一个常数的博弈.
双赢点是大家主观上想达成的目标, 但现实中客观的结局常常是纳什均衡点, 也就是双输的结果. 实现双赢的前提是彼此有信任, 这种情况下的博弈, 也被称为合作型博弈, 而纳什解决的是非合作博弈.
找好合作对象, 永远不玩难以达成双赢的游戏.
2. 想在现实中找均衡点, 你得记住这五条:
- 博弈通常不是一次性的, 而是反复进行的, 长期坚持信任几乎做不到, 而一旦一方开始采用不合作的策略, 给对方造成巨大损失, 对方也会马上调整策略.
- 博弈论讲的都是阳谋的策略, 但是很多时候双方博弈使用的是阴谋. 使用阴谋就无法让双方产生信任, 而没有信任, 均衡点就是双输. 一战后美国总统威尔逊在总结大战爆发的原因时发现, 秘密外交, 搞阴谋是个重要的原因, 因此他努力推动国际联盟, 目的就是把阴谋变成阳谋.
- 人类还处于文明的初级阶段, 人的道德水准不容高估, 很多人并非在主观上想做违反规则的事情, 也懂得双赢的道理, 但是就是看不惯别人和自己一样好, 更不能容忍别人比自己好, 于是当他们看到能够在自己损失1, 让对方损失10的情况发生, 完全干得出这种事.
- 乌合之众效应. 如果是两个人博弈, 很容易达成双赢的结果. 如果是两个由帮主说了算的帮会, 或者独裁国家, 这种事也不难做到. 但是在两个民主国家之间, 或者两个权力分散的机构之间, 这种事情就很难达成. 世界上有些重大事情, 大家都很清楚双赢的点在哪里, 比如全球贸易、均衡发展、消除贫困和疾病, 但是在这方面很难达成一致, 而且就算短期达成一致, 各方也很难遵守. 原因是博弈的各方不是一个人, 而是每一方自身内部有各种利益冲突. 比如说经济全球化, 就意味着一些国家必须放弃一些产业, 而那些相关的产业工人就会牵引政客们偏离共赢点.
- 很多时候看似是双赢, 其实是在更大范围内通过零和博弈获利. 信息时代针对员工的期权制度便是如此. 在之前分配利润的工业时代, 劳资双方是零和博弈, 因为一方多拿点, 另一方就要少一点. 但是当下很多企业, 通过给员工发放股票期权, 只要把企业业绩做上去, 期权会自动给员工带来巨大的收益, 不用分配利润. 这看上去是一个双赢的结果. 但实际上它们和资本市场, 包括股民, 玩的依然是零和博弈.
3. 一个故事
BBC 有一个 「金球」(Golden Balls ) 游戏节目, 节目经过多轮答题 PK 之后, 只剩下两名选手, 以及一大笔的奖金. 最大的看点就是选手如何 「分奖金」. 此时, 主持人会给每人两个球, 一个写着 「平分」 (Split), 另一个写着 「偷走」 (Steal), 他们需要从中选择一个球. 游戏规则如下:
- 如果两个人都选择了 「平分」, 那么两个好人可以平分之前累积的奖金, 这是最理想的情况;
- 如果其中一个人选择 「平分」, 另一个人选择 「偷走」, 那么选择了 「偷走」的坏人可以拿走全部的奖金, 而选 「平分」 的好人则一分也拿不到;
- 如果两个人都选择了 「偷走」, 那么两个坏人都一分钱也拿不到. 另外, 在作出各自的选择前, 两个人可以互相商量.
在往期节目里, 经常出现下面两种情况: 1.一个人极力保证自己一定会选择 「平分」, 让对方也选择 「平分」, 这样两个人可以平分奖金, 但最后他选的却是 「偷走」, 坏人伪装成好人, 偷袭成功拿走全部奖金. 2.两个人都说好了选 「平分」, 但最后两个人都背叛了对方选了 「偷走」, 结果两个人都拿不到钱. 这个游戏规则的本质就是囚徒困境, 选手往往会被复杂的人性和规则所玩弄. 不过, 在这里分享这个故事, 当然不是为了重复大家都听过的囚徒困境……
在有一期节目里, 一个选手却成功地 「玩弄」 了这个规则. (为了方便阅读, 简称游戏最后分奖金的两个人为 A 和 B)
在相互 「商量」 环节中, A 向 B 表示, 自己一定会选择 「平分」, 请 B 也选择「平分」, 这样两个人可以平分奖金. 为了让 B 相信他, A 还说了一个父亲教育自己要为人诚实信守承诺的故事. 没想到, B 却态度强硬地表示, 自己一定会选 「偷走」, 但他同时表示, 只要 A 选择 「平分」, 他会在节目结束后把拿到的奖金和对方平分. 这是此前节目从来没有出现过的情况, 现场的观众和主持人都不敢相信 B 会作出这样的表态, A 更是气得直骂娘. 在 B 一定选择 「偷走」 的情况下, A 面临的情况是:
- 选择 「偷走」, 两个人都拿不到钱;
- 选择 「平分」, 那么 B 拿到所有的钱, 然后节目结束后两人平分, 但 B 是不是会遵守承诺可不好说.
结果如何呢?
在 B 如此强硬的情况下, A 没有别的选择, 他只能选择 「平分」.
而 B 呢? 对着镜头, 他展示了自己的选择 —— 也是 「平分」, 而不是像他之前表示一定会选的 「偷走」. 就这样, 两个人皆大欢喜, 平分了奖金.
你以为就这么结束了?
No~ 这个故事最精彩的部分是在节目之后. 媒体调查了 A, 结果发现他从来没有见过自己的父亲, 他从小是被母亲养大的. 他讲的那个关于父亲教他如何做人的故事是他从一部电影里看来的情节, 纯粹是欺骗 B 的借口.
A 本来要选的是 「偷走」, 这样要么两个人都拿不到钱, 要么他一个人拿走所有的钱.
而 B 却把自己假装成一个 「坏人」, 成功地摆脱了这种状况, 让 A 没法使坏, 也耍了游戏规则一把.
多数坏人会假装好人, 骗取信任; 少数好人会假装坏人, 把 「假好人」 转变成 「真好人」.
不要挑战人性, 而要通过合理的规则设计, 激发人们做出 「理性」 而 「正确」 的选择.