昨天一篇《善良的人,将成为最终的赢家》,简单分享了“在多次博弈中,善良是最佳策略”。

很多小伙伴在评论里反对: (1)善良的策略,应该只用在善良的人身上;

画外音:合作之初,并不知道ta是不是善良呀?

(2)因为不知道对方会用什么策略博弈,可以使用随机策略;

(3)人善被人欺,博弈中选择最有利自己的策略,长期来说不会吃亏; 画外音:恰恰相反,时间越长,投机的博弈者越吃亏。

(4)聪明的人会成为最终的赢家;

“艾克斯罗德博弈论实验”是这么设计的: (1)假设共N个人参赛,每个人要和其他N-1个人依次连续进行x次无商量博弈; 画外音:每个人都只制定自己的策略,不允许两个选手商量。

(2)每两个人进行连续x次博弈前,双方都不知道x是多少; 画外音:如果两个人提前知道x的值,最后一轮博弈会退化为单次博弈;

(3)博弈的积分规则是: 画外音: 如果是一次博弈,在不商量的情况下,每个人都选择“使绊子”是个人最优策略; 但由于是多次博弈,如果每次都“使绊子”,积分将不会增长。

最终,得分最高的人胜出。

“艾克斯罗德博弈论实验”是一个典型的多次博弈,它的特殊之处在于:你虽然不知道对手的整体策略,但你与对手进行第n轮博弈的时候,能够知道ta前n-1轮的策略,并随时调整自己的策略。 画外音:你的所有的过往,都会成为别人今后和你合作时进行决策的依据。

最常见的策略有以下这么几种。

【一报还一报】:善良的人 (1)首次博弈,总是选择“合作”; (2)非首次博弈,总是选择对手上一次的策略;

【小腹黑】:不信任任何人 (1)总是选择“使绊子”;

【小粉红】:信任任何人 (1)总是选择“合作”;

【黑社会】:强硬且不变通 (1)先一直合作; (2)直到被“使绊子”,未来就一直“使绊子”;

【小聪明】:先试探对方,再决定自己的策略 (1)先以“合作”“使绊子”“合作”“合作”开局; (2)如果对手一直“合作”,则退化为【小腹黑】榨干对方; (3)如果对手懂得变通,则退化为【一报还一报】相互博弈;

最终的结论是: (1)【一报还一报】获得了最高分; 画外音:否则,上一篇《善良的人,将成为最终的赢家》不久白写了么?

(2)【黑社会】次之; 画外音: 黑社会的简单策略很先进呀; 黑社会会先合作,但也会记仇,你摆过他一道,他再也不会信任你。

(3)【小聪明】与【小腹黑】不相上下; 画外音:自以为聪明的试探别人,还不如善良或强硬的策略。

(4)【小粉红】分数最低; 画外音:难道,一直善良就是愚蠢?

对于这个结果,你有什么看法? 架构师之路-分享通俗易懂的技术文章

推荐阅读: 《“立体化监控告警平台”-年终总结(一)》 《“区块链与比特币”-年终总结(二)》 《“杀熟杀豪与互联网推荐”-年终总结(三)》 《“读写扩散、消息系统”-年终总结(四)》

如果你来参加“艾克斯罗德博弈论实验”,有没有更优的策略呢?