目录

前言

题目

题解

20.简述“上策均衡法”的基本原理,优点和弊端。

21.简述“严格下策反复消去法”的基本原理,优点和弊端。

22.试比较“画线法”和“箭头法”的特点。

50.严格下策反复消去法。

51.箭头法求纳什均衡

52.求解混合策略纳什均衡


前言

本篇博客解决几个 求解纳什均衡 的博弈论题目。

题目来自河北大学王亮老师的网址:Software Security Lab, Hebei University (hbusoftsec.org.cn)


题目

[简答题]

python求解纳什均衡 纳什均衡 求解_算法

[大题]

python求解纳什均衡 纳什均衡 求解_算法_02


题解

20.简述“上策均衡法”的基本原理,优点和弊端。

基本原理

“上策均衡是指不管你选择什么策略,我所选择的是最好的;不管我选择什么策略,你所选择的是最好的。”     

一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,那么这个策略组合肯定是所有博弈方都愿意选择的,必然是该博弈比较稳定的结果,这就是上策均衡。

由博弈各参与人的上策所组成的均衡,称为上策均衡。但是在大多数博弈中,上策均衡是不存在的。

例如在囚徒困境中,上策为{坦白,坦白}:

python求解纳什均衡 纳什均衡 求解_人工智能_03

优点:上策均衡的优点在于它提供了一个清晰和确定的预测结果。由于所有参与者都没有改变策略的动机,我们可以确信均衡策略组合会被执行。上策均衡也提供了一个分析博弈的框架,可以帮助我们理解和预测参与者的行为。

缺点:

1.过于理想化,在实际情况中,参与者可能不完全理性或者存在信息不对称等问题,导致他们无法选择最优策略。

2.上策均衡可能并不唯一,存在多个均衡的情况,这可能导致预测结果的不确定性。

3.上策均衡可能无法考虑参与者之间的相互影响和依赖关系,因为每个参与者的策略选择是独立的。


21.简述“严格下策反复消去法”的基本原理,优点和弊端。

基本原理:

首先找出某个博弈方的严格劣策略,将它删除,然后重新构造不包含这个劣策略的博弈;然后,继续删除新的博弈中某个博弈方的严格劣策略;重复这一个过程直到剩下唯一的策略组合为止,这个策略组合便是博弈的均衡解。

在这里提到的严格劣策略,也叫“严格下策”(Strictly Dominated strategies),它指的是某一个博弈中,不管其他博弈者选择什么样的策略,我的“策略 i”的收益总是比我其他某个策略的收益低,这个“策略 i”便是严格劣策略。

优点:该方法能够有效地求解出博弈问题的最优策略,对于多策略博弈问题具有一定的适用性。通过反复剔除严格下策,可以逐渐缩小策略空间,使得求解更加简单和直观。

弊端:

1.它对于信息的准确性和完备性要求较高,因为任何信息的缺失或错误都可能导致错误的结论。在很多的博弈问题中,严格下策往往不存在。

2.该方法可能过于简化博弈问题,忽略了参与者之间的相互影响和依赖关系。

3.严格下策反复消去法可能无法处理复杂的动态博弈问题,因为动态博弈中的策略选择和时间顺序密切相关,简单的数值比较可能无法反映真实的博弈情况。


22.试比较“画线法”和“箭头法”的特点。

在许多博弈问题中,严格下策并不一定总是存在。因此我们可以换一个角度考虑,使用相对优势来求解博弈。   

画线法基本原理:

通过将某个参与人的策略效用两两比较,逐次确定相对优势策略,最终在这种比较中,选择出最优的策略组合。在每一个博弈方针对对方每一个策略的最大可能得益下划一条短线,双方的相对优势策略都这样划线以后,如果那个格子里面的两个数字下面都划了短线,这个格子对应的(相对优势)策略组合,就是一个纳什均衡。

箭头法基本原理:

箭头法的核心思想是:基于当前状况如何能继续将效用最大化。它是对博弈中的每个策略组合进行分析,判断各博弈方是否能够通过单独改变自己的策略而改善自己的得益,如果可以,则从所考察的策略组合的得益引一个箭头到改变策略后的策略组合对应的得益。这样对每个可能的策略组合都分析考察过以后,根据箭头反映的情况来判断博弈的结果。因此箭头法是一种动态的求解方法。

一个箭头可以形象地把博弈方的“理性人”本质表示出来,从策略选择的改变带来得益的增加。博弈矩阵中没有箭头指出的格子所代表的策略组合,表示每个博弈方都没有单独改变策略选择的倾向,这个策略组合就是纳什均衡

画线法适用于较为简单的博弈问题,直观明了;而箭头法适用于较为复杂的博弈问题,能够深入分析参与者之间的相互影响和依赖关系。

下图是我在文心一言中得到的答案,也很有参考意义:

python求解纳什均衡 纳什均衡 求解_知乎_04


50.严格下策反复消去法。

python求解纳什均衡 纳什均衡 求解_算法_05

答:  (x,y)中,x为参与者1的得益,y为参与者2的得益。

首先,对于参与者2,右策略是相对于中策略严格劣策略。因为当参与者2选择右策略时,参与者1无论选择上还是下,参与者2得到的收益 都比参与者2选择中策略时得到的少。也就是 5>3, 4>2,所以参与者2绝对不会选择右策略(足够理性),删除右策略。

python求解纳什均衡 纳什均衡 求解_依赖关系_06

删除右策略之后的矩阵如下所示: 我们再看参与者1,参与者1的下策略相对于上策略严格劣策略。假设参与者1选择了上策略,那么参与者2无论选择左还是中,参与者1得到的收益永远比参与者1选择下策略时的收益要高,也就是2>1 , 2>0。所以删除参与者1的下策略。

python求解纳什均衡 纳什均衡 求解_算法_07

删去下策略后的矩阵如下:  我们可以看到,参与者1此时只能选择上策略了。

参与者2选择左时,它(参与者2)的得益为1;参与者选择中时,它的得益为5。  因为1<5,所以此时左策略是相对于中策略的严格劣策略。参与者2必定会选择中策略。删去左策略。

python求解纳什均衡 纳什均衡 求解_知乎_08

于是 博弈的最终结果是"参与者1选择上,参与者2选择中",这个策略组合便是博弈的均衡解。


51.箭头法求纳什均衡

python求解纳什均衡 纳什均衡 求解_知乎_09

答:(红色的箭头代表从参与者1角度出发,蓝色的箭头则代表参与者2)

我们以左上角的(a,a)策略组合为起点。 首先看参与者1,此时它的得益为6,向下或者向左都可以提高它的得益,且得益分别为7  , 8:

python求解纳什均衡 纳什均衡 求解_python求解纳什均衡_10

划出了两条红色路径,观察参与者1的得益,很明显(b,b)策略处的参与者1的得益为9,是大于7,8的,所以参与者1有动机选择至(b,b)处。红色的箭头最终汇聚在(b,b)处,参与者1的得益达到了9,并且再无动机改变,因为在(b,b)相邻处 其他部分的得益都不会大于9。

而从参与者2的角度出发(蓝色箭头),先从(a,a)处出发,有两条路径可以选择:向下走,得益为5,向右走,得益为4。如下图所示:

python求解纳什均衡 纳什均衡 求解_知乎_11

*以此类推,按照固有的方法,求解出纳什均衡(时间原因,后期我会补上这部分的内容)


52.求解混合策略纳什均衡

python求解纳什均衡 纳什均衡 求解_算法_12

如果在博弈中没有纳什均衡,或者有多个纳什均衡。此时需要引进“混合策略”和“混合策略纳什均衡”。     

为表示方便,我们设A为剪刀,B为石头,C为布。设甲为1方,乙为2方。

甲必须使乙选择出剪刀、石头、布的期望得益都相等

python求解纳什均衡 纳什均衡 求解_依赖关系_13

python求解纳什均衡 纳什均衡 求解_人工智能_14

python求解纳什均衡 纳什均衡 求解_依赖关系_15

python求解纳什均衡 纳什均衡 求解_知乎_16

联立上式,解得:

python求解纳什均衡 纳什均衡 求解_python求解纳什均衡_17

     

python求解纳什均衡 纳什均衡 求解_知乎_18

    

python求解纳什均衡 纳什均衡 求解_算法_19

同理,乙方也应使甲选择出剪刀、石头、布的期望得益相等

python求解纳什均衡 纳什均衡 求解_算法_20

python求解纳什均衡 纳什均衡 求解_算法_21

python求解纳什均衡 纳什均衡 求解_依赖关系_22

python求解纳什均衡 纳什均衡 求解_人工智能_23

python求解纳什均衡 纳什均衡 求解_依赖关系_24

    

python求解纳什均衡 纳什均衡 求解_依赖关系_25

     

python求解纳什均衡 纳什均衡 求解_知乎_26

所以,当甲以

python求解纳什均衡 纳什均衡 求解_知乎_27

的概率选择出石头剪刀布时,乙也以

python求解纳什均衡 纳什均衡 求解_知乎_27

的概率选择出石头剪刀布。这个混合策略组合是稳定的,

python求解纳什均衡 纳什均衡 求解_人工智能_29

是本博弈唯一的混合策略纳什均衡。

再举个例题,加强了解,

python求解纳什均衡 纳什均衡 求解_人工智能_30

python求解纳什均衡 纳什均衡 求解_依赖关系_31

python求解纳什均衡 纳什均衡 求解_人工智能_32