【学习笔记】纳什均衡

· · 个人记录

纳什均衡

 纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。

在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。

如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡

  一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。(从整体上考虑不一定最优,但对于每个决策者一定最优)

像学习资料1中的那个例题(有一个姑娘和你玩金币),像这种决策不显然,可以有多局,每局又有多种情况,这时决策者做出决策是一个概率性事件,称作混合战略纳什平衡。

上文讲的两个例子,我们称之为纯战略纳什平衡。所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。

这并不好理解。我们引入另一个概念来帮助理解——混合战略纳什平衡。混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。

也就是说,纯战略是卡死了的,混合战略是带有概率的。

这样的题目我们可以根据条件列出在我的不同决策和对手的不同反应共同作用下我的收益函数(自变量是我某个决策的概率),由于有关对手的反应,这是个连续的分段函数,对手可以做出判断,选择尽量让你收益小的方案(根据对手的反应分成两段,他可以选择让你取左边还是右边),而我们能做到的是调整概率,使在不同反应下收益一样,在此时情况下收益最大。(画图可知)。

当然,决策者都绝顶聪明

参考资料:

学习资料1(一位聚聚对纳什均衡的总结和例题)

学习资料2(百科介绍)

学习资料3(知乎解答)