纯纳什均衡(纯纳什均衡和混合策略纳什均衡)

生活百科 2023-09-26 21:50:23

大家在生活的过程中会遇到很多问题，比如有些小伙伴对纯纳什均衡(纯纳什均衡和混合策略纳什均衡)不是很懂，不过没有关系，小编今天就给大家详细讲解一下这个问题，具体内容如下。

纳什均衡:在非合作博弈中，存在一个策略组合，使得每个参与人的策略更好地回应其他参与人的策略。如果参与者目前选择的策略形成了“纳什均衡”，那么对于任何一个参与者来说，单方面改变自己的策略都不会带来任何好处。

上面这段话值得一读。看完例题可以多看几遍。

具体例子如下:囚徒困境、智能猪博弈、范式博弈、饿狮博弈、硬币正反博弈。

囚犯的困境

假设两个小偷，A和B，因入室盗窃被捕。警察把他们放在不同的房间进行审讯，并给出了如下政策:如果一名嫌疑人供认并交出赃物，两人都将被定罪。如果另一名嫌疑人也供认不讳，他们每人被判处8年徒刑；如果另一个犯罪嫌疑人否认，他将被判处另外两年的监禁，而忏悔者将被立即释放。如果两人都否认，盗窃证据不足，但会以非法侵入罪各判一年有期徒刑。即:

表中数字分别代表A和B的量刑结果。此表一般用于博弈论分析。

这时候有人会觉得双方都否认就好，但问题是双方都被孤立了，会怀疑对方为了保护自己而背叛自己。

两个人会怎么想？

如果对方坦白，这个时候，如果我不承认，我要坐10年牢，如果我坦白，我要坐8年牢；如果对方否认，如果我这时候也否认，就判一年，如果我坦白，就可以释放。基于以上考虑，不管对方坦白与否，我坦白更划算。这时候最后的“纳什均衡”只能是两个人坦白，一起被判八年有期徒刑。

智猪博弈

猪圈里有两头猪，一头大猪和一头小猪。猪圈的一侧有一个踏板。每踩一次踏板，就会有少量的食物落在猪圈另一侧远离踏板的喂食口。如果一只猪踩在踏板上，另一只猪有机会先吃掉掉在另一边的食物。但当小猪踩下踏板时，大猪刚好会在小猪跑到食槽前吃完所有的食物；当大猪踩下踏板后，在小猪吃完掉下来的食物前，有机会跑到食槽，试着吃掉另一半。

那么，两只猪会采取什么策略呢？

当然，小猪在食槽边等着，而大猪在踏板和食槽之间不知疲倦地奔跑着。因为，小猪不蹬会什么也得不到，不蹬却能吃到食物。对于小猪来说，不管大猪踩不踩踏板，不踩总是一个不错的选择。另一方面，大猪知道小猪不会踩踏板，自己踩总比不踩好，只好踩。

范式博弈

GOO公司和SAM公司是利益关系，他们的收益会随着游戏的变化而变化。如下图所示:

双方都有“合作”和“背叛”两种可选策略，网格中的四组数据分别代表了四种博弈结果各自的收益。每组数据的第一个数字代表GOO公司的收入，后一个数字代表SAM公司的收入。

现在我们从GOO的角度来思考整个游戏策略。如果山姆选择合作，那么我们合作的收益是3，我们背叛的收益是5，所以我们应该选择背叛；如果山姆选择背叛，那么我们合作的收益是-3，我们背叛的收益是-1，所以我们还是应该选择背叛。

同样，山姆也会做出同样的选择。最后我们发现这个博弈双方都采取了背叛策略，各自的收益都是-1，这是一个比较糟糕的结局，虽然对任何一方来说都不是最糟糕的那种。

但是，游戏次数往往不止一次。当两家公司经历了多次背叛策略的博弈后，发现公式中也有(3，3)收益的双赢，显然要好得多。因此，两家公司在随后的博弈过程中必然会试图建立互信，从而驱使双方选择合作策略。

但如果双方都知道游戏次数有限，也许下一局就是最后一局，那么为了避免上一局对方背叛造成-3的损失，双方都会采取背叛策略，最终游戏结果会回到(-1，-1)。

这样，随着时代的变化，博弈的性质也会发生变化，纳什均衡点也会发生变化。

饿狮博弈

假设有A、B、C、D、E、F六只狮子(实力从左到右排序)和一只羊。假设A吃完羊会睡午觉，那么比A稍弱的B会趁机吃A，然后B会睡午觉，然后比B稍弱的C会吃B，以此类推。问:狮子A敢吃羊吗？

问题一定要逆向分析，从最弱的F开始，依次推进。假设E睡着了，F肯定会吃掉E，因为F后面没有其他狮子，不用担心被吃掉。继续往前推，既然E知道她睡着了会被F吃，那E肯定不敢在她睡着的时候吃D。既然E不敢吃D，D就可以放心吃睡C。依次往前推，得到C不吃，B吃，A不吃。所以答案是狮子A不敢吃羊。

但是，如果我们在狮子F后面加一个狮子G，总数变成7，用逆向分析按照上面的步骤再推一次，如下图。这次的答案变成了狮子A敢吃羊。

对比两个游戏，我们发现狮子A敢不敢吃羊，取决于狮子总数的奇偶性:当总数为奇数时，A敢吃；当总数为偶数时，A不敢吃。因此，奇数狮子和偶数狮子之间的博弈形成了两个稳定的纳什均衡点。

硬币正反博弈

假设你和一个美女玩数学游戏。美女的建议:让我们各自展示硬币的一面。如果我们都是人头，那我给你3块钱；如果我们都是尾巴，我给你1块钱；剩下的你给我，2块钱。那么该不该和这个美女玩这个游戏呢？

这里我们需要谈谈纳什均衡的分类:

(1)纯策略纳什均衡，也就是说玩家可以采取固定的策略(比如总是玩正面或者总是玩反面)，让每个人都赚得最多或者损失最少。

(2)混合策略的纳什均衡是给每个纯策略分配一个概率而形成的策略。混合策略允许玩家随机选择一个纯策略。混合策略纳什均衡要用概率计算，当达到一定概率时，支付可以更好。因为概率是连续的，所以即使策略集是有限的，也会有无限多的混合策略。

在这个博弈中，应该采用混合策略纳什均衡。

假设我们正面的概率是x，我们反面的概率是1-x，我们美女正面的概率是y，我们反面的概率是1-y，为了利益最大化，无论对手是正面还是负面，我们都应该是平等的，即:

3x + (-2)(1-x) = (-2) * x + 1*(1-x)

解方程x = 3/8；

同理，美女的收益:-3y+2(1-y) = 2y+ (-1) * (1-y)，

解方程时y等于3/8。

所以我们可以算出美女的期望收益是:(1-y)*(2x-(1-x))+y(-3x+2(1-x))= 1/8元，也就是说如果双方都采取更好的策略，美女平均每次都会赢1/8元。

所以你当然不能和她玩这个游戏。其实只要美女采用(3/8，5/8)的方案，无论你采用什么方案，都改变不了局面。

但是当你也采取更好的策略时，你至少可以保证你损失最小。否则，你会失去更多。

标签：均衡策略混合

上一篇：藤壶寄生在鲸鱼身上有什么危害（藤壶为什么被称作寄生恶魔）下一篇：灵与肉剧情介绍(灵与肉剧情介绍 142全集电视剧)

纯纳什均衡(纯纳什均衡和混合策略纳什均衡)

热门文章

推荐文章