「盛锐数码视野长娇」纳什:如何科学追求对象?( 二 )
利用角谷定理证明纳什均衡
为证明纳什均衡(NE)的存在 , 假设r?(σ??)是玩家i在其他玩家的策略下的最优策略 。
r?(σ??)=argmaxu?(σ?,σ??)
在这里 , σ∈Σ其中Σ?xΣ??是所有参与者的策略 , u?是玩家i的收益函数 。 定义一个值函数r:Σ→2^Σ , 其中r=(r?(σ??),r??(σ??)) 。 证明纳什均衡的存在等价于证明r有一个不动点 。
角谷不动点定理表明 , 如果满足以下四点 , 则有不动点的存在:
Σ是紧凑 , 凸且非空;
r(σ)是非空的;
r(σ)是上半连续的;
r(σ)是凸的 。
条件1的前提是Σ是单纯形 , 因此其为紧凑的 。 “凸”源于玩家能够混合策略 。 玩家必须选择策略因此Σ为非空的 。
条件2和3可通过Berge最大值定理(Berge'smaximumtheorem)证明 。 因为u?是连续且紧凑的 , 所以r(σ)是非空的且上半连续的 。
条件4也是由于混合策略的原因 。 假设σ?,σ?'∈r(σ??) , 然后λσ?+(1-λ)σ?'∈r(σ??) 。 即如果两个策略产生最大收益 , 则两个策略混合也会产生同等收益 。
因此 , r和纳什均衡中存在一个不动点 。
举例
正式的游戏通常包含三个元素:玩家 , 策略和每个玩家的收益 。 收益函数代表每个玩家对于策略的偏好 , 策略集是玩家在游戏中的策略列表 。 可以在示意图中解释三种元素 , 并称其为收益矩阵 , 来表明两玩家的策略(两个玩家各有两种策略):
文章图片
左:游戏1的收益矩阵 , 为一个“协调博弈” 。 右:游戏2的收益矩阵 , “钱币配对”游戏(猜拳)
在每个游戏中 , 两个玩家都可以从A和B两种策略中任选一种 。
纯策略纳什均衡
纯策略的纳什均衡指的是:没有任何一个参与者可以通过单方面偏离和轮换策略来获得更高的预期收益 。
在游戏1中 , 如果他们选择不同的策略(A , B)或(B , A) , 则两者的收益均为0 。 如果他们都选择策略A , 则两者都会得到收益2 。 如果他们都选择策略B , 则两者都会得到收益1 。 策略集(A , A)和(B , B)因此产生纳什均衡 , 因为单个玩家策略的改变会导致该玩家的收益更低 。
在游戏2中 , 如果他们选择不同的策略(A , B)或(B , A) , 则玩家1的回报为-1 , 玩家2的回报为1 。 如果他们都选择A或B , 则玩家1会得到1的收益 , 玩家2得到-1 。 该游戏中没有纯粹的纳什均衡策略 , 因为在每种策略集中 , 其中一名玩家都会从策略的偏离中获利 。
混合策略纳什均衡
纳什的结果表明 , 在所有有限对策中至少存在一个纳什均衡点 。 由于游戏2不存在纯策略的纳什均衡 , 所以在混合策略中必然存在纳什均衡:
混合策略纳什均衡是一种策略集 , 其特征是至少有一个参与者在玩随机策略 , 并且没有一个参与者可以通过单方面改变和轮换策略来获得更高的期望收益 。
在游戏2中 , 玩家不选择单一的策略 , 而是按照一定的概率分布来选择策略 。 在均衡中 , 每个参与者的概率分布选择使得所有其他参与者对他们的纯策略不感兴趣 。
例如 , 作为玩家1 , 我们可以一半时使用A , 一半时间选择B , 根据抛硬币决定策略 。 玩家2唯一的理性反应就是做同样的事情 。 比如 , 在“硬币配对”博弈中 , 当选择A和B的策略概率相等时 , 就是一种混合策略的纳什均衡 。
解释
纳什在他的论文中提出了两种关于均衡的想法:一种基于理性 , 一种基于统计人群 。
在理性解释下 , 玩家们被认定为理性的 , 而且知晓游戏的全部信息 , 包含其他玩家的选择偏好 , 而且这些消息都是众所周知的 。 由于所有的玩家都了解彼此的选择策略和偏好 , 所以也能为所有的策略计算其收益 , 得到最佳策略 。 如果游戏只玩一次且所有的玩家都期望相同的纳什均衡(高收益) , 那么没有人会想要改变自己的策略 。
- 「竹生视野」罗永浩直播不到一个小时销售超过3500万,薇娅为PK卖火箭!
- 第一大视野■韩信只能等死,马超还能秀,唯独他能全程压制镜,如果对手抢到镜
- 玩加赛事for王者荣耀@上分英雄首选他!伤害高,支援快,有视野还有控制,S19中路崛起
- 「第一大视野」“3c散伙图”令人泪目,theshy的预言终要实现,阿水转会谜团解开
- 【极客数码最前线】千元出头电竞显示屏怎么选?畅玩使命召唤16还靠它
- 【数码东东】Pro!现货!无压力!,K30
- 第一大视野■sn裸基地前连败两次,乐言甘做铁分奴,ig表演下班的诱惑
- 「数码宝贝」《数码宝贝》中兽人加鲁鲁巅峰一战,力抗究极体数码宝贝
- 『稀饭玩数码』3告诉你这些条件一个不能少,能够带来更好的游戏体验只靠配置?iQOO
- 数码宝贝■回忆向:你还记得崇拜战斗暴龙兽的自己吗?