怎样通俗易懂地解释博弈论?能否举例说明?

关注者
9
被浏览
8,135

4 个回答

纳什均衡 囚徒博弈 走出囚徒困境

约翰.纳什

纳什均衡

这位美国老头叫约翰.纳什,经典影片《美丽心灵》再现了这位伟大的数学天才的传奇经历。他提出的“纳什均衡”是博弈论的理论支柱。其实博弈论是由美籍匈牙利数学家冯.诺依曼创立的,但创立之初研究范围仅限于二人零和博弈,也就是说参与者只有两方,并且两人间有胜有负,总获利为零的那种博弈(赌博、下棋等)。但现实往往是多方参与的,往古了说《三国演义》,往今了说一带一路,都是多极点参与争取共赢。

1950年,纳什写出论文《N人博弈中的均衡点》,当时他带着论文去见冯.诺依曼还有爱因斯坦还遭受过冷遇。纳什均衡主要研究多人参与、非零和的博弈问题。简单比喻一下,找到两条线的交汇点很简单,而找到多条线的交汇点相对难很多,而纳什均衡找到了解法,它将博弈论从小胡同里带到了更加广阔的天地。

均衡是博弈的结果,但并不是唯一的结果;有的博弈只有一个均衡点,有的有多个,还有的均衡点之间是可以相互转换的(当连续博弈的时候,均衡点就会发生转换)。

咱们记住一点:当博弈方的策略达成“纳什均衡”后,任何一方改变自己的策略都会降低收益。因此,纳什均衡的意思是:任何一方采取的策略都是对其余所有方采取策略组合下的最佳对策;当所有其他人都不改变策略时,为了让自己的收益最大,任何一方都不会(或者无法)改变自己的策略,这个时候的策略组合就是一个纳什均衡。

现实生活中,我们在博弈中需要做的是学会协调、学会退而求其次,把事情变得简单明晰,锻炼自己的策略化思维。

生活是一场博弈,每个人也是一场博弈,是一场与命运抗争的博弈!

生活就是一场博弈

囚徒博弈

(1950年,数学家塔克任斯坦福大学 客座教授 ,在给一些心理学家作讲演时,讲到两个囚犯的故事。)

假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。

囚徒博弈

关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。

两点启示:一、人在为自己谋求私利的时候不要太精明,精明不等于聪明更等于高明,太过精明反而往往会坏事;二、运用“理性”的时候要适当。

走出囚徒困境

囚徒博弈

如何走出囚徒困境?

1,最有效的手段是合作:寻求共同利益、确立靠谱的组织者、用道德(等约束手段)保证合作。

2,合作必须真诚,但防人之心不可无:运用重复博弈不断加强合作。

3,未来决定现在:预期收益决定是否需要继续合作下去。

4,不要让对手看到尽头、冤家也是可以合作的:提升预期收益降低预期风险。

明天我们浅说‘智猪博弈’、‘猎鹿博弈’,听名字很有趣吧?

博弈论,又称对策论,是使用严谨的数学模型研究 冲突对抗条件下最优决策问题的理论 ,是研究竞争的逻辑和规律的数学分支,在经济学、离散数学、算法设计、人工智能中有着广泛的应用。

本篇文章不会以太多学术的角度进行讲解,只会涉及一些经典的名词,主要通过几个经典模型来介绍博弈论,没有任何基础知识的读者也可以像看故事一样顺利浏览,若在从中对博弈论产生兴趣,也可以继续深入学习。

囚徒困境——寻求均衡

核心: 收益矩阵 + 寻求均衡

情景

两个犯罪分子在一次犯罪行动中被警察逮捕,并被分别关到两个独立且不能互通信息的牢房,对于他们有三种情况

  • 两个人都自爆,将都会 被判 8 年
  • 一个人自爆并作为污点证人,一个人撒谎,前者会因为功过相抵而不被判刑,后者会因为妨碍司法公正判刑 10 年
  • 两个人都选择撒谎,将因无法找到证据,只能给两人轻判 1 年

收益矩阵

寻求均衡

根据收益矩阵,无论对方选择自爆或是撒谎,当对方选择不变的情况下,对于 A/B 自身选择坦白获得的收益都比撒谎高。

此时双方都存在 严格占优策略 ,博弈结果显然是可预测的。

场地博弈——协调博弈

纳什均衡 (非合作博弈均衡),指任何一方采取的策略都是对其余所有方采取策略组合下的最佳策略,当所有人都不改变策略时,为了让自己的收益最大,任何一方都不会改变自己的策略。
协调博弈 :存在多个纳什均衡的博弈,即 参与人对不同策略组合有相同偏好的博弈 ,如果其他人能够正确地预期,均衡选择依赖参与人之间对博弈进行有充分相似的信念。

情景

假定你的女朋友问你想相约在哪个场地,场地有学校和她家楼下的车站

  • 当你的选择和她所想的一样时,双方好感度加一
  • 当选择不一致时,好感度不变

收益矩阵

结果 :这种情况下,由于存在多个纳什均衡,博弈的结果难以从博弈的结果中直接预测,往往需要额外的信息。

简单博弈总结

  1. 双方都严格占优策略,都双方都会选择自己占优的策略
  2. 如果只有一方有严格占优策略,则可以预测另一方会采用此策略的最佳应对
  3. 如果不存在一个占优策略,可寻找纳什均衡

存在一个纳什均衡,该均衡对应合理结果

存在多个纳什均衡,需要额外信息辅助判断

零和博弈——混合策略

纯策略 :非此即彼的一组策略。
混合策略 :在一切简单博弈无法判断的情况下(不存在绝对占优策略和纳什均衡),需要通过预测对方各种行为的几率,将策略以概率组合起来。

情景

甲乙各持有一枚硬币,若硬币朝向相同,乙将得到甲的硬币,反之甲将得到乙的硬币

策略考虑

  • 进攻:预测,即估计对方采取不同策略的概率,来确定自己的策略。
  • 防守:防止预测,让对方不知道自己的决策概率或难以依据概率预测自己决策

收益矩阵

期望策略与期望收益

期望策略:假设参与人有两种纯策略 H 和 T,其中参与人 i 有 概率 \alpha_i 执行 H, 1-\alpha_i 的概率决策 T
期望收益:根据期望策略和收益矩阵可计算出期望收益

博弈中的"共同知识"

以上几个例子,博弈的前提都是信息透明,站在全局的视角进行博弈,但现实中,我们往往不知道对方的决策的概率和可能性,即可我们没有博弈中的 "共同知识",这原因比理论的博弈更加复杂。

文章推荐

博弈论(Game Theory)入门学习笔记
博弈论经典模型全解析(入门级)
GitBook