重复博弈
重复博弈
重复博弈是同样结构的博弈重复进行多次的过程。动态博弈的一种特殊形式。其中每次博弈都被称为“阶段博弈”。在重复博弈的情况下,企业在选择策略的时候不仅需要考虑当前的对局,而且还需考虑当前选择的策略对于以后的对局将产生怎样的影响。
简介
顾名思义,重复博弈(repeated game)是指同样结构的博弈重复许多次,其中的每次博弈称为“阶段博弈”(stage games)。重复博弈是动态博弈中的重要内容,它可以是完全信息的重复博弈,也可以是不完全信息的重复博弈。重复博弈是指同样结构的博弈重复许多次。当博弈只进行一次时,每个参与人都只关心一次性的支付;如果博弈是重复多次的,参与人可能会为了长远利益而牺牲眼前的利益,从而选择不同的均衡策略。因此,重复博弈的次数会影响到博弈均衡的结果。
在重复博弈中,每次博弈的条件、规则和内容都是相同的,但由于有一个长期利益的存在,因此各博弈方在当前阶段的博弈中要考虑到不能引起其它博弈方在后面阶段的对抗、报复或恶性竞争,即不能像在一次性静态博弈中那样毫不顾及其它博弈方的利益。有时,一方做出一种合作的姿态,可能使其它博弈方在今后阶段采取合作的态度,从而实现共同的长期利益。
下面给出两个重要定义:
定义1:可信性是指动态博弈中先行动的博弈方是否该相信后行动的博弈方会采取对自己有利或不利的行为。
定义2:如果动态博弈中各博弈方的策略在动态博弈本身和所有子博弈中都构成均衡,则称该策略组合具有子博弈完美性。
在重复博弈中,可信性同样是非常重要的,也即子博弈完美性仍是判断均衡是否稳定可靠的重要依据,又由于长期利益对短期行为的制约作用,因此有一些在一次性博弈中不可行的威胁或诺言在重复博弈中会变为可信的,从而使博弈的均衡结果出现更多的可能性。
特征
重复博弈具有三个基本特征:
A、重复博弈的阶段,博弈之间没有“物质”上的联系,即前一个阶段博弈并不改变后一个阶段的博弈的结构;
B、在重复博弈的每一个阶段,所有参与人都观测到该博弈过去的历史;
C、参与人的总收益是所有阶段博弈的收益的贴现值之和或加权平均数
影响因素
影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。在重复博弈中,参与人存在着短期利益和长远利益的均衡,有可能为了长远利益牺牲短期利益而选择不同的均衡策略。重复博弈的这个结果,为现实中的许多合作行为和社会规范提供了解释。信息的完备性之所以影响均衡结果,是因为如果每一个参与人的特征不为其他参与人所知时,该参与人就很有可能积极建立一个好声誉,以换取长远利益。根据重复博弈的重复次数,可以将其分为有限次重复博弈和无限次重复博弈。
分类
无限次
下面用一个关于产品定价博弈的例子分析重复博弈。
产品定价博弈
厂商B
低价高价
厂商A低价
高价12,1220,4
4,2015,15
是两个厂商A和B定价的支付矩阵,从中可以看出:在一次性博弈中中,厂商A和厂商B都存在上策,上策均衡是双方都定低价。
从参与人行为看,由于博弈可以重复无数次,博弈双方为了长期利益有时间进行试探性出价。在第一次博弈时出高价以寻求竞争对手的合作,一旦对局人为了短期利益采取不合作行为,那么就会建立该对局人是不可信任的信念,在下一次的博弈中都采取不合作的低价行为,使对局人的长期利益受损。
可见,厂商B在第一次博弈中由于不合作策略得到的高收益会在以后博弈中因A的报复性策略而抵消,甚至在重复博弈若干次后出现损失。
假如厂商A开始制定的高价策略,从支付矩阵得到厂商B若也定高价,其每次博弈的支付分别为(15,15,15...);若厂商B制定低价,则在第一次博弈中获得高收益,但是随后会由于厂商A的低价行为而使其受损,各次博弈的支付分别为(20,12,12...)。厂商A的这种策略被称为“以牙还牙”策略,这种策略是A在初始选择合作,如果B合作,那么A也会一直合作下去;若B在某一次博弈中选择不合作,那么A在以后博弈中都采取不合作策略。“以牙还牙”策略意味着任何一个参与人的一次性不合作将会引起永远的不合作。所有参与人为了长期利益,使得无限次重复的非合作博弈产生合作解。
有限次
假定重复有限的N次,这意味着所有参与人都能预测到最后一次(第N次)的收益。在第N次博弈中,各参与人都知道对方的“以牙还牙”,但是他也知道如果在这次博弈中自己选择低价的上策,将使自己受益而其他参与人受损,且也不会留给对方报复的机会(博弈到第N次结束)。所有参与人都明白这一点,因此在最后一次博弈中将都采取低价策略,这与一次博弈的上策均衡结果相同。
在现实中,市场竞争者很难弄清重复博弈的结构。厂商很难预期自己在什么时候会结束经营,也不清楚与对手的竞争何时是第N次博弈。因此,只要竞争时期足够长,竞争的双方都预期未来还要进行很多次博弈,那么,竞争的结构就可能近似于无限次重复博弈,使得厂商在竞争中出现相互合作的局面。
序列博弈
在实践中,博弈者在选择行动时可能有先后顺序或某些对局者可能率先采取行动,这种博弈被称为序列博弈。
1.先行者优势:厂商生产甜味饼干的收益10要高于生产脆味饼干的收益8。假定两个厂商同时独立的做出生产决定,他们都愿意推出甜味饼干——结果是两家收益都受损
厂商2
脆甜
厂商1脆
甜—3,—38,10
10,8—3,—3
可见,在序列博弈中,先行者可能占据一定的有利地位,这就是先行者优势。厂商1为获得更大收益,会选择推出甜味饼干,使得厂商2只能选择收益较低却是最优的策略——推出脆味饼干。
2.博弈的扩展形式:常用博弈的扩展形式来分析序列博弈,它用决策树的形式表示可能的行动,并在各枝的结束处给出各行动的支付。
脆-3,-3
脆厂商2
厂商1(2)甜8,10
(1)脆10,8
甜厂商2
(3)甜3,-3
博弈的扩展形式的解一般用逆推法推导,由最后的收益逆向归纳,倒推到初始节点1处做出最后决策。
参考资料
重复博弈.智库。百科.2017-07-31
重复博弈.ppt.智库文档.2017-07-31
目录
概述
简介
特征
影响因素
分类
无限次
有限次
序列博弈
参考资料