囧事百科-生活百科知识大全

网站地图生活

囧事百科-生活百科知识大全

当前位置: 囧事百科 > 炒股 >

纯方案纳什均衡

时间:2022-04-30 09:37人气:来源: www.songhuahushop.com

啥是纯方案纳什均衡
纯方案纳什均衡是指在一个纯方案组合中,假如给定其他的方案不变,该节点不会单方面改变我们的方案,不然不会使节点访问代价变小。
"编辑]存在纯方案纳什均衡的有限次重复博弈
假如重复博弈中有惟一纯方案纳什均衡,那样大家如何找出它的纯方案纳什均衡呢?第一看下面囚徒的困境的博弈的例子:

大家目前考虑该博弈重复两次的重复博弈,这可以理解成给囚徒两次坦白机会,最后的得益是两个阶段博弈中各自得益之和.在两次博弈过程中,双方了解首次博弈的结果再进行二次博弈.用逆推总结法来剖析,先剖析第二阶段,也就是第二次重复时两博弈方的选择.非常明显,这个第二阶段仍然是两囚徒之间的一个囚徒的困境博弈,此时前一阶段的结果已成为既成事实,此后又不再有任何的后续阶段,因此达成自己目前的最大利益是两博弈方在该阶段决策中的惟一原则.
因此大家不难得出结论,不管前一次的博弈得到的结果怎么样,第二阶段的惟一结果就是原博弈惟一的纳什均衡(坦白,坦白),双方得益(-5,-5).
目前再回到第一阶段,即首次博弈.理性的博弈方在第一阶段就对后一阶段的结局很了解,了解第二阶段的结果势必是(坦白,坦白),因此不管第一阶段的博弈结果是什么,双方在整个重复博弈中的最后得益,都将是第一阶段的基础上各加-5.因此从第一阶段的选择来看,这个重复博弈与图l中得益矩阵表示的一次性博弈事实上是完全等价的.

于是大家可以得出惟一纯方案均衡的有限次重复博弈的结果就是重复原博弈惟一的纯方案纳什均衡,这就是这种重复博弈惟一的子博弈完美纳什均衡路径.
假如重复博弈中有多个纯方案纳什均衡,设某一市场有两个生产同样水平商品的厂家,他们对商品的定价同有高(H)、中(M)、低(L)三种可能.设高价时市场总收益为10个单位,中价时市场总收益为6个单位,底价时市场总收益为2个单位.再假设两厂家同时决定价格,价格不等时底价格者独享收益,价格相等时双方平分收益.这个时候两厂家对价格的选择就构成了一个静态博弈问题.大家看一个三价博弈的重复博弈的例子:

显然,这个得益矩阵有两个纯方案纳什均衡(M,M)和(L,L),大家也可以看出事实上两博弈方最大的得益是方案组合(H,H),但它并非纳什均衡.目前考虑重复两次该博弈,大家使用一种触发方案(Trigger Strategy):博弈双方第一试图合作,一旦发觉他们不合作也用不合作相报复的方案.使得在第一阶段使用(H,H)成为子博弈完美纳什均衡,其双方的方案是如此的:
博弈方1:首次选H;假如首次结果为(H,H),则第二次选M,假如首次结果为任何其他方案组合,则第二次选择L.
博弈方2:同博弈方1.在上述双方方案组合下,两次重复博弈的路径肯定为第一阶段(H,H),第二阶段(M,M),这是一个子博弈完美纳什均衡路径.由于第二阶段是一个原博弈的纳什均衡,因此不可能有哪一方想单独偏离;第二,第一阶段的(H,H)虽不是原来的博弈纳什均衡,但假如一方单独偏离,使用M能增加1单位得益,如此的后果却是第二阶段至少要损失2单位的得益,由于双方使用的是触发方案,即有报复机制的方案,因此适当的选择是坚持H.这就说明了上述方案组合是这个两次重复博弈的子博弈完美纳什均衡.
从上述的例子大家可以看出,有多个纯方案纳什均衡的博弈重复两次的子博弈完美纳什均衡路径是,第一阶段使用(H,H),第二阶段使用原博弈的纳什均衡(M,M).
假如这个重复博弈重复三次,或者更多次,结论也是一样的,仍然用触发方案,它的子博弈完美纳什均衡路径为除去最后一次以外,每次都使用(H,H),最后一次使用原博弈的纳什均衡(M,M).
"编辑]存在纯方案纳什均衡的无限次重复博弈
与有限次重复博弈一样,无限次重复博弈也是基本博弈的容易重复,但无限次重复博弈没最后一次重复,因此无限次重复博弈与有限次有一些不同.
任何博弈中博弈方方案选择的依据都是得益的大小,这在重复博弈中仍然是成立的.但重复博弈又与一次性博弈有所不同,由于在重复博弈中,每一阶段都是一个博弈,并且各博弈方都有得益,因此对于重复博弈,大家要计算的就是博弈结束时的一个总的得益.因为前一次博弈和后一次博弈之间会有损失,因此大家使用一种办法,就是将后一阶段的得益折算成目前阶段得益的(目前值)的贴现系数δ.有了贴现系数δ,那样在无限次重复博弈中,某博弈方各阶段得益为π1,π2,...,则该博弈方总得益的目前值为:

对于存在惟一纯方案纳什均衡博弈的无限次重复博弈,大家从下面的例子来看:

其中博弈方1和博弈方2分别表示两个厂家,H和L分别表示高价和底价.显然,该博弈的一次性博弈有惟一的纯方案纳什均衡(L,L),但这个纳什均衡并非最好方案组合,由于方案组合(H,H)的得益(4,4)比(1,1)要高的多.但因为(H,H)不是该博弈的纳什均衡,所以在一次性博弈中不会被使用.依据上面的剖析,此博弈在有限次重复博弈并不可以达成潜在的合作利益,两博弈方在每次重复中都不会使用效率较高的(H,H).为了达成效率较高的合作利益(H,H),假设两博弈方都使用触发方案,也即报复性方案:第一阶段使用H,在第t阶段,假如前t-l阶段的结果都是(H,H),则继续使用L.假设博弈方1已经使用了这种方案,目前大家来确定博弈方2在第一阶段的最佳选择.假如博弈方2使用L,那样在第一阶段能得到5,但如此会引起博弈方1一直使用L的报复,自己也只能一直使用L,得益将永远为1,总得益的目前值为

假如博弈方2使用H,则在第一阶段他将得4,下一阶段又面临同样的选择.若记V为博弈方2在该重复博弈中每阶段都使用最好选择的总得益目前值,那样从第二阶段开始的无限次重复博弈由于与从第一阶段开始的只差一 阶段,因而在无限次重复时可看作相同的,其总得益的目前值折算成第一阶段的得益为,因此当第一阶段的最好选择是H时,整个无限次重复博弈总得益的目前值为
或者
因此,当 解得时,博弈方2会使用H方案,不然会使用L方案.也就是说当时,博弈方2对博弈方1触发方案的最好反应是第一阶段使用H.这个时候大家就说双方使用上述触发方案是一个纳什均衡.
于是大家得出,在有限次重复博弈中,惟一纯方案纳什均衡不可以达成最大得益(H,H),而在无限次重复博弈中,通过触发方案却可以达成(H,H)。
参考文献↑ 1.0 1.1 陈敏.没有纯方案纳什均衡的重复博弈.咸宁学院学报.2005年12月.第25卷第6期

标签:

上一篇:线性规划

网站首页

下一篇:没有了