博弈论

2026/4/25 21:43:51

场,其收益函数为

U = QP(Q) ? 2Q = Q(8 ? Q) ? 2Q = 6Q ? Q2.

?U= 6 ? 2Q = 0, 得Q = 3,收益U = 6 ?3 ? 32 = 9。可见两厂商合并后,生产的产品更少,?Q但收益更多。

3 三人非合作博弈

仅考虑纯策略博弈。

例3.1 (三人选数博弈, ([2]p81)A, B, C三人玩选数游戏,每人有3种选择,他们的收益见表3.1,每个单元格的三个数字分别是局中人A, B, C的收益。求此博弈的纯策略納什均衡点。

表3.1 三人选数游戏的收益

1 局中人B 1 局 中A 人 1 2 3 2 3 1 局中人C 2 局中人B 2 3 1 3 局中人B 2 3 3, 3, 3 3, 2, 3 3, 1, 3 3, 3, 2 3, 2, 2 3, 1, 2 3, 3, 1 3, 2, 1 3, 1, 1 2, 3, 3 2, 2, 3 2, 1, 3 2, 3, 2 6, 6, 6 6, 5, 6 2, 3, 1 6, 6, 5 6, 5, 5 1, 3, 3 1, 2, 3 1, 1, 3 1, 3, 2 5, 6, 6 5, 5, 6 1, 3, 1 5, 6, 5 9, 9, 9 解 表中三个3?3子矩阵分别是局中人C分别采用策略1, 2, 3时, 局中人A与B的博弈收益。忽略每个单元格的第三个数字,对每个子矩阵用划线法求局中人A与B的博弈结果。然后考虑单元格的第三个数字,将局中人C采用策略1的三列数字合成一个矩阵,在每行的最大数字下划线;将策略2的三列数字合成一个矩阵,在每行的最大数字下划线;将策略3的三列数字合成一个矩阵,在每行的最大数字下划线。三个数字都划了线的单元格对应的策略便是納什均衡点。它们是策略组合(1, 1, 1),(2, 2, 2)和(3, 3, 3)。

4 合作博弈的收益分配

4.1 基本概念及Shapley值

“存在具有约束力的合作协议的博弈就是合作博弈,否则就是非合作博弈”([2]p92)。 用U表示n个参与人的集合, U的任意一个子集S称为一个联盟, U称为大联盟。联盟S的收益记为V(S), 它满足以下公理:

(1) V(?) = 0, ?为空集;

(2) 对于任意S1, S2 ? U, 如果S1 ? S2 = ?, 那么V(S1 ? S2) ? V(S1) + V(S2) (称为超可加性)。

设S1, S2, … , Sk是U的非空子集,如果它们的并集等于U,任何两个的交集为空集,就称它们为一个联盟结构,记为[S1, S2, … , Sk]。按照超可加性,

V(S1) + V(S2) + … + V(Sk) ? V(U),

即任何一个联盟结构的总收益不大于大联盟的收益。如果上式的等号成立,称该联盟为有效联盟(包括大联盟)。

用?i(V)表示参与人i分得的数额,按以下公式计算的数值称为Shapley值。

?i(V) =

其中W(| S |) =

i?S?U?W(|S|)[V(S)?V(S\\{i})], i =1, 2, … ,n.

(n?|S|)!(|S|?1)!, | S |表示集合S中元素的个数。

n!例4.1 A, B, C三人或者单独经商或者联合经商,其收益由表4.1所示。求每个人分配的数额。([2]p99)

表4.1 A, B, C三人经商的收益

S V(S) A 10 B 10 C 10 AB 70 AC 50 BC 40 ABC 100 解 按Shapley值公式,参与人A分配数额?A(V)的计算见表4.2。

表4.2参与人A分配数额的计算表

S V(S) V(S\\A) V(S) ? V(S\\A) | S | (n ? | S |)!(| S | ? 1)! W(| S |) A 10 0 10 1 2 1/3 AB 70 10 60 2 1 1/6 AC 50 10 40 2 1 1/6 ABC 100 40 60 3 3 1/3 ?A(V) 40

同理可算出参与人B的分配额?B(V) = 35,C的分配额?C(V) = 25。

4.2 合作博弈的核

假设联盟中的每个人均匀地分配该联盟的收益。在一个联盟结构中,如果有人从某联盟中退出可以获得更大的收益,该联盟结构是不稳定的,否则是稳定的。

前面已经介绍,总收益等于大联盟收益的联盟结构称为有效联盟结构。稳定的有效联盟结构称为合作博弈的核。

例4.2 地产合并博弈([3]p113)

A, B, C三人形成的各种联盟结构以及每个联盟结构中各联盟的收益见表4.2。问哪些联盟结构是有效的稳定的。

表4.2各种联盟结构的联盟收益

序号 联盟结构 联盟收益 1 ABC (10) 2 AB, C (6) (4) 3 AC, B (4) (4) 4 BC, A (4) (4) 5 A, B, C (3)(3)(3) 可以看出1号联盟结构(大联盟)和2号联盟结构[AB, C]都是有效联盟结构。在大联盟中C的收益为10/3,而在2号联盟结构中C的收益为4,所以C可能会从大联盟中退出而选择2号联盟结构。这说明大联盟是不稳定的。但2号联盟结构是稳定的,因为无论A或B从联盟AB中退出,都只能得到联盟结构[A, B, C], 其收益为3,不超过在联盟AB中

的平均收益。所以2号联盟结构是合作博弈的核。

将表4.2的联盟收益改为表4.3。可见大联盟和2号联盟都是合作博弈的核。

表4.3各种联盟结构的另一种联盟收益

序号 联盟结构 联盟收益 1 ABC (11) 2 AB, C (8) (3) 3 AC, B (4) (3) 4 BC, A (4) (3) 5 A, B, C (3)(3)(3) 4.3 塔木德分配法([2]p162)

塔木德分配法是根据若干债权人所声明的债权分配总财产的一种方法。设总财产为E, n个债权人所声明的债权分别为c[1], c[2], … , c[n], 他们分得的财产分别为x[1], x[2], … , x[n]。不妨设c[1] ? c[2] ? … ? c[n]。塔木德法依次分配财产,得到的分配结果(x[1], x[2], … , x[n])叫做核仁(nucleolus)。

(1) 二人争产问题的塔木德法([2]p165)

只需考虑债权人1的分配额x[1]即可, 债权人2的分配额x[2] = E ? x[1]。

E/2,E?c[1],??x[1]??c[1]/2,c[1]?E?c[2],

?(E?c[1]?c[2])/2,E?c[2].?(2) 三人争产问题的塔木德算法

此问题将总财产按大小分为三种情况考虑,第一个分界点E* = c[1] ? 3/2, 第二个分界点E** = c[1, 2, 3] ? c[1] ? 3/2, 其中c[1, 2, 3] = c[1] + c[2] + c[3]。

① E ? E*时,(x[1], x[2], x[3]) = (E/3, E/3, E/3)。

② E > E**时,(x[1], x[2], x[3]) = (E/3 + d/3, E/3 + d/3, E/3 + d/3), 其中d = E ? E**。 ③ E* < E ? E**时,分两步用二人争产问题的塔木德法分配财产。

第1步将三人分为{1}和{2, 3}两组,他们声明的债权分别为c[1]和c[2, 3] = c[2] + c[3]。用二人争产问题的塔木德法在这两组之间分配总财产E。由于

c[1] ? 3/2 < E ? c[1, 2, 3] ? c[1] ? 3/2 = c[2, 3] ? c[1]/2

所以

c[1] /2 < E < c[2, 3].

于是第1人分得的财产x[1] = c[1]/2, {2, 3}组分得的财产x[2, 3] = E ? c[1]/2。

第2步在第2, 3两人之间用二人争产问题的塔木德法分配剩余的财产E ? c[1]/2。

练习题

(1) 说明例2.2的策略X = (2/3, 1/3)T, Y = (5/9, 4/9)T是销售商与消费者博弈的納什均衡。 (2) 将表2.3的最后一个数字9改为12,求納什均衡。

参考文献

[1] Wikipedia. Nash equilibrium, 2014.4

[2] 焦宝聪,陈兰平. 博弈论,首都师范大学出版社,2013.10

[3] 黄涛. 博弈论教程?理论·应用,首都经济贸易大学出版社,2004.5 [4]《运筹学》教材编写组. 运筹学,清华大学出版社,1998.3


博弈论.doc 将本文的Word文档下载到电脑
搜索更多关于: 博弈论 的文档
相关推荐
相关阅读
× 游客快捷下载通道(下载后可以自由复制和排版)

下载本文档需要支付 10

支付方式:

开通VIP包月会员 特价:29元/月

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:xuecool-com QQ:370150219