好又是摸鱼的一节课。

# 斯塔克伯格博弈 (Stackelberg Game)

标准形式的斯塔克伯格博弈 (Stackelberg Game) 由两个玩家组成,记为 N={1,2}N = \{1, 2\}, 其中玩家 1 是领导者 (leader), 玩家 2 是跟随者 (follower). 两者的动作集分别为 AlA_lAfA_f, 效用函数分别记作 ul(a),uf(a)u_l(a), u_f(a), 其中 a=(al,af)a = (a_l, a_f). 该博弈过程如下:

  1. 领导者选择策略 sls_l 并将其告知跟随者;
  2. 跟随者选择对该策略的最优回应 afa_f;
  3. 领导者根据 sls_l 选择动作 ala_l, 最终领导者与跟随者同时做出动作。

# 势博弈

# 定义

给定一个正则形式博弈,若存在函数 Φ:AR\Phi: A \mapsto \mathbb{R}, 使得对 i,ai,ai,ai\forall i, a_i, a_i', a_{-i}, 都满足

ui(ai,ai)ui(ai,ai)=Φ(ai,ai)Φ(ai,ai),u_i(a_i, a_{-i}) - u_i(a_i', a_{-i}) = \Phi(a_i, a_{-i}) - \Phi(a_i', a_{-i}),

那么称该博弈为一个势博弈 (potential game), Φ\Phi 称为势函数 (potential function).

# 性质

任何有限势博弈一定存在一个纯策略纳什均衡。

势博弈的局部最优解也可能是均衡。

# 拥塞博弈

拥塞博弈一般用于建模玩家之间争夺资源的问题。

一个拥塞博弈 是一个四元组 (N,RA,c)(N, R, A,c), 其中

  • NN 是玩家集合,N=n|N| = n;
  • RR 是资源集合,R=r|R| = r;
  • AiA_i 是玩家 ii 的行动集合,A=i=1nAiA = \prod_{i=1}^n A_i 是动作向量集合;
  • c=(c1,c2,,cn)c = (c_1, c_2, \cdots, c_n) 是所有资源的代价函数。

# 重复博弈

# 定义

重复博弈是某博弈重复若干轮所形成的博弈。

在重复博弈 GTG^T 中,