好又是摸鱼的一节课。
# 斯塔克伯格博弈 (Stackelberg Game)
标准形式的斯塔克伯格博弈 (Stackelberg Game) 由两个玩家组成,记为 N={1,2}, 其中玩家 1 是领导者 (leader), 玩家 2 是跟随者 (follower). 两者的动作集分别为 Al 和 Af, 效用函数分别记作 ul(a),uf(a), 其中 a=(al,af). 该博弈过程如下:
- 领导者选择策略 sl 并将其告知跟随者;
- 跟随者选择对该策略的最优回应 af;
- 领导者根据 sl 选择动作 al, 最终领导者与跟随者同时做出动作。
# 势博弈
# 定义
给定一个正则形式博弈,若存在函数 Φ:A↦R, 使得对 ∀i,ai,ai′,a−i, 都满足
ui(ai,a−i)−ui(ai′,a−i)=Φ(ai,a−i)−Φ(ai′,a−i),
那么称该博弈为一个势博弈 (potential game), Φ 称为势函数 (potential function).
# 性质
任何有限势博弈一定存在一个纯策略纳什均衡。
# 拥塞博弈
拥塞博弈一般用于建模玩家之间争夺资源的问题。
一个拥塞博弈 是一个四元组 (N,R,A,c), 其中
- N 是玩家集合,∣N∣=n;
- R 是资源集合,∣R∣=r;
- Ai 是玩家 i 的行动集合,A=∏i=1nAi 是动作向量集合;
- c=(c1,c2,⋯,cn) 是所有资源的代价函数。
# 重复博弈
# 定义
重复博弈是某博弈重复若干轮所形成的博弈。
在重复博弈 GT 中,