# 贝叶斯博弈
相比于正则形式博弈,贝叶斯博弈信息不是完全的,即博弈双方不完全掌握所有玩家的效用函数。
# 定义
贝叶斯博弈 (Bayesian Game) 可以用一个四元组 (N,Θ,A,u) 表示,其中:
- N={1,2,…,n} 是玩家 (player) 集合;
- Θ 是所有玩家组成的类型向量集合。其中的每个元素 θ 是一个类型向量,向量各分量 θi 是玩家 i 的类型 (type). 玩家 i 的类型集合为 Θi;
- A=∏i=1nAi 是所有玩家的动作向量集合,其中 Ai 是玩家 i 的动作 (action) 集合;
- u=(u1,u2,…,un) 是所有玩家的效用函数 (utility function) 向量,ui:A×Θ→R 是玩家 i 的效用函数。
# 期望效用
# 事后期望效用
玩家 i 的事后期望效用 (ex-post expected utility) 定义为:
ui(s;θ)=a∈A∑s(a∣θ)ui(a;θ)=a∈A∑⎝⎛j∈N∏sj(aj∣θj)⎠⎞ui(a;θ).
# 事中期望效用
玩家 i 的事中期望效用 (interim expected utility) 定义为:
ui(s;Θ)=θ−i∈Θ−i∑⎣⎢⎡p(θ−i∣θi)a∈A∑⎝⎛j∈N∏sj(aj∣θj)⎠⎞ui(a;θ−i,θi)⎦⎥⎤=θ−i∈Θ−i∑[p(θ−i∣θi)ui(s;θ−i,θi)].
相比于事后期望效用,事中期望效用增加了对对手的类型分布猜测项 p(θ−i∣θi), 该猜测是基于玩家本身的策略得到的条件概率,因此称为事中期望效用。
# 事前期望效用
玩家 i 的事前期望效用 (ex-ante expected utility) 定义为:
ui(s;Θ)=θ∈Θ∑⎣⎢⎡p(θ)a∈A∑⎝⎛j∈N∏sj(aj∣θj)⎠⎞ui(a;θ)⎦⎥⎤=θi∈Θi∑p(θi)ui(s;θi)=θ∈Θ∑p(θ)ui(s;θ).
类似地,事前期望效用添加了 p(θi) 项作为对对手类型分布的猜测。
对于静态博弈,事前和事中期望效用实际上是相同的。
# 最优回应
玩家 i 对于其他玩家策略 s−i 的最优回应 (best response) 是
BRi(s−i)=si′argmaxui(si′,s−i).
# 贝叶斯纳什均衡
若所有玩家的策略组合 s∗ 满足
si∗∈BRi(s−i∗),∀i∈N,
则称 s∗ 为一个贝叶斯纳什均衡 (Bayesian Nash Equilibrium, BNE).
贝叶斯纳什均衡可以分别定义事前、事中及事后贝叶斯纳什均衡。一般的贝叶斯纳什均衡指事中贝叶斯纳什均衡。
# 存在性
只需要将贝叶斯博弈转化为正则博弈即可。构造正则博弈 G, 满足:
+