# 贝叶斯博弈

相比于正则形式博弈,贝叶斯博弈信息不是完全的,即博弈双方不完全掌握所有玩家的效用函数。

# 定义

贝叶斯博弈 (Bayesian Game) 可以用一个四元组 (N,Θ,A,u)(N, \Theta, A, u) 表示,其中:

  • N={1,2,,n}N=\{1,2,\dots,n\} 是玩家 (player) 集合;
  • Θ\Theta 是所有玩家组成的类型向量集合。其中的每个元素 θ\theta 是一个类型向量,向量各分量 θi\theta_i 是玩家 ii类型 (type). 玩家 ii 的类型集合为 Θi\Theta_i
  • A=i=1nAiA=\prod_{i=1}^nA_i 是所有玩家的动作向量集合,其中 AiA_i 是玩家 ii 的动作 (action) 集合;
  • u=(u1,u2,,un)u=(u_1,u_2, \dots, u_n) 是所有玩家的效用函数 (utility function) 向量,ui:A×ΘRu_i: A \times \Theta \to \mathbb{R} 是玩家 ii 的效用函数。

# 期望效用

# 事后期望效用

玩家 ii事后期望效用 (ex-post expected utility) 定义为:

ui(s;θ)=aAs(aθ)ui(a;θ)=aA(jNsj(ajθj))ui(a;θ).u_i (s;\theta) = \sum_{a \in A} s(a|\theta)u_i(a; \theta) = \sum_{a \in A} \left(\prod_{j \in N} s_j(a_j | \theta_j)\right) u_i(a; \theta).

# 事中期望效用

玩家 ii事中期望效用 (interim expected utility) 定义为:

ui(s;Θ)=θiΘi[p(θiθi)aA(jNsj(ajθj))ui(a;θi,θi)]=θiΘi[p(θiθi)ui(s;θi,θi)].\begin{aligned} u_i (s;\Theta) & = \sum_{\theta_{-i} \in \Theta_{-i}} \left[p(\theta_{-i} | \theta_i) \sum_{a \in A} \left(\prod_{j \in N} s_j(a_j|\theta_j)\right) u_i(a; \theta_{-i}, \theta_i)\right] \\ & = \sum_{\theta_{-i} \in \Theta_{-i}} \left[p(\theta_{-i} | \theta_i) u_i(s; \theta_{-i}, \theta_i)\right]. \end{aligned}

相比于事后期望效用,事中期望效用增加了对对手的类型分布猜测项 p(θiθi)p(\theta_{-i} | \theta_i), 该猜测是基于玩家本身的策略得到的条件概率,因此称为事中期望效用

# 事前期望效用

玩家 ii事前期望效用 (ex-ante expected utility) 定义为:

ui(s;Θ)=θΘ[p(θ)aA(jNsj(ajθj))ui(a;θ)]=θiΘip(θi)ui(s;θi)=θΘp(θ)ui(s;θ).\begin{aligned} u_i (s; \Theta) & = \sum_{\theta \in \Theta} \left[p(\theta) \sum_{a \in A} \left(\prod_{j \in N} s_j(a_j|\theta_j)\right) u_i(a; \theta) \right]\\ & = \sum_{\theta_i \in \Theta_i} p(\theta_i) u_i(s; \theta_i) \\ & = \sum_{\theta \in \Theta} p(\theta) u_i(s; \theta). \end{aligned}

类似地,事前期望效用添加了 p(θi)p(\theta_i) 项作为对对手类型分布的猜测。

对于静态博弈,事前和事中期望效用实际上是相同的。

# 最优回应

玩家 ii 对于其他玩家策略 sis_{-i}最优回应 (best response) 是

BRi(si)=arg maxsiui(si,si).\mathrm{BR}_i(s_{-i}) = \argmax_{s_i'} u_i(s_i', s_{-i}).

# 贝叶斯纳什均衡

若所有玩家的策略组合 ss^* 满足

siBRi(si),iN,s_i^* \in \mathrm{BR}_i(s_{-i}^*), \quad \forall i \in N,

则称 ss^* 为一个贝叶斯纳什均衡 (Bayesian Nash Equilibrium, BNE).

贝叶斯纳什均衡可以分别定义事前、事中及事后贝叶斯纳什均衡。一般的贝叶斯纳什均衡指事中贝叶斯纳什均衡。

# 存在性

只需要将贝叶斯博弈转化为正则博弈即可。构造正则博弈 GG, 满足:
+