# 策略式博弈

我们称一个策略式博弈 (strategic form games)(或称标准式博弈 (normal form games))是一个三元组 (I,S,u)(\mathcal{I}, S, u). 其中:

  • 参与人集合 (the set of players) I{1,2,,I}\mathcal{I} \coloneqq \{1,2,\dots, I\} 是一个有限集。
  • 对每个参与人 iIi \in \mathcal{I}, 其纯策略空间 (pure-strategy space) SiSS_i \in S.
  • 对每个参与人 iIi \in \mathcal{I}, 其收益函数 (payoff function) uiu_i. 其中,ui(s)u_i(s) 是定义在策略组合 s=(s1,,sI)s = (s_1, \dots, s_I) 上的效用 (utility) 函数,参数为 ii.
  1. 为方便,我们简记某参与人 ii 之外的所有其他参与人为 i-i, 即参与人 ii 的 “对手”。
  2. 定义中的策略形式宽泛。实际上,我们只关注不同策略带来的效用函数变化情况,而不关心策略本身的实现方式。
  3. 效用函数也可以采用更一般的偏好关系定义。

# 双人零和博弈

根据上述形式化定义,一个双人零和博弈 (two-player zero-sum game) 是一个满足 i=12ui(s)=0\sum_{i=1}^2u_i(s) = 0 的博弈。

# 纯策略和混合策略

# 纳什均衡

纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。其形式化定义如下:

对混合策略组合 σ\sigma^*, 若对 iI\forall i \in \mathcal{I}

ui(σi,σi)ui(si,σi),siSiu_i(\sigma_i^*, \sigma_{-i}^*) \geq u_i(s_i, \sigma_{-i}^*), \quad s_i \in S_i

那么称该混合策略组合 σ\sigma^* 是一个纳什均衡。