# 扩展形式博弈

在正则形式博弈和贝叶斯博弈中,所有玩家同时选择一个动作,随后博弈结束。而在扩展形式博弈中,玩家选择动作是具有先后顺序的。

# 博弈树

博弈树 (game tree) 是一种表示扩展形式博弈的工具,它是一个树(有向无环图),节点表示玩家和动作,边表示玩家选择动作的先后顺序。

# 完美信息扩展形式博弈

完美信息扩展形式博弈 (perfect information extensive form game) 包含:

  • NN 是玩家集合,N=n|N| = n.
  • AA所有玩家的动作集合(不是动作向量集合);
  • HH 是所有非叶子节点集合 (history);
  • ZZ 是叶子节点集合;
  • ρ:HN\rho: H \mapsto N 是玩家函数,指定某个节点应该由哪个玩家选择动作;
  • α:H2A\alpha: H \mapsto 2^A 是动作函数,指定某个节点的可行动作集合;
  • σ:H×AHZ\sigma: H \times A \mapsto H \cup Z 是后继节点函数;
  • u=(u1,u2,,un)u = (u_1, u_2, \cdots, u_n) 是收益函数,其中 ui:ZRu_i: Z \mapsto \mathbb{R}.

定义动作集合时,需要将不合法的动作集合去掉,例如围棋中双方落子不能在同一点。

# 完美信息与不完美信息

完美信息 (perfect information) 即每一玩家在做出任何决定时,都完全了解之前发生的所有事件,包括一个博弈的初始化事件。一个典型的例子是象棋。不完美信息 (imperfect information) 即某一玩家在做出任何决定时,不能完全了解之前发生的所有事件,例如打牌时不了解发牌信息。