# 偏好

# 选择

# 偏好公理

  • 对任意随机结果 l1,l2l_1, l_2, 以下三者有且仅有一个成立:

    l1l2,l1l2,l1l2l_1 \succ l_2, \; l_1 \prec l_2, \; l_1 \sim l_2

  • 传递性
  • 连续性 (continuity): 若 l1<l2<l3l_1<l_2<l_3, 则 p[0,1]\exists p \in [0,1] 使得 pl1+(1p)l3l2pl_1 + (1-p)l_3 \sim l_2
  • 独立性 (independence):

# 效用函数

效用函数又称为冯・诺依曼 - 摩根斯坦定理 (utility function theorem):
当玩家偏好满足完备性、传递性、连续性和独立性时,存在函数

u:ORu: O \to \mathbb{R}

满足

l1l2u(l1)>u(l2).l_1 \succ l_2 \iff u(l_1) > u(l_2).

  1. 效用函数值之间的大小关系比较重要,但大小的具体值不重要。
  2. 对任意的冯・诺依曼 - 摩根斯坦效用函数 u(o)u(o) 和常数 a,ba,b, 若 a>0a>0, 则仿射变换后的效用函数

    u(o)=au(o)+bu'(o) = au(o) + b

    仍然是一个冯・诺依曼 - 摩根斯坦效用函数。

# 正则形式博弈

正则形式博弈 (normal-form game) 也称同时行动博弈 (simultaneous-move game) 或同时博弈 (simultaneous game), 可以用一个元组 (N,A,u)(N, A, u) 描述:

  • N={1,2,,n}N=\{1,2,\dots,n\} 是玩家 (player) 集合;
  • A=i=1nAiA=\prod_{i=1}^nA_i 是所有玩家的动作向量集合,其中 AiA_i 是玩家 ii 的动作 (action) 集合;
  • u=(u1,u2,,un)u=(u_1,u_2, \dots, u_n) 是所有玩家的效用函数 (utility function) 向量,其中 ui:ARu_i: A \to \mathbb{R} 是玩家 ii 的效用函数。

在收益矩阵中,一般行玩家写在前,列玩家写在后面。

“同时” 的含义不是物理上的时间相同,而是在玩家选择动作时不会获得额外信息(例如其他玩家的选择)。

# 基本假设

  1. 理性人假设:每个人都是理性的,即都希望最大化期望效用函数。
  2. 共同知识 (common knowledge) 假设:所有玩家都指导博弈的结构 (N,A,u)(N, A, u), 所有玩家都知道所有玩家都知道博弈的结构 (N,A,u)(N, A, u) ……

# 策略

策略 (strategy) 是选择动作的(随机)方式。若 si(ai)s_i(a_i) 是玩家 ii 选择动作 aia_i 的概率,则 si(ai)s_i(a_i) 满足:

aiAisi(ai)=1.\sum_{a_i \in A_i} s_i(a_i) = 1.

策略不同于动作,策略是动作的选择方式。

# 纯策略和混合策略

# 常用符号

  • sis_{-i}: 除玩家 ii 以外的其他玩家的策略组合。
  • Δ(X)\Delta(X)
  • supp()\mathrm{supp}()

# 解概念与均衡

博弈中的解是一种均衡 (equilibrium), 即没有玩家愿意改变策略。

# 纳什均衡

若所有人都不能再提升效用,则称为均衡状态。