# 偏好

# 选择

对任意随机结果 $l_1, l_2$ , 以下三者有且仅有一个成立：
$l_1 \succ l_2, \; l_1 \prec l_2, \; l_1 \sim l_2$
传递性
连续性 (continuity): 若 $l_1<l_2<l_3$ , 则 $\exists p \in [0,1]$ 使得 $pl_1 + (1-p)l_3 \sim l_2$
独立性 (independence):

效用函数又称为冯・诺依曼 - 摩根斯坦定理 (utility function theorem)：
当玩家偏好满足完备性、传递性、连续性和独立性时，存在函数

$u: O \to \mathbb{R}$

满足

$l_1 \succ l_2 \iff u(l_1) > u(l_2).$

效用函数值之间的大小关系比较重要，但大小的具体值不重要。
对任意的冯・诺依曼 - 摩根斯坦效用函数 $u(o)$ 和常数 $a,b$ , 若 $a>0$ , 则仿射变换后的效用函数
$u'(o) = au(o) + b$
仍然是一个冯・诺依曼 - 摩根斯坦效用函数。

正则形式博弈 (normal-form game) 也称同时行动博弈 (simultaneous-move game) 或同时博弈 (simultaneous game), 可以用一个元组 $(N, A, u)$ 描述：

$N=\{1,2,\dots,n\}$ 是玩家 (player) 集合；
$A=\prod_{i=1}^nA_i$ 是所有玩家的动作向量集合，其中 $A_i$ 是玩家 $i$ 的动作 (action) 集合；
$u=(u_1,u_2, \dots, u_n)$ 是所有玩家的效用函数 (utility function) 向量，其中 $u_i: A \to \mathbb{R}$ 是玩家 $i$ 的效用函数。

在收益矩阵中，一般行玩家写在前，列玩家写在后面。

“同时” 的含义不是物理上的时间相同，而是在玩家选择动作时不会获得额外信息（例如其他玩家的选择）。

理性人假设：每个人都是理性的，即都希望最大化期望效用函数。
共同知识 (common knowledge) 假设：所有玩家都指导博弈的结构 $(N, A, u)$ , 所有玩家都知道所有玩家都知道博弈的结构 $(N, A, u)$ ……

策略 (strategy) 是选择动作的（随机）方式。若 $s_i(a_i)$ 是玩家 $i$ 选择动作 $a_i$ 的概率，则 $s_i(a_i)$ 满足：

$\sum_{a_i \in A_i} s_i(a_i) = 1.$

策略不同于动作，策略是动作的选择方式。

博弈中的解是一种均衡 (equilibrium), 即没有玩家愿意改变策略。

若所有人都不能再提升效用，则称为均衡状态。