# 偏好
# 选择
# 偏好公理
- 对任意随机结果 , 以下三者有且仅有一个成立:
- 传递性
- 连续性 (continuity): 若 , 则 使得
- 独立性 (independence):
# 效用函数
效用函数又称为冯・诺依曼 - 摩根斯坦定理 (utility function theorem):
当玩家偏好满足完备性、传递性、连续性和独立性时,存在函数
满足
- 效用函数值之间的大小关系比较重要,但大小的具体值不重要。
- 对任意的冯・诺依曼 - 摩根斯坦效用函数 和常数 , 若 , 则仿射变换后的效用函数
仍然是一个冯・诺依曼 - 摩根斯坦效用函数。
# 正则形式博弈
正则形式博弈 (normal-form game) 也称同时行动博弈 (simultaneous-move game) 或同时博弈 (simultaneous game), 可以用一个元组 描述:
- 是玩家 (player) 集合;
- 是所有玩家的动作向量集合,其中 是玩家 的动作 (action) 集合;
- 是所有玩家的效用函数 (utility function) 向量,其中 是玩家 的效用函数。
在收益矩阵中,一般行玩家写在前,列玩家写在后面。
“同时” 的含义不是物理上的时间相同,而是在玩家选择动作时不会获得额外信息(例如其他玩家的选择)。
# 基本假设
- 理性人假设:每个人都是理性的,即都希望最大化期望效用函数。
- 共同知识 (common knowledge) 假设:所有玩家都指导博弈的结构 , 所有玩家都知道所有玩家都知道博弈的结构 ……
# 策略
策略 (strategy) 是选择动作的(随机)方式。若 是玩家 选择动作 的概率,则 满足:
策略不同于动作,策略是动作的选择方式。
# 纯策略和混合策略
# 常用符号
- : 除玩家 以外的其他玩家的策略组合。
# 解概念与均衡
博弈中的解是一种均衡 (equilibrium), 即没有玩家愿意改变策略。
# 纳什均衡
若所有人都不能再提升效用,则称为均衡状态。