B-29 博弈论的应用

利用最优反应曲线求解策略式博弈中纯纳什均衡/混合纳什均衡

古诺模型（见寡头垄断）
策略式博弈
- 对于一个双人策略式博弈，行参与人的可能选择为 $r_1,r_2,\cdots,r_R$，列参与人的可能选择为 $c_1,c_2,\cdots,c_C$，对行参与人的每个选择 $r$，列参与人的可能选择，列参与人的最优反应表示为 $b_c(r)$，同理也有行参与人的 $b_r(c)$。
- 若策略组合 $(r^,c^)$ 满足 $\red{c^* = b_c(r^)}$ 和 $\red{r^ = b_r(c^)}$，则 $(r^,c^*)$ 是一个纳什均衡。

例 29.1：利用最优反应曲线求出给定收益矩阵（表 29.1）的纳什均衡解。
1. 设参与人 $i\,(i=R,C)$ 选择策略 $j\,(j=L,U)$ 的概率 $\pi_{i,j}$（可能是纯纳什均衡，也可能是混合纳什均衡）
2. 分别用概率 $\pi_{i,j}$ 写出行参与人和列参与人的期望收益 $\pi^{e}_R$ 和 $\pi^{e}_C$
3. 基于最大化期望收益的目的，写出每个参与人的最优反应函数 $\pi_L = \pi_L(\pi_U)$、$\pi_U = \pi_U(\pi_L)$；函数值可以是一个 $[0,1]$ 里的数，也可以是一个区间 $[0,1]$。可使用分段函数表示。
4. 根据最优反应曲线的交点得到纯纳什均衡或混合纳什均衡解

子博弈精炼纳什均衡（有点没搞懂）

基本概念

子博弈：拓展式博弈中从某个单结开始的包括所有后续结的能够自成博弈的一个拓展式博弈。
- 一个子博弈必须从一个单结信息集开始，即在该结做决策的博弈参与人确切地知道自己的决策集；子博弈是源于原拓展式博弈的一个博弈，所以信息和收益和原拓展式博弈一样。
  - 如果信息集有 2 个以上的决策集（即非单结信息集），则无法作为初始结。
- 根据定义不同，如果认为从原博弈的起始结开始也算，原博弈本身也是子博弈。
- 子博弈中不一定有所有原博弈参与人都进行决策。
子博弈精炼纳什均衡是这样一个策略组合：1. 是原博弈的纳什均衡；2. 在原博弈的每个子博弈里也是纳什均衡

利用最优反应曲线分析协调博弈（合作博弈）

利用最优反应曲线可以分析协调博弈这一类博弈类型。（等收益原则不一定能解出来）

当博弈参与人能够协调他们之间的策略时，他们的收益会实现最大化。现实中需要建立使得参与人能够协调的机制。

性别战

男朋友 \ 女朋友	武打片	爱情片
武打片	2, 1	0, 0
爱情片	0, 0	1, 2

根据最优反应曲线可解出三个纳什均衡。

博弈的聚点（focal point）：所有参与人都有理由相信某个均衡会发生

囚徒困境

囚徒 A \ 囚徒 B	坦白	不坦白
坦白	-3, -3	0, -6
不坦白	-6, 0	-1, -1

坦白都是不坦白的占优策略，协调对双方是更优选择，但又不是均衡解，有偏离动机。