Frivolity: Attempts at Symmetry in Game#
关于对称性的类比尝试#
讨论的对象仍然是博弈。起因是我看到国自然基金的 Fundamental Research 发了一篇用群论研究博弈论当中对称性的文章[1],小吃一惊,原来已经有一少部分人关注这个想法了,于是连忙把自己许久以前想过的冷饭翻出来硬炒。
我将引入准则 \(C(G,\tau): \mathbb{S} \rightarrow 2^{\mathbb{S}}\),为一集值函数,以表示在给定某一策略下在某节点该参与者认可的最优策略集合(常见有 \((r)\)、\((rB)\) 等,具体前摇可参考我的 Game Theory 笔记)。其在策略空间 \(\mathbb{S}\) 上作用的稳定集 equilirium 即 \(\Pi_C=\{S\in \mathbb{S}|S\in C(G,\tau;S),\forall \tau \in \mathscr{T}\}\)。我们还可以对准则函数进行一系列变换,以方便各方面如对动态博弈的研究;常用的算子包括均衡算子 \(\Pi/\text{Eq}\)、上/下序贯算子(分别向下/上节点至支付/根节点取交集)\(\text{S}^\text{q}_iC(G,\tau)=\bigcup\limits_{\tau'\in\tilde{\tau},\rho(\tau')=i}C(G,\tau'),\text{S}_{\text{q}i}C(G,\tau)=\bigcup\limits_{\tau\in\tilde{\tau'},\rho(\tau')=i}C(G,\tau')\)、一致算子(严格序贯)\(\zeta_i=\text{S}^\text{q}_i \text{S}_{\text{q}i}, \zeta=\zeta_1\cdots\zeta_m\)、排除算子 \(\delta\)(剔去某些选择最优的可能性)、边缘算子 \(\partial\)(取像单纯复形的边界)。\(\zeta C\) 一定是序贯/一致准则。特别提及一致反应准则(总准则) \(\mathscr{R}C=\bigoplus\limits_{i\in\{1,\cdots,m\}}p_i\cdot\zeta C\)(\(p_i\) 为对参与者 \(i\) 策略子空间的投影),接下来的 \(C\) 均指总准则。依照其像的关系和操作我们还可称 \(C_1\subset C_2\) 若 \(\forall S, C_1(G,S)\subset C_2(G,S)\),即 \(C_1\) 是 \(C_2\) 的精炼;合并(且/或)准则 \(C_1\cup C_2\)、\(C_1\cap C_2\)(或写 \(C_1C_2\)),且有 \(\Pi_{C_1\cap C_2}=\Pi_{C_1}\cap \Pi_{C_2}\) 等;同胚准则 \(C_1(G_1)\cong C_2(G_2)\) 若 \(\exists \text{ homeo. }\phi :\mathbb{S}_1\rightarrow \mathbb{S}_2 \text{ s.t. }\forall S_1,\phi|_{C_1(G_1,S_1)}\text{ is a homeo. onto }C_2(G_2,\phi(S_1))\)。注意准则同样可被视为算子,作用于平凡算子 \((1)\) 上,\(rC\) 即表示对原本的 \(C\) 取符合纳什理性选择的交集。
众所周知,域扩张的 Galois 理论和覆叠空间有着良好的对应,这里同样希望类比使用这一成果,定义某准则 \(C\) 的策略空间 \(\Pi_c\)-自同构组成的群 \(\text{Aut}_C(\mathbb{S})\)(注意到 \(\sigma \Pi_C=\Pi_C\),均衡集为轨道类的集合),当 \(\text{Stab}(\text{Aut}_C)=\Pi_C\) 时称其为 Galois 准则/算子或正规算子 \(\psi\),记 \(\text{Gal}(C/1)\)。于是有这一对应:
\(C\) 为 Galois 准则,中间准则 \(\Pi_{C'}\supset \Pi_C\) 有 \(G_{C'}<G_C\);\(G_{C'}\triangleleft G_C\) 时 \(C\) 亦为 \(C'\) 的 Galois 精炼/收缩;\(C_1\triangleleft C_2,|\text{Gal}(C_1/C_2)|=[\Pi_{C_2}:\Pi_{C_1}]\)。
\(\text{Stab}\circ\text{Deck}=\text{id}\) 要求 \(C'\) 正规;\(\text{Deck}\circ\text{Stab}=\text{id}\) 鉴于连通空间下两个群作用有公共点可推出两者相同,故自动成立,而离散 \(\mathbb{S}\)(如只分析纯策略或玩家集合)还需要该子群满足一些“充分/完全”或者说“极大”的条件,即 \(H<G\curvearrowright X, \text{each group member } g\in G \text{ satisfying } g(x) \sim_H x, \forall x\in X \text{ is a membe of }H\)。(例如点阵的平移可以对每个点实现旋转的效果,但这个操作理应纳入子群中。)
FR 那篇 paper 的作者在前期研究[2]中定义了三类对称博弈,称作(逐步变广)ordinary symmetric games、renaming symmetric games (newly defined by the author)、name-irrelevant symmetric games(显然 \((r)\) 在某些博弈里是正规的,而另外一些不是)。
其文核心就是利用 “covering group”(但这个概念也不是他们提出的,而是由 Peleg et al. 的两篇博弈对称性研究率先使用[3])给出这几种对称在玩家和动作空间群作用的等价表示。(里面绝大部分证明都是非常 trivial 的工作)一方面这个工作的本质上面已经阐述过了,同时仅对玩家集合或各玩家行动空间的对称性研究可完全被上面对整个策略空间的讨论所包含。文中所展望的非完全信息在这里几乎没什么新鲜,借助序贯性等性质辅助在 \(\mathbb{S}\) 上讨论即可,如果需要关注先验自然手的行为则可以在 \(S_r\) 上展开。
接下来我给出一个 Nash 准则的基本分解定理:
即(\(\forall G,\exists G'\))理性准则总是剔除某些战略并分解为若干正规准则的边缘化。证明需要使用奇数定理,可能还有一些技术性的细节。此领域研究一个重要的逻辑本是众人认为对称性高的结果越容易形成;故以上或许对于我们理解完全理性的实现有所帮助。
这篇内容几乎不含有任何 substantial 的考察。