第6讲不完美信息博弈与不完全信息博弈

在这一节，我们简单了解“不完美信息博弈(imperfect information games)”和“不完全信息博弈(incomplete information games)”，两者又都叫做“非对称信息博弈(asymmetric information games)”。博弈中的非对称信息，是指某些参与人拥有但另外一些参与人不拥有的信息。

1. 不完美信息博弈

完全没有任何理由理你——不完美信息

每个参与人的每个信息集都是单结点信息集的博弈，就是“完美信息博弈(perfect information games)”。与此相对，我们有“不完美信息博弈(imperfect information games)”的概念：至少部分参与人的部分信息集是多节点信息集的博弈。

换言之，在一个博弈中，如果当轮到一名参与人做出选择时，他不知道自己正处于其信息集之中的哪一个节点上，则称其信息是不完美的。

显然，在现实世界的各种博弈中，不完美信息是常见的。

——所谓“信念”

在分析不完美信息博弈及其均衡时，“信念(belief)”是一个基本的概念。

在轮到一名参与人做出选择时，即使他不知道自己正处于其信息集之中的哪一个节点上，他也必定对此拥有某种“信念”：即自己正以何种概率分布位于该信息集之中的各个节点之上。

提出“信念”这一概念，既是为了分析不完美信息博弈的方便，也是合乎逻辑的：即使没有完美的相关信息(实际情况往往如此)，当事人也要做出决策——这种情况下当事人的决策是任意的吗？

当然不是，他必定会对所有与其决策相关的信息做出“猜测”，其猜测的结果，就是其“信念”。

所以，我们也可以将“信念”解释为某人为将自己的行为“合理化”而到的“理由”。

*********************************************************************************** ——信念：使行为“合理”

在博弈论所设定的纯粹(理性) 框架下，参与人任何信念的形成必须有着合理的基础。在理论上，知识(信息) 决定着信念，信念决定着选择。

但是，在现实中情况似乎常常正好相反。人们在决定将要采取任何一种行动时，总是会为自己寻一个“理由”——无论通过什么办法或者基于什么理由，他往往会“成功地”在作出决定时形成一种信念，使得自己打算采取的行动是“合理的”。

换句话说，人们往往能够想到办法合理化(justify) 自己的行为——“欲盗铃，故掩耳”——显然无效的掩饰，也可以成为人们的“信念”，原因是人们的无知？不是——原因是人们欲进行某事。

这里有什么违背理性的吗？如果认为错误“信念”的形成，是由于人们缺乏信息与知识，那么即使是“错误”，实际上也已经是所能实现的最准确判断；如果认为错误“信念”的形成是基于某种故意，这也许只是证明在这种故意的背后，潜藏着另外一个偏好序…

聪明的你，请选择：是对自己显示真实的偏好，还是使自己形成错误的“信念”？——“聪明”之害

人们常说：“一个人做一件事，一定有他的‘理由’”——这是当然的，任何人在要做任何事之前，其内心的想法绝不会是“我要去做一件多么‘愚蠢’或者‘丑陋’的事”，相反，他必定有其“理由”：“这件事或许会被一些人认为‘愚蠢’或者‘丑陋’，但是，…”。

问题是，这个“理由”从何而来，无论是放诸众人之面前，亦或是放诸当事者之内心，这是不是能够一个真实的理由？

这就是“聪明”之害：人们做不应该做的事(这里，我们暂时不去讨论什么是‘不应该做的事’)，如果是由于他们不知道应该做什么，那么只需将事实(真相和知识) 告知——实际上，这一点从来就不是困难的；然而，如果人们做不应该做的事，是因为他们的“聪明”，使其能够“成功地意识不到”自己实际上意识到了的

东西，告知又意味着什么呢？——困难的，不是让一个人知道什么，而是让一个已经知道了什么的人承认自己已经知道了什么。

注意：“聪明”不同于理性，“聪明”之害，也并非理性之害。

*********************************************************************************** 2. 不完全信息博弈

——不完全信息

博弈论中所谓的“不完全信息(incomplete information games)”，是指参与人不能确定其他参与人的支付函数(偏好) 和战略空间(在各个阶段可以采取的行动)。

不能确定其他参与人的战略空间，可以等价于不能确定其他参与人的支付函数。不能确定其他参与人的支付函数，也称作不能确定其他参与人的“类型(type)”。

——不完全信息与不完美信息

Harsanyi (1968) 证明：给定若干条件，可以将不完全信息转换为不完美信息。

例如，考虑飞行员-劫机者博弈：假设劫机者有两种可能的类型(或者说，劫机者实际上的类型是给定的，但是飞行员不能确定劫机者的类型) ——“怕死的”和“不怕死的”：

-——那么不妨引入一个在原假设劫机者属于前者的概率是p，劫机者属于后者的概率是1p

博弈所有参与人行动之前行动的“新的参与人”，一般称之为“自然(nature) (也就是说实话博弈

-将中的‘game master’)”，它(自然) 以概率p将劫机者“选择成‘怕死的’类型”，以概率1p

劫机者“选择成‘不怕死的’类型”：

如何理解在博弈中增加的这一个参与人“自然”？

(i) 对于博弈中不了解其它参与人类型信息的一方而言，只能将其它参与人类型当作服从某种由自然决定的分布；

(ii) “自然”作为博弈的一个参与人，严格说来也应该为其规定支付，我们假设“自然”不关心博弈的任何结果，因此只需将“自然”在任何一个结果下获得支付规定为一个任意的常数；

(iii) “自然”的策略，(),1p p -，是先验给定的。

不完美信息的实质，是博弈的参与人不知道其对手做了什么；不完全信息的实质，是博弈的参与人不知道其对手是谁。如果将“自然”也当作是博弈的对手之一，那么两者就没有区别。

基于Harsanyi 的证明，在考虑不完全信息博弈时，我们一般先引入“自然”，将其转换为一个不完美信息博弈，再进行分析。

3. 不完美信息博弈与“声誉”

—— 所谓“声誉”：再看合作解

在此前完美且完全信息的框架下，我们证明：如果阶段博弈的占优策略均衡是“不合作，不合作”，那么这一阶段博弈重复任意有限次的重复博弈，都只可能得到在各期都不合作的SPNE 解。

但是，现实中的任何博弈恐怕都只会重复有限次——那么，合作真的无法出现？亦或如果出现了合作解，应当如何解释？实际上，Axelrod (1981) 实验确实表明：即使在有限次博弈中，合作行为也频繁出现。

问题出在哪里？

一个直觉来自于现实之中的谈判。如果信息是完全的，谈判一开始就达成协议，但现实中的谈判不是这样，为什么？——原因很可能在于信息不对称：如果参与人对其他参与人的效用函数和战略空间的信息不完全，即使博弈重复的次数是有限的，人们也有积极性建立一个合作的“声誉”，合作有可能会出现。

博弈论之中的所谓“声誉(reputation)”，是指先行动的参与人通过其前期的选择，向后期行动的参与人传递关于自身类型的信息。

——声誉：一个例子

假定有两个参与人，A和B，进行如下的囚徒困境博弈：

假设参与人B一定是理性的，参与人A有两种可能的类型：(i) “非理性”型——在第一期采取“合作”，之后各期(if any)采取“以牙还牙(tit-for-tat, TFT)”策略——概率为p；(ii)“理

。

性”型——根据自身的最大化，可以选择任何战略——概率为1p

如何理解参与人A的“非理性”？这里的“非理性”型只是一种提法，代表参与人A可能是有着不同支付函数(偏好) 的人(例如：讲情义重义气的) ——“非理性”型的参与人A实际上仍然是理性的。

如果上述博弈只进行一次，那么结论是显然的：(i) 如果是理性的A遇到(理性的) B，那么双方都采取“不合作”是一个占优策略均衡；(ii) 如果是“非理性”的A遇到(理性的) B，A将采取“合作”，B将采取“不合作”。

第6讲不完美信息博弈与不完全信息博弈

发布评论取消回复

最近发表

热门文章

标签列表

第6讲 不完美信息博弈与不完全信息博弈

发布评论取消回复

最近发表

热门文章

标签列表

第6讲不完美信息博弈与不完全信息博弈