查看原文
其他

谈谈区块链中的博弈论的运用(下)

世图科技 陈亮 世界图书出版公司北京公司 2023-02-15

最近在新闻里常常会听到“区块链”这个新名词。那什么是区块链呢?为什么称它为一个“去中心化系统”?博弈论在去中心化系统中起着极为关键的作用。



在之前的“谈谈区块链中的博弈论的运用(上)”的文章里我们已经说过,区块链是一种去中心化的数据库,没有中心化机构,在进行价值转移、信息传递的过程中,有一个共识机制去解决所有记账节点上的一致性和正确性问题。区块链是“无欺骗”的(更专业地讲,区块链机制信息为真的概率为1),就是因为整个共识机制处于一个纳什均衡点上。

 一个博弈系统的纳什均衡点通常都不会是一个最优的配置状态,有时甚至是一个最差的状态。在“你了解多少博弈论?从社会经济到人工智能,博弈论无处不在!(中)”那篇文章里我们举过一个著名的“囚徒困境”的例子来解释纳什均衡。

 


(▲警察逮捕了A、B两名嫌疑犯,警察向两人提供了相同的选择:

若一人认罪并作证检举对方,而对方保持沉默,此人立即获释,不主动认罪的另一方将判监20年;

若二人都保持沉默,则二人都判监1年;

若二人都互相检举对方,则二人都判监5年。)


从双方共同利益角度来看,两人均保持沉默是最优的选择。但两人提前不能互相交流,并不能保证对方不会检举自己,这就陷入了囚徒困境。从单方面自身利益出发,在对方保持沉默的情形下,选择检举对方能使自己的刑期从1年减为0年;在对方检举自己的情形下,选择检举对方也能使自己的刑期从20年减为5年。所以无论在哪种情况下,检举对方都能使自己的利益最大化,是优势策略(即无论其他参与者选择什么策略,这一策略对一个参与者个人来说都是最优的策略)。这就导致了“囚徒困境”唯一可能达到的均衡,就是双方都选择检举对方,结果是二人都被判监5年。

(▲约翰·纳什(John Nash)和维弗雷多·帕累托(Vilfredo Pareto))
“纳什均衡”(Nash Equilibrium)是不同个体分别追求自己利益最大化互相竞争的结果。而所有参与者进行团队合作的最优配置状态则叫作“帕累托最优”(Pareto Efficiency),在该状态下,无法进一步优化使得在不令某个个体的情况变得更糟的情况下使得另一个体的情况变得更好,也即,使一个个体变得更好的情况下一定会使至少另一个个体变得更糟。“囚徒困境”的纳什均衡点并不满足帕累托最优,显然在双方合作的情况下有办法可以使得两人的情况都变得更好。两人均保持沉默都只判1年的情况明显优于纳什均衡的结果——两人均检举对方都被判监5年。两人均保持沉默都只判1年的情况满足“帕累托最优”的条件。


我们再来看一下我们在“囚徒困境”同篇文章里提到过的“环保博弈”问题:
世界上有100个国家,每个国家在选择放任环境污染不管和积极治理环境污染中做选择。如果有一个国家选择放任污染,那么世界上每个国家的成本都+1;如果某个国家选择积极治理环境,那么其他国家的成本不变,它自己国家的成本需要+3。
如果一个国家从自身利益出发,选择放任污染(比如某国宣布退出巴黎气候协定),那它自己的成本只有1,其他国家的成本都是4。如果所有国家都这样想,大家都选择撂挑子,那么最后纳什均衡的结果就是每个国家的成本都是100,是一个最差的状态。相反,如果大家都积极治理,最后每个国家的成本都是3,所花的成本并不高,这种情况是一种帕累托最优状态。



那么在何种情况下纳什均衡(Nash Equilibrium)才能达到帕累托最优(Pareto Efficiency)呢?在传统博弈论中,需要三个条件。 一是对团体中的所有人实行额外奖惩制度,合作者奖励,非合作者惩戒。在这种情况下,参与者考虑的不仅仅是原来资源分配带来的利益得失,同时还需要考虑如果违背团体规则所带来的损失,当非合作的损失严重到一定程度时,自然合作会得到更大回报,那么大家会自然地选择合作。囚徒困境若引入这样的奖惩制度,双方不合作带来的回报将不再是最高,会低于合作行为所得到的回报,那样纳什均衡就会改变状态。在环保博弈中引入奖惩制度后也能改变纳什均衡的状态。 二是信息对称条件。在囚徒困境中,很大的一部分原因是警方隔绝了两个嫌犯的交流,在隔离状态下,人们更倾向于以最大恶意揣测他人,做出最后的判断。信息对称就是大家互相知道对方的选择,这是建立信任合作的基础。 三是重复博弈条件。经过不同回合的博弈,参与者会相互树立起各自博弈的形象。在多次博弈过程中,愿意吃亏、诚实守信的人会更容易被大家信任,在信任的基础上就会获得更多的与他人合作的机会。 然而,在现实生活中,信息对称条件和重复博弈条件很难实现,更多的情况下,人们很难获取对等的信息,重复博弈的机会也是屈指可数,所以博弈达成的结果往往是一种像“囚徒困境”和“环保博弈”产生的私利最优而社会福利最低的纳什均衡状态,帕累托最优配置并不容易实现。 区块链作为一个众多用户的博弈平台,链上交易的技术特点则为达到帕累托最优创造了先天性的条件。


区块链交易有以下特点:
一是交易信息的极难篡改性。这种机制不是由某种后天权限决定,而是区块链本身的设计如此,这就提升区块链信息的可信赖性。
二是交易权利的平等性。交易双方的交易权利是均等的,不存在实体交易中的某些交易地位差距。交易双方都可以分别自主制定自己的交易决策。
三是交易信息的共识性。交易的信息是交易双方,乃至其他潜在后续交易方都认可并的一种共识性信息。链上所有的交易过程共同遵守同样的共识机制。
四是交易信息的数据性。交易主体、交易媒介都是数字化的信息,具有极强的可读性和可识性。
五是交易信息的分布式。交易信息的存在是一种广播式的分布式存在,不依赖于某个中心化的组织——即这种信息是大家都会知道的公知性信息,这就使得抵赖可能性极低。
六是交易的高度可重复性。交易具有几乎无上限的可重复性,只要在链上,就可以进行交易,在数字化点对点交易形式下,交易成本急剧下降,交易将变得比传统更频繁和易重复。


下面我们来看下区块链交易的特点为何为实现帕累托最优提供了可行性。 首先,基于去中心化的分布式通信方式,使信息对称成为了可能。在区块链网络中,所有的个体都共享同样的数据库,所有的信息发布都以广播的形式出现,那么,不仅是交易双方享有对等的信息,而是所有的通信方都享有对等的信息。这就彻底改变了双方信息难以对称的局面,为双方共同决策创造了条件,决策更容易符合双方的共同利益。 其次,交易双方权利的平等性,使决策的自主性大大提升。经济学着重强调以自由决策的方式实现最优状态。然而现实生活中,完全自由的状态更是难以达到,通常由于社会地位的不平等性,导致交易的过程总有一方占据主导优势,使得结果更向优势方倾斜。而区块链改变了这种状态,创造了一个相对自由的环境,更容易以理性决策方式分析结果。在区块链技术的加持下,交易双方都拥有完整的交易数据,每个交易主体都可以根据各自掌握的信息自主的进行决策,几乎不存在交易权利的差异性。 三是数字化的交易方式提供了信任机制。区块链上的所有交易:交易主体和交易信息都是一种数据化的存在。在交易数据不可逆、数据信息不可抵赖等特性的加持下,交易过程拥有了一个更为纯粹的环境,交易双方也更容易信任对方。 四是通过共识性的经济激励,去实现系统目标。通过博弈论的分析我们知道,系统的目标和纳什均衡是一致的。以比特币为例,参与者通过投入算力参与到协作网络里面去获得比特币,而不是搞网络攻击,因为后者并不能为参与者带来更大利益,这是博弈形成的纳什均衡所决定的。 五是可重复的交易过程为重复博弈创造了条件。交易信息产生就意味着交换,前一次的交易为了后一次的交易做了铺垫,这种状况存在于所有的交易主体之间。每次交换信息都可以看作是重复博弈的进行,当次数不断积累,这就是在向帕累托最优趋近。


帕累托最优的三个条件虽然在传统环境中极难制造,但在区块链的技术变革下变得可能。区块链不仅仅是一种将经济学的机制设计理论与计算机科学中的分布式计算和密码学相结合的集成技术,更是一种去中心化、信息共享、共识性的新组织形式,其规则设计旨在依靠网络结构中众多节点之间的博弈,来实现更大范围和更深层次的复杂交易。区块链是一种能实现既定社会目标的信息分散决策机制,较之中心化机制,区块链机制具有两个优势:其一是资源配置的帕累托最优性;其二是激励相容,较好地解决了非对称信息导致的机会主义行为。所以说,区块链不仅是一场技术革命,同时,它也是一场思想革命。当所有人获得了平等的交易机会和自主决策权,那么利益就不会再继续向少数人倾斜,类似依靠现实社会中地位差异获取更多资源的状况将会更少出现。
(文中图片均来源自网络,侵删)
【相关链接】
谈谈区块链中的博弈论的运用(上)
谈谈区块链中的博弈论的运用(中)
你了解多少博弈论?从社会经济到人工智能,博弈论无处不在!(上)
你了解多少博弈论?从社会经济到人工智能,博弈论无处不在!(中)
你了解多少博弈论?从社会经济到人工智能,博弈论无处不在!(下)


【相关书籍】


(感兴趣的读者点击图片即可购买~)




世界图书出版公司推出的“世界博弈论经典”分为“经济与社会科学系列”和“计算与信息科学系列”两个子系列,这些经典名著的作者中有诺贝尔经济学奖得主让·梯若尔(Jean Tirole)和罗杰·迈尔森(Roger Myerson),以及呼声很高的诺贝尔奖候选人、“博弈论四君子”中的阿里尔·鲁宾斯坦(Ariel Rubinstein)和肯·宾默尔(Ken Binmore)等。 几十本经典名著即将来袭,敬请期待!


公号ID:wpcbj1986世 图 好 书

把世界介绍给中国

把中国介绍给世界

科技|人文|心理|外语|动漫


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存