“在足球场上,对手的出现使得一切变得复杂起来。”法国哲学家让-保罗·萨特(Jean-Paul Sartre)的这句话适用于多个领域,无论是团体项目的战术策略,还是微观经济学中的弈论模型,亦或是大规模爆发的机器人之战。
对手的出现让一切都变得不同了:在相互对抗的局面下,再细致的准备都有被打乱阵脚的可能。
以上结论在多个领域其实都是适用的。无论是战术策略的制定,还是绘制施工蓝图,中途一旦遇上未知的境况(例如对手重新调整的策略,或是自然灾害等不可抗力),无论之前的准备是多么细致入微,考虑的是多么周全,都有可能全部土崩瓦解。
因此,让一个复杂系统具有应对突变情况的能力有多重实现方法,其中一个可行的思路是赋予系统的每个组件以自适应能力,即让每个组件都能进行自我调整以应对突发状况。
而这么做的缺点也显而易见,被孤立看待的每个组成部分都只会分析各自的行为模式,但这样的分析是很难判断整个系统的动向的。
那么能否找到方法,来预测不可知的突发状况?这是研究复杂系统的科学家在设计系统抗干扰性和抗打击性时所面临的核心问题。
最早提出复杂系统这一概念的,是美国学者霍兰。他提出“适应性造就复杂性”,并于1994年引入了复杂适应性系统(CAS:complex adaptive system)的概念。
复杂性系统的研究方法有别于传统的理论研究,以计算机仿真作为主要研究工具。其主要特点有:
自适应性/自组织性 (
self-adaptative/self-organization)
复杂系统能够通过不断学习,调整自身的结构和行为,以适应外部和内部的变化。
而且各组件之间,以及组件与环境之间会发生各种交互作用。正是这种自主性和复杂性,使得复杂系统具备了不断演化的动力。
演化能力 (evolution)
复杂系统由简单元素组合,通过对外界环境和状态的预期—适应—自组织过程,经过不断演化,实现了从功能到结构的升级。
人工智能的演化
足球比赛就是一个演示复杂系统的很好的模型。机器人世界杯(RoboCup),顾名思义,是机器人的世界杯。这一比赛即将迎来20周年纪念日,最近的赛事吸引了来自超过45个国家的逾40,000选手和观众。
该赛事同时也是人工智能,机器人研发,以及多智能主体复杂系统(multi-agentcomplex systems)发展的的风向标。
2016年德国莱比锡机器人世界杯2D仿真组总决赛,2016年7月3日,红队是来自悉尼大学&CSIFO组成的澳大利亚队Gliders2016,黄队是来自福冈大学和大阪府立大学组成的日本队HELIOS2016
一边是实体组(physical robot leagues)战得如火如荼叫好叫座,另一边仿真组(simulation league)则将精力集中在AI的升级迭代上。
比赛图片,图片来源
www.robocupeuropeanopen
在仿真组的比赛中,两只球队的各11名“队员”均为程序自主控制,驰骋在一个二维的虚拟球场上,整个过程中“球员”无人工操作。 20多年来,机器人世界杯社区为选手们提供开源模拟器以及可视化软件,共计近百万行代码。
每个虚拟“球员”都具备虚拟的全方位视觉,听觉以及触觉,能够“感知”周遭发生的一切。与此同时,每一位“球员”还具备基本的行动能力,如跑动,转身,踢球。
最大的挑战是,如何推演出可行的最佳策略,来应付对手突如其来的干扰性动作。
每走一步耗时十分之一秒,在此期间,所有的感官马达全权负责一个“球员”的信息链,将接受到的新的环境信息进行处理,在约100,000个选项之中权衡利弊,然后将敲定的指令传达给该“球员”。
“球员”思路示意图,图片来源:robotica2015.utad.pt
2016年7月,来自澳大利亚的Gliders2016荣获冠军,这是悉尼大学Mikhail Prokopenko教授以及Victor Jauregui教授,联合CSIFO的Peter Wang, Oliver Obst教授通力合作的成果。
Gliders2016荣获2016年7月在德国莱比锡举办的2016机器人世界杯冠军
为了最大化的提升球队的实力,科学家使用了基于人类演化的计算策略。以迭代的方式进行创新,展开测试,检验场上动作,提高比赛表现。
若干个超级计算机群每天执行成千上万次的路径演算,用以检测评估“球员”的实力。
路径总数接近一千万。
高屋建瓴
在测试中,不仅需要考察每个“球员”的实力,评估整个“球队”的表现,还需要高屋建瓴地进行战略考量。
从研究对手战术的复杂程度着手,考察我方“队员”的场上灵活性,战术延展性以及战略适应性。
与此同时,还要考虑到对手接下来有可能走出的奇招怪局,以及我方“队员”是否能够在局势不利的情况下力挽狂澜。
来自澳大利亚的Gliders2016球队的一记决胜进球
前文所述,牵涉到复杂系统的一般性问题。因此必须考虑到初始条件的细微变化,诸如传球中的“冒险系数”的增加对比赛结果的影响。
另一个研究重点集中在,系统在运行过程中,是否会倾向于重复的特定轨迹,及随机算法的效用。因此,必须考虑模拟器中隐藏变量的建模。
一言以蔽之,就是在复杂系统下,一个冠军队伍所必需具备的素质。
来自大自然的启示
自然界的鱼群和鸟群如何躲避捕食者体现了生物群落的复杂性。科研团队从观察中获取灵感,并将灵感应用在战术中。
鱼群,图片来源 geek
面对捕食者,鱼群迅速形成复杂的空间聚合,如此一来,即便是小小的扰动也能以极快的速度传遍整个群体,传达性命攸关的警示。
回到机器人世界杯上。同样的道理,场上的“球员”能够在以很高的连贯性“跑动”的同时,根据场上情况不断调整自身位置,以便策应队友/堵截对手。而且,这样的移动不是突然的、毫无预示的,而是连贯的,协调的。
针对不同对手,需要不同的战术。行动路径越复杂,“球队”的作战能力以及防御能力越强。
借助信息理论,定量和预测系统中的“信息流”而不是“数据流”,来评估“球队”场上表现。不同于“数据流”,信息流突出了相关性和可行性最高的动作。
机器人世界杯的复杂性会随着时间的推移而增加,比赛将面临新的挑战,解决新的问题,科技也会不断进步。
机器人世界杯第二个二十年的旅程,将会由全新一代的科学家来主导。
到那时,复杂系统作为一块研究领域,很可能主导全球的教育,会结合信息科技的新元素,以及物理,生物,和数学,引领未来的工程,科学和商业人才。
参考:
[1]How we evolved a winning strategy for the RoboCup competition by imitating natureMikhail Prokopenko,University of Sydney
[2]Holland J. Adaptation inNatural and Artificial Systems [M]. Cambridge, MA, USA: MIT Press, 1992
[3]刘晓平, 唐益明, 郑利平. 复杂系统与复杂系统仿真研究综述[J]. 系统仿真学报, 2008(23):6303-6315.