星际 AI 争霸 6 年简史:通用人工智能角斗场,DeepMind确认应战(2)
2017-04-30 编辑:
AIIDE 星际争霸 AI 竞赛由加州大学圣克鲁斯分校 Expressive Intelligence Studio的 Ben Weber 在2010 年首次举办,作为 AIIDE(人工智能和互动数字娱乐,Artificial Intelligence and Interactive Digital Entertainment)大会的一部分。共有26名参赛者参加了四种不同的游戏模式,从简单的单场战斗到完整游戏。由于这是比赛第一年,并且几乎没有建立什么基础设施,每场比赛都是在两台笔记本电脑上手动运行,手动监控以记录结果。此外,没有持续的数据被保留用于让Bot 了解比赛对手。2010年的比赛有 4 种不同的比赛类别。比赛 1 是由四个独立单位参加的平地单位微型管理战。在六个竞争对手中,FreSCBot 赢得了比赛,Sherbrooke 排名第二。比赛 2 是另一个微观战斗,但不再是平地战。两个选手参加了这个类别,FreSCBot 再次击败 Sherbrooke。比赛 3 是在一个已知的地图上,没有雾。玩家只能选择神族,且不允许游戏单位迟入比赛。在这次双重淘汰赛中,8名Bot 对决,MimicBot 最后击败 Botnik 取得第一名。由于这是星际争霸的完美信息变体,MimicBot 采用了“模仿对手开发顺序,尽可能获得经济优势”的策略,这种策略效果非常好。
比赛4被认为是最主要的比赛,其中涉及星际争霸的完整游戏流程,并带有迷雾。该比赛以随机配对双重淘汰的方式进行。选手可以选择三个种族中的任意一个。唯一的限制是针对星际争霸社区认为是“欺骗”的手段。由于用 BWAPI 编写的计算机程序对他们可以向星际争霸游戏引擎发出的动作数量没有限制,某些行为是可能的,但这些行为并不是开发者的本意。比如移动建筑物和让地面单元翻过围墙,这些行为被认为是作弊,不允许在比赛中出现。 带有5个有名的专业极地图的地图池预先向选手公布,每场比赛会从中随机选择地图。比赛4最后由 Overmind 赢得——一个由加利福尼亚大学伯克利分校创建的虫族Bot,他们在决赛中击败了 Krasimir Krastev 的人族Bot Krasi0。
Overmind严重依赖使用强大和敏捷的虫族飞行单位 Mutalisk。 Overmind的总体策略包括虫族初级单位 Zergling 和 Sunken Colonies (静态防御塔)的初步防御,以保护其初步扩张,同时收集足够的资源建设其初始的Mutalisks。一旦构建了Mutalisk,就将它们送到敌方基地,并在敌方基地的周围巡逻和骚扰。如果Bot在最初的攻击中没有完全胜利,那么它会缓慢地巡逻,并且干掉任何没有防御的单位,最终将敌人控制在一点,直到最后灭掉敌人。第二名 krasi0发挥了人族的防御特长,构建了 Bunkers,Sige 坦克和 Missille 炮塔进行防御。建成一定数量的单位后,派出一批战斗单位围困敌方基地。这个Bot表现相当不错,只是在比赛中输给了 Overmind。关于 Overmind 的一篇很好的文章是由 Ars Technica 在2011年写的。还有一个人与机器的比赛,展现出一个职业人类玩家与顶级的 AI 的对决,可以在这里看到:
UAlbertaBot 的第一个版本始于 2010年 夏季,并于 2010年9月提交给 AIIDE 2010比赛。由 Alberta 大学自己领导的6名学生和迈克尔·布罗(Michael Buro)的一组人员使用BWAPI和“Brood War Standard Add-on Library”(BWSAL)构建了 UAlbertaBot 的初始版本,其中提供了建筑顺序、建筑布局以及工人管理这样的功能。 UAlbertaBot 的 2010版本选择了人族,其中一个主要战略是依赖于 Zerg Mutalisk 飞行单位。在Bot战斗和微观管理得到很好的实施的同时,Bot 早期游戏和建造规划中的几个主要的逻辑错误意味着其在2010年的竞争中的整体表现很弱,而在第三轮中被人族Botkrasi0 淘汰。 UAlbertaBot 的第一次实施受到了技术问题的困扰,所以比赛后决定,为明年的比赛完全重写Bot代码。
在AIIDE 2010比赛成功之后,有人试图将星际争霸AI竞赛作为计算智能游戏(CIG)会议的一部分。 由Johan Hagelback,Mike Preuss和Ben Weber主办的 2010年CIG赛事的比赛更像 AIIDE 2010比赛中的比赛3类似,但使用人族代替虫族。不幸的是,CIG第一年比赛遇到了几个严重的技术问题,这些问题源于决定使用定制的星际争霸地图,而不是传统的人工测试地图,这导致了Brood War Terrain Analysis(BWTA)软件为许多Bot发生了崩溃。由于事故频发,本次比赛决定不宣布胜利者。 UAlbertaBot 没有参赛,因为它正在被完全重写。
2011:所有参赛者必须提交其Bot的源代码
AIIDE 2011
2011年,AIIDE 比赛由 Alberta 大学主办,自那时起就一直如此,每年都由我和 Michael Buro 组织和运营。由于2010年 AIIDE 比赛的比赛1,2和3的参赛人数很少,因此决定 2011 年的 AIIDE 比赛将只包括星际争霸的完整游戏(与2010年比赛4的规则相同) ,没有更小的微型管理锦标赛。2011年的比赛规则也被更新,所有参赛者必须提交其Bot的源代码,并允许在比赛结束后发布,这是由于几个原因。一个原因是降低进入未来比赛的障碍——由于编程星际争霸 AI Bot非常耗时,未来的参赛者可以下载和修改以前Bot的源代码,以节省大量的精力。另一个原因是为了更容易地防止作弊——在比赛中玩数以千计场游戏,我们不能再看每场比赛来检测是否采用了任何作弊手段,通过检查源代码会更容易些。最后的原因是希望通过允许未来的Bot检查其源代码来借鉴以前的Bot的策略和技术,来帮助推进星际争霸中的最新技术——理想情况下,未来比赛中的所有Bot应至少与上一年参赛的Bot一样强大。 2011年比赛有 13 名参赛者。
2010年的比赛是 Ben Weber 在两台笔记本电脑上运行的,手动启动星际争霸游戏,手动创建并加入游戏,对体能需求相当高。一场简单的随机配对双重淘汰锦标赛共进行了大约60场比赛。这造成了一些负面的反馈,认为这种淘汰赛完全依赖于配对运气,所以在2011年的比赛中,我们开始消除比赛的所有随机性并采用循环赛制。循环赛制需要进行更多的比赛,所以在2011年夏天的几个月里,Jason Lorenz和我写了一个软件,可以将任意数量的本地联网计算机自动安排进入星际争霸的循环赛。该软件使用服务器/客户端架构与单个服务器调度游戏并存储结果,并且运行启动星际争霸游戏的客户端软件,自动监视游戏的进度并在完成时记录结果。客户端可以通过本地网络上的共享Windows文件夹访问Bot文件,重播比赛和查看最终结果,这对所有终端机都是可见的。该软件的初始版本允许在与2010年比赛的60场比赛相同的时间段内进行2340场比赛,每个Bot共玩30次。比赛中共有10张地图,从专业人类锦标赛中选出,并可在竞赛网站上提前几个月下载。 AIIDE比赛为了让一些专家和对手建模而在人类锦标赛上进行了模拟。