社区一直对OpenAI存在误解,他们都觉得OpenAI是专门用来打Dota的。其实并不是这样的,Dota只是OpenAI的开发者用来测试他们的算法到底能不能学习解决问题的工具。事实证明,他们的算法非常棒。
有意思的是,在规则上受到限制的情况下,OpenAI将过去十多年Dota2玩家的技战术糅合到了一起。中路走一个、边路走两三个、控符……这些事情都是人类在打Dota时一直做的。OpenAI打比赛看起来真的和正常比赛没什么区别。
当然,OpenAI把协作、集火、宏观决策等很多问题分成了十一类,这看起来非常牛掰,同时这也是人类遥不可及的事情。OpenAI在一些其他事情上,做法也和人类不同。这些事情有可能会让Dota2的选手们产生全新的理解。
前期对线
人类玩家在打Dota的时候往往会选择固定分路。他们在分路之后希望能够对上想对的对手,如果对不上,顶多也就换个一次,然后开始补刀、换补给……OpenAI并不认同这个做法。
回看对阵OG的两局比赛,我们能很清晰的看到AI为了获得对线优势,经常换路、游走。对于人类而言,一些英雄往往会在到达3级之后开始游走,这些英雄往往都是辅助,但是对于AI而言,他们并不管游走的是辅助还是核心,他们只想要游走的成功率。
从理论上说,这种方式是行得通的。如果你让一个英雄离开双人路,那么你们会有一个英雄单吃经验,你在经验上并没有损失。而游走杀掉一个敌人的收益又远远高于一本TP的价格。在一次成功的Gank之后,你可以选择让另外的一两个英雄迅速在别的区域发起一次Gank。
很显然,人类在这方面有所缺陷,因为他们没办法精确地计算出游走的成功率,也没办法完美的权衡游走还是不游走。但是我们也在2015看到过CDEC的明星选手Agressif有过和OpenAI类似的做法。Agressif的代表性英雄是飞机,他在操刀飞机的时候会不停的游走打架,将英雄的特性发挥到极致。Agressif的打法在那时收效显著,没有人能靠运气打进TI决赛。
经济分配
在对线期不停游走、换线使得OpenAI队的英雄经济、经验远比我们所熟悉的更平均。但是他们的经济、经验总量要远比人类队高。
遗憾的是,游戏的OB并没有向观众展示OpenAI前期的经验优势,他们只是单独的看了等级,而OpenAI似乎总是领先。OpenAI并没有牺牲任何一名辅助,让一个英雄在十分钟经的时候只有三级,而且没有鞋子。他们更喜欢让五名英雄都具备一定战斗力。
在Dota中存在着一种“围绕着一个英雄打”的概念。当前版本职业队伍一般会选择两个能够带着辅助扫图的节奏型英雄。OpenAI则让每一个英雄都能够在前15-20分钟成为团队运行的核心。
随着游戏时间的推移,OpenAI也有了资源倾向,一些更吃经济的英雄开始更多的打钱,但是这种资源倾向并没有人类那么明显。AI并不想拥有只有经济第一才能够赢得比赛的英雄,他们只是想将自己的胜率最大化,并认为这样的,略为平均的经济分配方式是最容易让自己获得胜利的。
经验优先级和买活
另外一个很有意思的事情就是OpenAI很把经验的优先级设置的很高。在某个节点之后,他们就会开始频繁地买活,而这买活看起来是没有必要的。买活、TP到圣坛、打野,这通常是一个心态爆炸选手才会做的事情,但是AI并不会心态爆炸。AI只是想赢。
OpenAI会在9级左右开始买活,略为平均的经济分配方式决定了他们的“核心”买活也不会花太多钱。与此同时,他们的阵容也能够高效率推线或者光速打钱。
这确保了AI在经验上领先,同时在兵线上、团战的人数上占据优势。颇具讽刺意味的是,OG也体验到了对手通过买活战胜自己的感觉。
结论
不可否认的是,OpenAI在绝大多数情况下都是凭借着他们强大的瞬间决策能力获胜的。看到他们集火对手的方式、用技能的方式、计算英雄能够在团战中存活的时间……我们很难把自己和AI联系起来,并觉得我们能够从他们那儿学到些什么。毕竟,在现在这个时间、现在这个存在限制的游戏模式中,OpenAI比任何人类玩家都要更接近于一个“完美的Dota玩家”。
人类玩家并不是AI,他们没办法精准的计算出在吃掉一个技能之后自由还会有多少血,也不知道在被一个英雄攻击的时候自己会受到多伤害,更没办法算出地方英雄跑到自己这边需要多久。
现在的问题就是,鉴于人类玩家自身存在的缺陷,我们能不能够学习那些OpenAI应用在Dota中的策略。AI在经过了无数次的试验之后,才意识到这样做是正确的。
我们不知道向AI学习有没有充分的理由,也不知道这样做会不会有收益,但是我相信这是值得一试的。毕竟学无止境,没有人知道人类的上限在哪里。