人类无极限！从OpenAI身上能学到什么？

gakki家今天的饭 2019-04-20 16:21 26120 来源：MAX 举报

社区一直对OpenAI存在误解，他们都觉得OpenAI是专门用来打Dota的。其实并不是这样的，Dota只是OpenAI的开发者用来测试他们的算法到底能不能学习解决问题的工具。事实证明，他们的算法非常棒。

有意思的是，在规则上受到限制的情况下，OpenAI将过去十多年Dota2玩家的技战术糅合到了一起。中路走一个、边路走两三个、控符……这些事情都是人类在打Dota时一直做的。OpenAI打比赛看起来真的和正常比赛没什么区别。

当然，OpenAI把协作、集火、宏观决策等很多问题分成了十一类，这看起来非常牛掰，同时这也是人类遥不可及的事情。OpenAI在一些其他事情上，做法也和人类不同。这些事情有可能会让Dota2的选手们产生全新的理解。

前期对线

人类玩家在打Dota的时候往往会选择固定分路。他们在分路之后希望能够对上想对的对手，如果对不上，顶多也就换个一次，然后开始补刀、换补给……OpenAI并不认同这个做法。

回看对阵OG的两局比赛，我们能很清晰的看到AI为了获得对线优势，经常换路、游走。对于人类而言，一些英雄往往会在到达3级之后开始游走，这些英雄往往都是辅助，但是对于AI而言，他们并不管游走的是辅助还是核心，他们只想要游走的成功率。

从理论上说，这种方式是行得通的。如果你让一个英雄离开双人路，那么你们会有一个英雄单吃经验，你在经验上并没有损失。而游走杀掉一个敌人的收益又远远高于一本TP的价格。在一次成功的Gank之后，你可以选择让另外的一两个英雄迅速在别的区域发起一次Gank。

很显然，人类在这方面有所缺陷，因为他们没办法精确地计算出游走的成功率，也没办法完美的权衡游走还是不游走。但是我们也在2015看到过CDEC的明星选手Agressif有过和OpenAI类似的做法。Agressif的代表性英雄是飞机，他在操刀飞机的时候会不停的游走打架，将英雄的特性发挥到极致。Agressif的打法在那时收效显著，没有人能靠运气打进TI决赛。

经济分配

在对线期不停游走、换线使得OpenAI队的英雄经济、经验远比我们所熟悉的更平均。但是他们的经济、经验总量要远比人类队高。

遗憾的是，游戏的OB并没有向观众展示OpenAI前期的经验优势，他们只是单独的看了等级，而OpenAI似乎总是领先。OpenAI并没有牺牲任何一名辅助，让一个英雄在十分钟经的时候只有三级，而且没有鞋子。他们更喜欢让五名英雄都具备一定战斗力。

在Dota中存在着一种“围绕着一个英雄打”的概念。当前版本职业队伍一般会选择两个能够带着辅助扫图的节奏型英雄。OpenAI则让每一个英雄都能够在前15-20分钟成为团队运行的核心。

随着游戏时间的推移，OpenAI也有了资源倾向，一些更吃经济的英雄开始更多的打钱，但是这种资源倾向并没有人类那么明显。AI并不想拥有只有经济第一才能够赢得比赛的英雄，他们只是想将自己的胜率最大化，并认为这样的，略为平均的经济分配方式是最容易让自己获得胜利的。

经验优先级和买活

另外一个很有意思的事情就是OpenAI很把经验的优先级设置的很高。在某个节点之后，他们就会开始频繁地买活，而这买活看起来是没有必要的。买活、TP到圣坛、打野，这通常是一个心态爆炸选手才会做的事情，但是AI并不会心态爆炸。AI只是想赢。

OpenAI会在9级左右开始买活，略为平均的经济分配方式决定了他们的“核心”买活也不会花太多钱。与此同时，他们的阵容也能够高效率推线或者光速打钱。

这确保了AI在经验上领先，同时在兵线上、团战的人数上占据优势。颇具讽刺意味的是，OG也体验到了对手通过买活战胜自己的感觉。

结论

不可否认的是，OpenAI在绝大多数情况下都是凭借着他们强大的瞬间决策能力获胜的。看到他们集火对手的方式、用技能的方式、计算英雄能够在团战中存活的时间……我们很难把自己和AI联系起来，并觉得我们能够从他们那儿学到些什么。毕竟，在现在这个时间、现在这个存在限制的游戏模式中，OpenAI比任何人类玩家都要更接近于一个“完美的Dota玩家”。

人类玩家并不是AI，他们没办法精准的计算出在吃掉一个技能之后自由还会有多少血，也不知道在被一个英雄攻击的时候自己会受到多伤害，更没办法算出地方英雄跑到自己这边需要多久。

现在的问题就是，鉴于人类玩家自身存在的缺陷，我们能不能够学习那些OpenAI应用在Dota中的策略。AI在经过了无数次的试验之后，才意识到这样做是正确的。

我们不知道向AI学习有没有充分的理由，也不知道这样做会不会有收益，但是我相信这是值得一试的。毕竟学无止境，没有人知道人类的上限在哪里。

0

人类无极限！从OpenAI身上能学到什么？

热帖推荐

主编推荐