虽然演示中的这些行为都比较简单,不过确实很有意思。而OpenAI官方表示:所有这些小人儿都是独立的,只能通过自己的观察来认识世界,视野外的物体对他们来说都是不可见的,这很好地模拟了现实场景。所有复杂的策略都需要小人儿自行学习。
小人儿学会了搭建小屋躲避追踪
除了捉迷藏游戏,OpenAI官方还进行了另一种模式的训练,该模式没有目的可自由探索,不过系统会鼓励小人儿与物体交互。这种模式下小人儿的行为则无迹可寻,根本看不出小人儿要做什么。因此OpenAI认为像捉迷藏那样的多角色竞争模式更利于训练人工智能形成类人行为。
小人儿需进行成千上万次训练,不断进化、学习
最后OpenAI表示,这种多角色互动、不断适应型训练模式可能在未来打造出更加复杂、更加聪明的人工智能。