网站首页 > 人工智能AI > 人工智能应用 Facebook创建Habitat,一个极具世界真实感的模拟系统 正文

Facebook创建Habitat,一个极具世界真实感的模拟系统

admin 2020/03/02 人工智能应用 101℃

人工智能

[db:标签][db:标签]一个代理在复杂的3D世界中导航是计算昂贵且耗时的。最后,脸书工程师通过淘汰系统淘汰了速度最慢的代理,导致了巨大的性能提升。

HAbitat:在3D环境中导航成功率99.9%

“嵌入式人工智能”意味着机器学习系统可以与周围的环境智能交互,例如,使用对话上下文来响应语音命令,或者让机器人知道它进入了错误的房间。

要创建这样的“具体”系统,我们需要使用真实世界的合理副本来训练它们。没有见过走廊的人工智能无知道墙和门是什么。考虑到机器人在现实生活中走得太慢,我们不能指望他们在这里学到教训。栖息地可以提供一套具有足够真实感的模拟现实世界环境,使人工智能能够在现实世界中导航。

在机器人和人工智能训练中很常见的模拟器也可以实现同样的功能。我们可以同时运行多个实例,例如,我们可以同时运行数千个实例。每个包含代理的实例都试图解决一个问题,并将最终结果报告给为其分配任务的中央系统。然而,不幸的是,与简单的虚拟环境相比,真实的3D环境需要大量的计算,这降低了学习速度。

由乔治亚理工学院的德鲁夫·巴特拉教授和博士生埃里克·威曼斯领导的脸书研究人员已经找到了一种方法,可以将这个过程加快一个数量级甚至更多。其结果是,人工智能系统可以在3D环境中从起点导航到目标,成功率为99.9%,误差很小。

简单导航是“嵌入式人工智能”或机器人的基础。巴特拉说:“如果系统有地图,从A点到B点很容易。如果没有,这是一个公开的问题。导航失败意味着任何建立在其上的堆栈都会崩溃。”

他们发现问题在于训练系统花了太多时间等待落后的特工。“不一定是他们学得慢,”威曼斯解释道,“但如果你模拟一居室公寓的导航,这比在10居室的公寓里导航要容易得多。”中央系统的设计是等待所有计划的代理完成其虚拟任务并返回报告。如果单个代理花费的时间是其他代理的10倍,这意味着在系统等待更新信息并发送新的批处理数据时浪费了大量时间。

脸书团队的创新是在这些不幸的落后者完成任务之前,智能地将其淘汰。经过一段时间的模拟,收集的所有数据都将被添加到集合中。威曼斯说:“所有这些特工都在行动,他们在做自己的事情,他们互相交流。一个人会告诉其他人,‘好了,我就要完成了’,他们都会报告他们的进展。任何落后于他人的人都会减少大规模同步之前完成的工作量。”在这种情况下,您可以看到每个工作人员同时停止并共享。

如果机器学习的智能感觉“不舒服”,我肯定会在这一点上发生,代理确实会被系统“惩罚”,因为它不会像其他代理一样得到虚拟的“强化”。低效算法的重要性已经降低,但它们的贡献仍然是有价值的。威曼斯解释道:“无论成功还是失败,我们都会利用代理人积累的所有经验。不管是成功还是失败,我们仍然可以从中吸取教训。”

这意味着没有浪费的周期,一些代理正在等待其他代理完成他们的工作。按时完成任务需要更多的经验,这意味着下一批稍好的代理将更早完成任务,这是一个自我强化的周期,可以带来相当大的好处。

这些有效的方法使得脸谱网的研究人员能够生成能够在指定时间内在虚拟环境中解决点对点导航任务的代理,其可靠性为99.9%。他们甚至表现出对错误的稳健性,并找到了一种方法来快速识别他们选择了错误的路径,然后返回到另一条路径。

研究人员推测,这些代理人已经学会了“使用结构法则”,这在某些情况下意味着人工智能已经找到了作弊的方法。但威曼斯澄清说,他们使用的环境更有可能有一些实际的布局规则。“这些是我们真正的数字房子。他们正在学习西式房屋的布局,”他说。正如你不希望厨房直接进入卧室一样,人工智能已经学会了识别其他模式并做出其他“假设”下一个目标是为这些代理找到一种用更少的资源完成任务的方法。每个代理都有一个虚拟摄像头,可以提供普通的深度图像,但也有一个可靠的坐标系统告诉它去了哪里,还有一个指南针总是指向目标。要是总是这么容易就好了!但是在这个实验之前,即使有这些资源和更多的训练时间,成功率还是相当低。“在这些改进之前,栖息地是一个静态的系统空间,”威曼斯解释道。“特工可以移动并撞到墙上,但不能打开抽屉或打翻桌子。我们这样做是因为我们希望快速、大规模地模拟——,但如果您想解决“从我的办公桌上拿起我的笔记本”之类的问题,最好是能够实际拿起笔记本。”

因此,“栖息地”现在允许用户在房间里添加物体,对这些物体施力,检查碰撞等。毕竟,在现实生活中,除了在无摩擦的3D结构中滑动,还有更多的东西。

这些改进将使Habitat成为一个更加强大的实验平台,同时也将使在该平台上接受培训的代理能够直接将他们的学习结果传输到现实世界——。该团队已经开始这项工作,并将很快发表一篇论文。

参考源:TC

网站地图