新浪微博 | 腾讯微博 | 收藏艺淼环保 | 在线留言 | 网站地图 欢迎光临艺淼环保网站

艺淼环保

污水治理工程首选 专注有机污水治理12年 国家专利技术

咨询热线 15109212130
艺淼环保
新闻资讯
联系艺淼环保

咨询热线: 0871-63337100

云南艺淼环保科技有限公司

手机:13808710689

邮箱:admin@ymhb100.com

办公地址:昆明经开区出口加工区第三城映象欣城

用于Minecraft中AI助手的Facebook开源CraftAssist框架

时间:2020-05-28 15:42:03来源:365bet-365bet体育在线-365bet网址

  Facebook AI研究人员将CraftAssist开源,这是一个为Minecraft视频游戏构建交互式助手机器人的框架。这些机器人使用自然语言理解(NLU)来解析和执行人类玩家的文本命令,例如在游戏世界中建造房屋的请求。研究人员可以扩展该框架的模块化结构,以执行自己的ML实验。

  研究团队在最近的博客文章中对该系统进行了概述。CraftAssist机器人使用与标准游戏客户端相同的协议连接到游戏,因此可以执行人类玩家可以执行的任何操作。机器人使用Minecraft的内置基于文本的聊天界面与其他玩家进行交互。人类可以向机器人发出命令,包括高级指令,例如“在蓝色立方体旁边盖房子”。该发行版的目的是帮助改善人与人工智能的协作:

  该平台旨在支持对与人类参与者指定和评估的各种任务交互有趣并有用的代理的研究。为了鼓励更广泛的AI研究社区将Craftcraft平台用于他们自己的实验,我们正在开放框架,基线助手以及用于构建它的工具和数据的外包。

  从广义上讲,机器人控制系统由感知和动作选择子系统组成。感知是将原始传感器数据转换为更抽象的表示;例如,图像识别是一种感知任务,它将图像像素转换为描述图像内容的文本标签。当对包含许多传感器输入示例和所需输出的示例的数据集进行训练时,现代的深度学习模型可以在许多视觉和NLU任务上实现接近人类水平的性能。

  动作选择是机器人“决定”如何与世界互动以实现某个目标的过程。例如,为了赢得围棋而做出的举动。许多成功的系统都使用强化学习(RL),在这种学习中,机器人会反复尝试执行任务,每次尝试都会给出数值奖励 结果。游戏是RL的常见测试平台,因为它们具有明确的动作和结果集,而经过RL训练的现代机器人在许多不同的游戏中通常都可以胜过人类的顶级能力。某些研究小组(例如Google的DeepMind)将感知和动作选择子系统组合到一个由受训者训练的单一“端到端”系统中深度强化学习,还有许多用于训练这些系统的虚拟环境,包括 Facebook开发的模拟栖息地。微软已经为Minecraft开源了一个名为Project Malmo的“ AI-gym”界面以及一个大型数据集,以鼓励将Minecraft用作RL研究的测试平台。