当前位置: 首页 > news >正文

亚马逊发布TEACh数据集训练家用机器人

新数据集助力训练家用机器人执行人类指令

亚马逊科学团队公开发布的TEACh数据集包含来自模拟环境的3000多组对话及关联视觉数据,旨在推动能完成复杂家务任务的AI助手研发。

数据集概览

  • 数据规模:4365个采集会话中,成功回放3047个
  • 环境构成:基于AI2-THOR模拟器的30种厨房及多数客厅/卧室/浴室变体
  • 交互特性:包含45,000余条对话,平均每会话8.4条用户指令和5.25条机器人响应
  • 操作能力:支持拾取/放置、开关橱柜、操作电器、液体倾倒等20余种物体交互动作

技术实现

  1. 任务定义语言:通过属性验证机制判定任务完成状态(如检测"存在装满咖啡的干净杯子")
  2. 众包采集:双工作者分别扮演用户和机器人角色,通过网页界面在模拟环境中协作
  3. 动态交互:支持非结构化对话,包含过早/过晚指令、纠错指导等真实交互场景

三大基准测试

  1. EDH(基于对话历史的执行)

    • 输入:对话历史+机器人动作序列
    • 输出:预测后续动作并验证环境状态改变
    • 应用:Alexa Prize SimBot挑战赛基准
  2. TfD(基于对话的轨迹预测)

    • 输入:完整对话记录
    • 输出:重建机器人全部动作序列
  3. TATC(双代理任务完成)

    • 需构建用户模型(生成指令)和机器人模型(执行动作)的协同系统

验证架构

  • 可见分割(validation-seen/test-seen):评估训练房间内的泛化能力
  • 未见分割(validation-unseen/test-unseen):测试新场景适应能力
  • 兼容ALFRED数据集迁移学习

该数据集已开源并配套发布arXiv技术论文,为具身智能体研究提供新基准。研究团队特别感谢30余位Alexa AI组成员的贡献。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)
公众号二维码

http://www.sczhlp.com/news/737.html

相关文章:

  • 日记
  • 完全使用TRAE和AI 开发一款完整的应用----第一周
  • CentOS Stream 9上部署FTP应用服务的两种方法(传统安装和docker-compose)
  • SeuratExtend 可视化教程(1):单细胞分析的高颜值绘图指南
  • SpringBoot 默认配置
  • 暑假7.28
  • 计算机硬件:RAID 0、1、5、6、10简单介绍
  • nest基础学习流程图
  • grabcad
  • 2025.7.28总结 - A
  • Python 实现基于图像处理的验证码识别
  • 2025最新程序员面试题集合 包括各大厂面试规范,面试问题
  • 浅谈基环树
  • Day 28
  • 2025.7.28
  • 《叔向贺贫》
  • 2025总结
  • AI绘画提示词
  • 记一个由tinyint类型引发的低级错误
  • Dify快速搭建问答系统
  • AGC050A AtCoder Jumper
  • 用 Python 构建可扩展的图像验证码识别模块
  • 带外安全更新深度解析:ATL漏洞与IE防御措施
  • 更多脚本详见csdn
  • 第三天
  • Golang基础笔记十五之sync
  • hot100 回溯算法
  • 7.28随笔
  • 外培总结
  • 7月28日