分享好友 最新动态首页 最新动态分类 切换频道
最大开源机器人数据集!DeepMind联手21家机构,整合60个数据集,发布Open X-Embodiment,具身智能时代来临
2025-10-14 15:26
图片

作者:十九

编辑:李宝珠


谷歌 DeepMind 联手斯坦福大学、上海交通大学、英伟达、纽约大学、哥伦比亚大学等 21 家国际知名机构,整合 60 个现有的机器人数据集,创建了一个开放的、大规模的标准化机器人学习数据集——Open X-Embodiment。HyperAI超神经已在官网上线了「Open X-Embodiment 真实机器人数据集」,一键即可下载!


近日,一段「机器狗当挑夫勇闯泰山」的视频火爆全网,这个「机器狗」不仅能够轻松驮载沉重物资,还能在泰山的陡峭山路上「健步如飞」,从山脚到山顶仅用两小时!中国外交部副部长华春莹也为它点赞:「机器狗在雄伟的泰山上充当搬运工,科技造福人类。」


图片

图源:新华网


据了解,这只由泰山文旅集团物业公司引入的机器狗,主要的任务是来清运垃圾和搬运货物。过去,由于泰山景区的特殊地形,清扫垃圾的工作只能依赖人工挑运,客流高峰时段,还时常出现无法清扫挑运的情形。这只参与测试的「机器狗」不仅具有极强的地形适应能力、高稳定性、高平衡能力,还能轻松跨越障碍物,负载能力可达 120 公斤,一举解决垃圾清运难题,提升工作效率。


Google RT-2、英伟达 GR00T、Figure 02 机器人、特斯拉 Optimus、小米 CyberOne……近年来,随着越来越多机器人的相继问世,以此作为载体的具身智能也成为了一个火热话题。这些能够感知、学习并与周围环境互动,直接参与人类现实生活的机器人,在市场上具备极大的潜力。


无论是工业领域的巡检、焊接、搬运、分拣和组装,家居场景的家政服务、养老看护,还是医疗领域的手术辅助、日常护理,以及农业中的种植、施肥与收割,具身智能的应用场景广泛且多样。


然而,当前的机器人虽然在某些特定任务上表现出色,通用性方面却仍有较大欠缺,这意味着,我们需要针对每项任务、每个机器人乃至每个应用场景分别训练一个模型。借鉴自然语言处理和计算机视觉等领域的成功经验,我们或许可以让机器人学习广泛且多样的数据集,从而训练出更加通用的机器人。但是,现有的机器人数据集往往仅专注于单一环境、一组对象或某个特定任务,用于机器人交互的大型且多样的数据集很难获取。


对此,谷歌 DeepMind 联手斯坦福大学、上海交通大学、英伟达、纽约大学、哥伦比亚大学、东京大学、日本理化研究所、卡内基梅隆大学、苏黎世联邦理工学院、伦敦帝国理工学院等 21 家国际知名机构,整合了 60 个现有的机器人数据集,创建了一个开放的、大规模的标准化机器人学习数据集——Open X-Embodiment。


图片


据了解,Open X-Embodiment 数据集覆盖各种环境和机器人变化,目前已面向研究社区开放,为了便于用户下载和使用,研究人员将不同来源的数据集转换为了统一的数据格式,未来,他们计划与机器人学习社区合作,共同促进该数据集的增长。HyperAI超神经已经在官网上线了「Open X-Embodiment 真实机器人数据集」,一键即可下载!


图片

据悉,Open X-Embodiment 是迄今为止最大的开源真实机器人数据集,涵盖了从单臂机器人到双臂机器人,再到四足机器人等 22 种不同形态的机器人,共包含超过 100 万条机器人轨迹和 527 项技能(160,266 项任务)。研究人员证明,相较于仅在单个机器人类型数据上训练的模型,在多个机器人类型数据上训练的模型表现更佳。


图片


Open X-Embodiment 数据集的分布如下图所示,图 (a) 展示了 22 种形态机器人数据集的分布情况,其中 Franka 机器人最为常见。图 (b) 展示了机器人在不同场景的分布情况,Franka 机器人占据主导地位,其次是 Google Robot。图 (c) 则展示了每个形态机器人的轨迹分布情况,其中 xArm 和 Google Robot 贡献了最多的轨迹数量。图 (d,e) 分别展示了机器人具备的技能和其所用的物品,技能有 picking、moving、pushing、placing 等,物品有家用电器、食品和餐具等,种类繁多。


图片

Open X-Embodiment 数据集
(a) 由来自 22 种机器人形态的 60 个独立数据集组成
(b) 机器人在不同场景的分布情况
(c) 不同机器人的轨迹数量
(d, e) 数据集中常见的技能和 Objects

Open X-Embodiment 数据集由 60 个独立的数据集整合而成,HyperAI超神经特意为大家精选了部分数据集,简要介绍如下:

Berkeley Cable Routing 数据集由加州大学伯克利分校和 Intrinsic Innovation LLC 研究团队发布,共 27.92 GB,该数据集用于研究多阶段机器人操作任务,特别是应用于电缆布线任务。这个任务代表了复杂的多阶段机器人操作场景,要求机器人必须将电缆穿过一系列夹子,包括处理可变形物体、闭合视觉感知循环以及处理由多个步骤组成的扩展行为。


图片

CLVR Jaco Play Dataset 是一个专注于遥控机器人领域的数据集,共 14.87 GB,由南加州大学和 KAIST 的研究团队发布,它提供了 1,085 个遥控机器人 Jaco 2 的片段,并配有相应的语言注释。这个数据集对于研究机器人遥控、自然语言处理以及人机交互等领域的科学家和开发者来说,是一个非常宝贵的资源。

谷歌研究人员提出了多任务模型 Robotics Transformer (RT-1),该模型在新任务、环境和物体上的零样本泛化方面取得了显著改进,展示了优异的可扩展性和预训练模型特性。


RT-1 模型是在一个大规模真实世界机器人数据集(RT-1 Robot Action 数据集)上训练的,研究人员使用了 13 台 EDR 机械臂,每台机械臂配备有 7 个自由度的手臂、两指夹爪和移动底座,在 17 个月内收集了 13 万个片段,共 111.06 GB,每个片段被标注了机器人执行指令的文字描述。数据集中涵盖的高层次技能包括捡起和放置物品、开关抽屉、从抽屉中取出和放入物品、将细长物品竖直放置、推倒物体、拉餐巾纸和开罐子等,覆盖了使用多种不同物体的 700 多项任务。


图片

Google 团队 Robotics at Google 提出了一种框架,用于构建能够在现实世界中通过自然语言指令进行实时互动的机器人。通过在包含数十万条带有语言注释的轨迹数据集上进行训练,研究人员发现所得的策略能够执行比以往多 10 倍的指令,这些指令描述了现实世界中的端到端视听觉-运动技能。研究人员已经开源了研究所用的 Language-Table 数据集,该数据集包含了近 60 万条带有语言标签的轨迹,用于推动更先进、更有能力、可自然语言交互的机器人发展。


图片

加州大学伯克利分校、斯坦福大学、谷歌 DeepMind 和 CMU 共同发布了 BridgeData V2 数据集,该数据集致力于促进可扩展机器人研究,包含在 24 个不同环境中收集的 60,096 条机器人轨迹。其中,24 个环境分为 4 类,大部分数据来自不同的 toy kitchens,包含水槽、炉灶和微波炉等,其余环境则包括各种桌面、toy sinks、toy laundry 等。数据集中包含的任务有拾取放置、推和清扫、开关门和抽屉,以及更复杂的任务如堆叠积木、折叠衣物和清扫颗粒介质,某些数据片段包含这些技能的组合。


为了增强机器人的泛化能力,研究人员在多种环境下收集大量的任务数据,这些环境中的对象、摄像头位置和工作区定位各有不同,每条轨迹都附有与机器人任务对应的自然语言指令。从这些数据中学到的技能可以应用于新对象和环境,甚至跨机构使用,这使得该数据集成为研究人员的重要资源。


图片

BC-Z 数据集由谷歌、Everyday Robots、加州大学伯克利分校和斯坦福大学共同发布,这个大规模机器人学习数据集旨在推动机器人模仿学习领域的发展,尤其是支持零样本任务泛化,即让机器人在没有先前经验的情况下,通过模仿学习来执行新的操作任务。


该数据集包含了超过 25,877 个不同的操作任务场景,涵盖了 100 种多样化的任务,这些任务通过专家级远程操作和共享自主过程来收集,涉及 12 个机器人和 7 名操作员,累计 125 小时的机器人操作时间。数据集可用于训练一个 7 自由度的多任务策略,该策略可根据任务的语言描述或人类操作视频调整,以执行特定任务。


图片

最新文章
为童年构筑心灵防线!青年路小学防欺凌教育新实践|班会课|六年级_网易新闻
当二年级学生在游戏中学会接纳不完美,当六年级学子掌握“情绪调节三步法”,一套精准针对不同年龄段心理特点的防欺凌课程在校园里悄然展开。近日,太原市迎泽区青年路小学围绕“接纳不完美的自己”“守护少年的你”“亲密有间”三大防欺凌
A股早盘利好利空|1月20日起全国各地陆续实施手机等数码产品购新补贴_腾讯新闻
宏观新闻1、业界有消息称,中国国内有关成熟制程芯片产业正遭受自美进口产品的不公平竞争,有申请反倾销反补贴调查的诉求。商务部表示,中国国内产业的担忧是正常的,也有权提出贸易救济调查申请。对于国内产业的申请及诉求,调查机关将按
搜狐号发文秘籍:文章发布技巧与注意事项_读者_标题_内容
以下是一篇关于“搜狐号发文秘籍:文章发布技巧与注意事项”的 700 字文章:搜狐号发文秘籍:文章发布技巧与注意事项在如今信息爆炸的时代,搜狐号作为一个重要的自媒体平台,为广大创作者提供了广阔的展示空间。然而,要想在搜狐号上发布
我市检察机关深化未成年人司法社工工作 “东营模式”成全国示范样本|东营市_网易新闻
近日,国内首部未成年人司法社会工作领域蓝皮书——《中国未成年人司法社会工作发展报告(2025)》正式发布。东营市未成年人司法社会工作经验成功入选该报告地方篇,与北京、上海、深圳等城市共同作为代表性案例,向全国推广。据了解,该报
苏州张家港工行:深度融入区域发展进程,践行国有大行使命担当|张家港市|港城_网易新闻
工商银行苏州张家港分行深入践行国有大行使命担当,将做好“五篇大文章”作为工作着力点,积极投身港城经济社会主战场,为区域打造高质量发展的强劲增长极持续注入金融动能。聚力向新,激活科技创新引擎苏州张家港工行聚焦“工”和“商”主
AI+体育:数据驱动下的赛场变革与人文挑战
AI正成为体育的"数据翻译官":传感器、高速摄像头和物联网实时采集的海量数据,正将过去难以量化的生理指标、技术动作、环境参数转化为可量化指标(如NBA"防守压力指数")。运动员训练革命性升级:从国家队到个人训练,AI能实现动作精细化
快客杯泡普洱茶:限时特惠,正宗云南古树茶,香气浓郁,回甘持久,送礼自饮两相宜,点击抢购!
快客杯泡普洱茶:限时特惠,正宗云南古树茶,香气浓郁,回甘持久,送礼自饮两相宜,点击抢购!最近我跟朋友一起去喝茶,结果发现市面上的普洱茶品质参差不齐,有的喝起来像水有的又太苦,根本喝不出那种香。后来朋友给我推荐了这款“快客杯
2025年全国“五好”县级工商联建设优秀案例公布 石家庄市灵寿县工商联成功入选_腾讯新闻
日前,全国工商联发布了2025年全国“五好”县级工商联建设优秀案例,其中,石家庄市灵寿县工商联《架桥汇智 织网兴业 奋力开创灵寿民营经济高质量发展新局面》成功入选。近年来,灵寿县工商联紧扣“两个健康”工作主题,充分发挥“连心桥”
美股估值超越互联网泡沫时代峰值- DoNews
美股市场估值已突破历史纪录,超越互联网泡沫时期最高水平。最新数据显示,标普500指数市销率达到3.23倍,创历史新高。受部分高利润企业支撑,市盈率尚未触及历史极值,但已处于极端高位。目前标普500指数基于未来12个月预期盈利的市盈率为
相关文章
推荐文章
发表评论
0评