分享好友 最新动态首页 最新动态分类 切换频道
最大开源机器人数据集!DeepMind联手21家机构,整合60个数据集,发布Open X-Embodiment,具身智能时代来临
2025-10-14 15:26
图片

作者:十九

编辑:李宝珠


谷歌 DeepMind 联手斯坦福大学、上海交通大学、英伟达、纽约大学、哥伦比亚大学等 21 家国际知名机构,整合 60 个现有的机器人数据集,创建了一个开放的、大规模的标准化机器人学习数据集——Open X-Embodiment。HyperAI超神经已在官网上线了「Open X-Embodiment 真实机器人数据集」,一键即可下载!


近日,一段「机器狗当挑夫勇闯泰山」的视频火爆全网,这个「机器狗」不仅能够轻松驮载沉重物资,还能在泰山的陡峭山路上「健步如飞」,从山脚到山顶仅用两小时!中国外交部副部长华春莹也为它点赞:「机器狗在雄伟的泰山上充当搬运工,科技造福人类。」


图片

图源:新华网


据了解,这只由泰山文旅集团物业公司引入的机器狗,主要的任务是来清运垃圾和搬运货物。过去,由于泰山景区的特殊地形,清扫垃圾的工作只能依赖人工挑运,客流高峰时段,还时常出现无法清扫挑运的情形。这只参与测试的「机器狗」不仅具有极强的地形适应能力、高稳定性、高平衡能力,还能轻松跨越障碍物,负载能力可达 120 公斤,一举解决垃圾清运难题,提升工作效率。


Google RT-2、英伟达 GR00T、Figure 02 机器人、特斯拉 Optimus、小米 CyberOne……近年来,随着越来越多机器人的相继问世,以此作为载体的具身智能也成为了一个火热话题。这些能够感知、学习并与周围环境互动,直接参与人类现实生活的机器人,在市场上具备极大的潜力。


无论是工业领域的巡检、焊接、搬运、分拣和组装,家居场景的家政服务、养老看护,还是医疗领域的手术辅助、日常护理,以及农业中的种植、施肥与收割,具身智能的应用场景广泛且多样。


然而,当前的机器人虽然在某些特定任务上表现出色,通用性方面却仍有较大欠缺,这意味着,我们需要针对每项任务、每个机器人乃至每个应用场景分别训练一个模型。借鉴自然语言处理和计算机视觉等领域的成功经验,我们或许可以让机器人学习广泛且多样的数据集,从而训练出更加通用的机器人。但是,现有的机器人数据集往往仅专注于单一环境、一组对象或某个特定任务,用于机器人交互的大型且多样的数据集很难获取。


对此,谷歌 DeepMind 联手斯坦福大学、上海交通大学、英伟达、纽约大学、哥伦比亚大学、东京大学、日本理化研究所、卡内基梅隆大学、苏黎世联邦理工学院、伦敦帝国理工学院等 21 家国际知名机构,整合了 60 个现有的机器人数据集,创建了一个开放的、大规模的标准化机器人学习数据集——Open X-Embodiment。


图片


据了解,Open X-Embodiment 数据集覆盖各种环境和机器人变化,目前已面向研究社区开放,为了便于用户下载和使用,研究人员将不同来源的数据集转换为了统一的数据格式,未来,他们计划与机器人学习社区合作,共同促进该数据集的增长。HyperAI超神经已经在官网上线了「Open X-Embodiment 真实机器人数据集」,一键即可下载!


图片

据悉,Open X-Embodiment 是迄今为止最大的开源真实机器人数据集,涵盖了从单臂机器人到双臂机器人,再到四足机器人等 22 种不同形态的机器人,共包含超过 100 万条机器人轨迹和 527 项技能(160,266 项任务)。研究人员证明,相较于仅在单个机器人类型数据上训练的模型,在多个机器人类型数据上训练的模型表现更佳。


图片


Open X-Embodiment 数据集的分布如下图所示,图 (a) 展示了 22 种形态机器人数据集的分布情况,其中 Franka 机器人最为常见。图 (b) 展示了机器人在不同场景的分布情况,Franka 机器人占据主导地位,其次是 Google Robot。图 (c) 则展示了每个形态机器人的轨迹分布情况,其中 xArm 和 Google Robot 贡献了最多的轨迹数量。图 (d,e) 分别展示了机器人具备的技能和其所用的物品,技能有 picking、moving、pushing、placing 等,物品有家用电器、食品和餐具等,种类繁多。


图片

Open X-Embodiment 数据集
(a) 由来自 22 种机器人形态的 60 个独立数据集组成
(b) 机器人在不同场景的分布情况
(c) 不同机器人的轨迹数量
(d, e) 数据集中常见的技能和 Objects

Open X-Embodiment 数据集由 60 个独立的数据集整合而成,HyperAI超神经特意为大家精选了部分数据集,简要介绍如下:

Berkeley Cable Routing 数据集由加州大学伯克利分校和 Intrinsic Innovation LLC 研究团队发布,共 27.92 GB,该数据集用于研究多阶段机器人操作任务,特别是应用于电缆布线任务。这个任务代表了复杂的多阶段机器人操作场景,要求机器人必须将电缆穿过一系列夹子,包括处理可变形物体、闭合视觉感知循环以及处理由多个步骤组成的扩展行为。


图片

CLVR Jaco Play Dataset 是一个专注于遥控机器人领域的数据集,共 14.87 GB,由南加州大学和 KAIST 的研究团队发布,它提供了 1,085 个遥控机器人 Jaco 2 的片段,并配有相应的语言注释。这个数据集对于研究机器人遥控、自然语言处理以及人机交互等领域的科学家和开发者来说,是一个非常宝贵的资源。

谷歌研究人员提出了多任务模型 Robotics Transformer (RT-1),该模型在新任务、环境和物体上的零样本泛化方面取得了显著改进,展示了优异的可扩展性和预训练模型特性。


RT-1 模型是在一个大规模真实世界机器人数据集(RT-1 Robot Action 数据集)上训练的,研究人员使用了 13 台 EDR 机械臂,每台机械臂配备有 7 个自由度的手臂、两指夹爪和移动底座,在 17 个月内收集了 13 万个片段,共 111.06 GB,每个片段被标注了机器人执行指令的文字描述。数据集中涵盖的高层次技能包括捡起和放置物品、开关抽屉、从抽屉中取出和放入物品、将细长物品竖直放置、推倒物体、拉餐巾纸和开罐子等,覆盖了使用多种不同物体的 700 多项任务。


图片

Google 团队 Robotics at Google 提出了一种框架,用于构建能够在现实世界中通过自然语言指令进行实时互动的机器人。通过在包含数十万条带有语言注释的轨迹数据集上进行训练,研究人员发现所得的策略能够执行比以往多 10 倍的指令,这些指令描述了现实世界中的端到端视听觉-运动技能。研究人员已经开源了研究所用的 Language-Table 数据集,该数据集包含了近 60 万条带有语言标签的轨迹,用于推动更先进、更有能力、可自然语言交互的机器人发展。


图片

加州大学伯克利分校、斯坦福大学、谷歌 DeepMind 和 CMU 共同发布了 BridgeData V2 数据集,该数据集致力于促进可扩展机器人研究,包含在 24 个不同环境中收集的 60,096 条机器人轨迹。其中,24 个环境分为 4 类,大部分数据来自不同的 toy kitchens,包含水槽、炉灶和微波炉等,其余环境则包括各种桌面、toy sinks、toy laundry 等。数据集中包含的任务有拾取放置、推和清扫、开关门和抽屉,以及更复杂的任务如堆叠积木、折叠衣物和清扫颗粒介质,某些数据片段包含这些技能的组合。


为了增强机器人的泛化能力,研究人员在多种环境下收集大量的任务数据,这些环境中的对象、摄像头位置和工作区定位各有不同,每条轨迹都附有与机器人任务对应的自然语言指令。从这些数据中学到的技能可以应用于新对象和环境,甚至跨机构使用,这使得该数据集成为研究人员的重要资源。


图片

BC-Z 数据集由谷歌、Everyday Robots、加州大学伯克利分校和斯坦福大学共同发布,这个大规模机器人学习数据集旨在推动机器人模仿学习领域的发展,尤其是支持零样本任务泛化,即让机器人在没有先前经验的情况下,通过模仿学习来执行新的操作任务。


该数据集包含了超过 25,877 个不同的操作任务场景,涵盖了 100 种多样化的任务,这些任务通过专家级远程操作和共享自主过程来收集,涉及 12 个机器人和 7 名操作员,累计 125 小时的机器人操作时间。数据集可用于训练一个 7 自由度的多任务策略,该策略可根据任务的语言描述或人类操作视频调整,以执行特定任务。


图片

最新文章
当大巴黎再次碰上利物浦,风水轮流转,但菜是原罪
对于上周中的欧冠,大概每一个球迷都会对结果津津乐道,但并不想去回看比赛过程。毕竟,一场比赛被大巴黎按在地上摩擦90分钟,实在不是什么美好的回忆。所以,有的球迷建议利物浦应该延续上一场死守的战术,只要能够晋级,我们不介意再吃一
腾讯娱乐年度盛典红毯:刘浩存美神降临,周深唱《好运来》,向佐混搭风抢戏
文 | 烤娱2025年的脚步越来越近,娱乐圈的盛典活动也扎堆出现,各大平台纷纷亮大招,都想在岁末抢占一把头条。12月25日,2024腾讯娱乐盛典在北京拉开帷幕。诞生于2014年的腾讯娱乐盛典,如今已经走过11个年头,也是鹅厂的品牌项目之一。聚
如何订阅China Daily报纸?官方攻略来了!
神舟十九号成功发射双十一花式营销中国游戏火遍全球运动健儿闪耀巴黎嫦娥六号月背挖土带回地球来中国旅游city不city啊中国三蹦子走向世界甘肃天水麻辣烫出圈中式木头建筑里有多少奥妙……这一年,世界各地的热点事件层出不穷,涉及政治、经
第一款月活破亿的短剧APP诞生,字节系再造神话
编辑 /  B B近年来,短剧市场份额激增,这股新型浪潮正在以惊人的速度向各大年龄段观众蔓延,各类微短剧APP如雨后春笋般不断涌现。据相关行业媒体报道,截止2024年6月,我国微短剧用户规模已达到5.76亿,占整体网民的52.4%。相较于长视频
2024年中国房地产企业代建综合能力TOP30排行榜发布
01头部企业整体表现稳定,绿城管理、蓝城集团、金地管理稳居综合能力前三从2024年中国房地产企业代建综合能力TOP30来看,总体呈现三个特征:第一,代建头部企业强者恒强,表现稳定。一方面综合能力TOP10企业总体变动率仅为10%,格局相对稳
决赛东莞!国际篮联三人篮球公开赛全国总决赛、扣篮大赛本周末燃情上演
11月9日-10日,国际篮联三人篮球公开赛(FIBA OPEN 3X3)重燃战火,来自全国12大赛区的24支球队将齐聚“全国篮球城市”东莞,在东实C park中心广场一较高下,角逐本届赛事最高荣誉。届时,除了紧张刺激的正赛,国内顶尖灌篮高手还将联袂上
Lunita2025年十二星座运势(巨蟹座)
【巨蟹座】事业:2025年对巨蟹座而言,是事业方面自我蜕变和成长的一年。今年会带来很多全新的开端,你会获得开拓自我、提升职业地位的机会。也会经历调整状态,休养生息,寻求心灵的宁静,用充沛的状态迎接接下去的发展。很多人会找到心灵
友邦保险:夙愿达成
如果以2010年为限,此前主要是九大保险集团成立各自的保险资管公司,2010年之后,一批中小保险公司成为保险资管公司的主力。2011年9月,随着光大永明资产管理股份有限公司获筹,合资寿险公司亦开始加入保险资管公司阵营,中英人寿、中意人
鸿蒙电脑应用登陆平板,国产软件正在打破“设备边界”
7月24日,华为发布搭载HarmonyOS 5的旗舰平板HUAWEI MatePad Pro12.2英寸。至此,华为完成了在手机、电脑、穿戴设备、智慧屏、车载座舱、平板等核心终端品类上鸿蒙5的全面覆盖。最新数据显示,已有40余款设备搭载鸿蒙5操作系统。 随着终端
DIY硬件一周精选 | 英特尔传奇退休,AMD重磅新品或定档CES 2025,微星推Ultra200V小屏掌机
欢迎收看本期DIY硬件一周精选!这周英特尔整了不少大活,接下来让我们一起来看看这一周电脑硬件科技圈又发生了哪些有趣的事情吧~微软:强行运行Win11或将影响保修先说说微软最近在干嘛,脍炙人口的Windows10系统到明年10月就停止支持了嘛,
相关文章
推荐文章
发表评论
0评