开云体育官网是什么27年专注于自动化灌装生产线一站式解决方案

食品、日化、医疗及汽车用品行业 欢迎来样试机

13044263005

7*24小时服务电话

助力企业提质增效

——实现企业生产智能化 - 连续化 - 高效化——

自动灌装机
首页 > 产品中心 > 自动灌装机

人形机器人百万真机数据集全球首次开源 具身智能迎来GPT时刻

时间: 2025-01-25 08:01:24 |   作者: 自动灌装机

产品详情

  人工智能领域在AI大模型和智能驾驶爆火之后,下一个最热的赛道是什么?具身智能当仁不让!据高盛此前预测,到2035年,人形机器人市场空间有望达到1540亿美元。除了特斯拉,国内也有很多大厂和勇于探索商业模式的公司投身其中。

  与传统的工业机器人不同的是,新一代具身智能的核心目标是,赋予机器人类人化的泛化能力,也即面对多样化的环境和任务时,能够像人类一样从容应对和灵活操作。比如人形机器人被期望可以做一些家务劳动,而不是像流水线上的机械手臂一样只能做简单、重复的动作。

  要实现这一点,正如ChatGPT需要海量数据做训练,端到端的智能驾驶需要几百万辆车提供数据来源,具身智能的发展同样需要大量优质的训练数据。但是,收集机器人训练数据,远比通用大模型收集文本或图像等互联网数据困难得多,需要在专门的环境中记录机器人的每个关节动作和末端执行信息。这样的一个过程不仅需要昂贵的硬件设备,还需投入大量人力来确保数据质量。成本高,数据少,已成为人形机器人行业迭代的掣肘。

  国内具身智能明星企业智元机器人,今日重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,有助于推动具身智能领域迎来GPT时刻。

  接下来的一段时间,智元机器人将按计划在HuggingFace、Github以及目主页上分批上传数据,供全球下载和使用,加速人类迈向通用AI的新时代。 #源神稚晖君又开源了#

  智元机器人成立时间不长,但跑得最快,已成为中国估值最高、现金储备最为充足、商用量产顶级规模的人形机器人企业之一。

  据了解,智元机器人由“华为天才少年”“稚晖君”彭志辉从华为离职后于2023年2月创立。在成立不到两年的时间里,智元机器人已完成了八轮融资,融资总额超20亿元,估值超70亿元。

  其投资方背景颇为强大,既包括高瓴创投、鼎晖资本、经纬创投等投资机构,也包括上海临港新片区基金、上海司南园科私募基金等地方国资,以及比亚迪、上汽投资、长飞光纤、立景创新、百度风投、三花控股等产业资本。据智元机器人方面透露,公司计划于明年年初启动B轮融资。

  在产品布局方面,2024年8月18日,智元机器人发布了五款商用人形机器人新品,包括“远征”与“灵犀”两大系列,这些新品覆盖了交互服务、柔性制造、特种作业、科研教育和数据采集等多个场景。

  在智元的这场新品发布会上,其柔性智造机器人远征A2-W的一场“现场秀”让人印象深刻。

  在一个布置得像客厅的场景中,彭志辉对一台远征A2-W机器人说“给我做一杯萄汽可乐吧?”;远征A2-W回问:”什么是萄汽可乐?”;彭志辉解释称,“就是把葡萄榨汁和可乐放在一起。”听到后远征A2-W就移动去了桌子边,从放有青枣、葡萄、小番茄等的碟子中选中葡萄,拿起榨汁机,成功将葡萄打成汁,然后又从有可乐、雪碧、橙汁、矿泉水的罐装饮料中选中可乐,用它的两根手指打开瓶盖,将可乐倒入葡萄杯中,最后递给彭志辉。

  对全世界的机器人来说,这一番操作其实相当复杂的,特别考验机器人的语义理解和手眼配合能力。远征A2-W的成功完成,证明了智元机器人的软硬件技术实力。

  也正基于此,智元已经正式开启通用机器人商用量产。截至12月15日,机器人累计产量已有962台,年底计划产量接近千台。其市场表现同样令人瞩目。据透露,智元预计2024年的发货量将达到300台左右,其中,双足人形机器人远征A2约200台,轮式人形机器人远征A2-W约100台。

  支持远征A2-W机器人为彭志辉成功制作「萄汽可乐」的,是智元的动作编排大模型。动作编排大模型变得更强的必要条件之一,就是此次开源的数据集。 #智元开源,中国具身ImageNet到来#

  在智元选择开源之前,全球最通用的机器人操作策略一般是在由谷歌 DeepMind机器人团队创建的Open X-Embodiment数据集上预训练的。但由于其在数据分布外场景成功率难称“优异”,因此训练出的机器人系统难以适应新任务、新环境的巨大挑战。

  相比Open X-Embodiment数据集,Agibot World长程数据规模高出10倍,场景范围覆盖面扩大100倍,数据质量从实验室级上升到工业级标准!

  据介绍,AgiBot World数据集中涵盖的场景具备多样化和多元化特点,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等复杂动作,几乎涵盖了人类日常生活所需的绝大多数场景。AgiBot World数据集中收录了80多种日常生活中的多样化技能视频,让机器人能够“十八般武艺样样精通”。

  AgiBot World数据集诞生于智元自建的大规模数据采集工厂与应用实验基地,空间总面积超过4000平方米,包含3000多种真实物品,真实复刻了家居、餐饮、工业、商超和办公五大核心场景,全方面覆盖了机器人在生产、生活中的100多种典型应用需求。

  与传统数据集只能处理短程任务相比,Agibot World数据集的一大特色是,80%的任务均为长程任务,任务时长集中在60s-150s之间,并且包含多个原子技能,是DROID和OpenX-Embodiment的5倍左右。

  举个形象的例子。传统数据集训练的是,让机器人拿一只碗,拿住不打滑、掌握好力道不捏碎,就已经很棒了。而Agibot World数据集能让机器人做到的是使用洗碗机洗碗的完整程序。这些操作包括:首先打开洗碗机;然后将筷子、勺子、碗和盘子等水池里杂乱的不一样的形状的餐具,一一准确无误地整理至洗碗机相应卡槽中;关上洗碗机;打开按钮开始洗刷。

  凭借先进的硬件、精心设计的任务和保证的数据质量,AgiBot-World 为大规模机器人学习树立了新的标杆,并为通用机器人系统的未来铺平了道路。

  数据集的开源并非智元机器人首次对外开源。其创始人稚晖君深受极客精神影响,秉持开源理念,认为开源不仅是技术分享,更是推动行业进步的有力方式,通过开源,让科技成果为更多人所用,促进整个行业的发展,实现技术的共享与创新。

  2024 年 9 月 25 日智元 AimRT 中间件正式开源。AimRT 是智元机器人自主研发的高性能通信中间件,它为机器人开发者提供了一个更轻量化、高效、易用的工具,简化了机器人开发过程中的资源管控、异步编程与部署配置等复杂流程,提升了开发效率,有助于推动各类机器人应用的快速落地。同时,其兼容性和可扩展性也为 AI 绘画、AI 生文等领域的应用提供了良好基础,可以在一定程度上促进机器人技术与其他领域的融合发展。

  2024 年 10 月 24 日智元机器人又宣布灵犀X1面向全球全栈开源,包含含本体设计图纸、软件框架、中间件源码、基础运控算法等,开源资料总大小超过1.2GB。这一举措不仅推动了技术的民主化,也为全球的开发者和科技爱好者提供了学习和研究的平台。智元希望灵犀X1能够开启“人形机器人人人造”的时代。

  如同OpenAI将GPT做成大模型领域的基础设施一样,智元也希望未来所有的机器人都使用同样的硬件、同一个大脑甚至小脑——而这些都是智元Inside。

  智元在此刻开源全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集AgiBot World,是具身智能技术发展的重大突破和里程碑事件,更是推进具身智能通用AI(AGI)实现的重要加速器。

  未来,智元机器人将陆续开源千万仿真数据,以支持更泛化和更通用的大模型训练;将发布具身基座大模型,可支持模型微调,赋能千行百业;发布全套工具链,实现采集、训练和评测完美闭环;为激发创新的无限潜能,我们还将举办一系列AgiBot World Challenge。

  智元方面表示,“我们通过汇聚顶尖资源与技术力量,将一同推动具身智能发展新范式,加速人类迈向通用AI的新时代,在全世界内奠定中国在这一前沿领域的领导地位。” #源神稚晖君又开源了# #智元开源,中国具身ImageNet到来#