当前位置:首页 > AI资讯 > 正文内容

具身智能数据荒:机器人如何突破训练瓶颈

admin2个月前 (04-17)AI资讯95

当大模型在“烧token”时,具身智能却在“无数据可烧”

2026年,AI世界正上演一场荒诞的对比:一边是大语言模型和视频生成模型以万亿级token疯狂“吞食”文本与图像,另一边是具身智能机器人却陷入“无数据可训”的窘境。如果说大模型是“读万卷书”,那具身智能就得“行万里路”——而这条路,正被数据的匮乏死死卡住。

4月16日,智元机器人旗下子公司觅蜂科技发布了一站式物理AI数据服务平台,试图用一场“数据工业革命”打破僵局:让高质量物理交互数据像水电一样即插即用。

数据荒:具身智能的“阿喀琉斯之踵”

“GPT-5用了100万亿tokens的训练语料,相当于一个人连续说话100亿小时。”觅蜂科技董事长兼CEO姚卯青在发布会上指出,“但今天全球高质量的具身智能训练数据,可能连50万小时都不到。”

这背后是根本性的差异:大模型的数据来自互联网上已存在的文本、图像与视频,而具身智能需要的是机器人在真实物理世界中“动手”产生的动作、力觉、位姿、环境反馈等多模态数据。这些数据无法凭空生成,必须通过真实交互采集。

过去,行业主要依赖两种方式:一是用实体机器人进行遥操作采集,成本高、效率低;二是依赖仿真环境生成数据,但“仿真 gap”导致迁移到真实世界时性能大打折扣。两者都难以规模化。

无本体采集:让数据“轻装上阵”

觅蜂提出的解决方案是“无本体采集”(Object-free/Body-less Data Collection)——不依赖昂贵的机器人本体,而是通过人类佩戴轻量化传感器设备,直接记录真实世界中的操作行为。

其核心硬件MEgo系列包括两款设备:
- MEgo Gripper:一款仅重480g的无线夹爪,配备1080P 60fps摄像头,轨迹重建精度达毫米级,能精准还原“拿起一张纸”的力度与动作细节,支持电池快换与亚毫秒级无线同步。
- MEgo View:头戴式采集设备,融合7个高清摄像头与车规级九轴IMU,覆盖超过300度视野,同时捕捉环境全景与手腕操作细节,输出RGB图像、IMU、位姿、音频等全感官数据。

这些设备摆脱了线缆束缚,支持在工厂、商超、家庭等任意场景“边走边采”,极大降低了数据采集的门槛。

从“专业团队”到“众包骑手”:数据生产的范式转移

更关键的是,觅蜂正在推动数据采集模式的变革。姚卯青设想了一种类似“美团骑手”的众包模式:普通人经过短期培训后,即可兼职参与数据采集,“走到哪采到哪”。

这种模式不仅提升了数据获取的广度与速度,也实现了场景的多样化——从厨房切菜到仓库搬运,从超市理货到老人护理,真实世界的复杂动作都能被高效记录。

而这一切的背后,是MEgo Engine数据治理引擎的支撑。它能对采集的原始数据进行自动预处理、多模态对齐、动作语义提取与质量评估,甚至预测该数据在目标机器人上的表现效果,实现“一站式标注与交付”。

数据即服务:构建具身智能的“基础设施”

值得注意的是,尽管觅蜂隶属于智元机器人,但其定位是面向全行业的To B数据服务平台。这意味着,即便是智元的竞争对手,也可以购买其数据服务。

“我们提供‘使用权’和‘所有权’两种交易模式,”姚卯青强调,“所有数据交易都基于严格协议,确保安全与合规。”这种开放策略,意在推动行业共建数据生态,而非陷入“数据孤岛”。

按计划,觅蜂将在2026年实现千万小时级数据产能,2030年迈向百亿小时级——这不仅是量的飞跃,更是具身智能走向规模化落地的关键一步。

当大模型仍在“读万卷书”,具身智能终于迎来了“行万里路”的数据引擎。而这场由觅蜂开启的数据革命,或许将真正让机器人“活”在真实世界里。

标签: 具身智能 数据服务 无本体采集 机器人 AI基础设施

相关文章

AI算力引爆产业变革:芯片到机器人的连锁反应

科技浪潮下的产业变局:从AI算力到智能终端的连锁反应 近期科技产业动态频出,从芯片制造到机器人落地,从仓储智能化到车企战略调整,一系列动作背后,折射出全球科技巨头在AI驱动下的战略布局与产业重构。在这...

Claude Opus 4.7:AI从聊天走向自主做事

从“会聊天”到“能做事”:Claude Opus 4.7 的范式跃迁 人工智能的竞争正在悄然转向。过去,我们衡量大模型优劣的标准往往是“对话是否流畅”“回答是否自然”,而如今,真正的分水岭已落在“它能...

高德发布全球首款开放环境全自主具身机器人

从地图到机器人:高德如何用“ABot”打开AGI新世界的大门? 在大多数人眼中,高德地图是导航、是出行助手,是城市交通的智能“大脑”。但4月19日,在北京亦庄机器人半程马拉松的赛场上,高德用一场震撼的...

Cursor 3重塑开发范式:智能体成代码主力

从“写代码”到“管智能体”:Cursor 3 如何重塑开发范式 当开发者还在适应 AI 辅助编程的“副驾驶”模式时,Anysphere 已经将 Cursor 推向了一个更激进的阶段——智能体优先。最新...

华为星钻手镯表打破珠宝与智能二选一困局

当珠宝遇见智能:华为星钻手镯表如何打破高端腕表的“二选一”困局长久以来,高端女性在腕间配饰的选择上,始终面临一道艰难的二选一:是选择传统高奢珠宝腕表,彰显身份与美学品味?还是拥抱智能穿戴设备,享受健康...

腾讯QClaw用5天打开全球AI智能体市场

从“养虾”到出海:腾讯QClaw如何用5天打开全球AI智能体新市场 4月20日晚,一条来自QClaw团队X账号的简短公告,悄然拉开了中国AI智能体产品走向全球的序幕——QClaw海外版正式开启内测,为...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。