当前位置:首页 > AI资讯 > 正文内容

商汤绝影Sage端侧大模型颠覆车载AI格局

admin2个月前 (04-22)AI资讯108

端侧智能体的破局者:商汤绝影Sage如何改写车载AI格局

当AI全面迈入智能体时代,汽车行业却长期陷入一个尴尬的“两难”:依赖云端大模型实现复杂任务处理,意味着高延迟与高成本;而坚守端侧部署,又只能实现简单的指令响应,难以支撑真正的“主动智能”。直到2026年4月22日,商汤绝影发布端侧多模态智能体基座大模型Sage,这一僵局终于被打破。

Sage不仅是业内首款在车端实现复杂智能体能力的基座大模型,更以惊人的效率与性能,重新定义了端侧AI的可能性。

小模型,大能力:32B总参、3B激活的MoE架构

Sage采用混合专家(MoE)架构,总参数量达320亿,但激活参数仅30亿。这意味着在推理过程中,模型仅动态调用部分专家网络,极大降低了算力需求。这一设计使其成功部署于英伟达Orin X车规级芯片平台,真正实现了“云端能力,端侧落地”。

更令人惊叹的是,Sage在权威Agent评测基准PinchBench上的表现:其最佳任务完成率高达94%,超越Claude-Opus-4.6(93.3%)、GPT-5.4(90.5%)等一众主流云端大模型。这彻底颠覆了“只有大模型才能做好智能体任务”的行业认知。

以小米MiMo-v2-Pro为例,其激活参数高达42B,总参数量超1T,而Sage仅需其1/14的激活算力、约1/31的显存占用,却在任务完成率上反超6.6个百分点。这种“小而强”的技术路线,展现了端侧原生架构的极致效率。

两大黑科技:SCOUT与ERL,让模型“会学习、不犯错”

Sage之所以能在端侧实现复杂智能体能力,核心在于商汤绝影自研的两项后训练技术:SCOUT与ERL。

SCOUT(分级协同学习框架) 解决了大模型学习复杂任务时成本高、试错慢的难题。传统方法依赖大模型自行探索任务路径,既耗时又耗算力。SCOUT创新性地采用“探路与吸收解耦”机制:先由轻量级小模型快速遍历任务空间,筛选出可行路径,再将高价值经验注入主模型。这一“小模型探路,大模型吸收”的协同学习模式,使Sage在学习复杂出行场景任务时,GPU小时消耗降低约60%。

ERL(错误步骤回滚学习机制) 则聚焦任务执行的稳定性。在真实场景中,智能体常因某一步骤出错导致整体任务失败。ERL让模型具备“自我纠错”能力:当检测到错误操作时,系统自动回滚至最近正确状态,并记录错误路径用于后续学习。这一机制使Sage在复杂多步任务中的成功率提升20%,真正实现“说到做到”的闭环执行。

从“听懂指令”到“独立办成事”:智能座舱的范式跃迁

过去,车载语音助手只能完成“打开空调”“播放音乐”等单步指令。而Sage的出现,标志着智能座舱从“被动响应”迈向“主动服务”。

例如,用户说“帮我安排明天上午的会议并提醒我带资料”,Sage不仅能调用日历系统创建会议,还会主动关联过往行程,提醒用户提前出发,甚至联动智能家居提前准备会议资料。这种跨场景、多工具协同的复杂能力,正是PinchBench所重点考察的“任务闭环执行”能力。

更重要的是,Sage可无缝接入OpenClaw、Hermes等主流Agent框架,为开发者提供标准化接口。这意味着车企可基于Sage快速构建个性化智能体应用,覆盖出行、家庭、办公等全场景,真正实现“一芯多能”。

超级智能体的基石:Sage Box即将亮相北京车展

在即将开幕的北京车展上,商汤绝影将正式发布搭载Sage的硬件载体——Sage Box。这一车载智能体计算单元,将成为汽车迈入“超级智能体时代”的核心引擎。

未来,车辆不再只是交通工具,而是具备持续学习、自主决策能力的“移动智能伙伴”。而Sage所代表的端侧原生技术路线,或将成为智能汽车竞争的新制高点。

当云端与端侧的界限逐渐模糊,真正的智能,或许就藏在那3B激活参数的轻量化身躯之中。

标签: 商汤绝影 Sage大模型 端侧AI 智能座舱 PinchBench

相关文章

行云芯片用LPDDR重构AI推理成本逻辑

从“天才少年”到芯片创业者:行云如何重构AI推理的成本逻辑 在AI大模型狂奔突进的今天,算力的军备竞赛正悄然从“性能至上”转向“成本优先”。当千亿参数模型成为标配,传统以HBM(高带宽内存)为核心的G...

物理AI时代汽车芯片的颠覆性革命

从“控制轮子”到“整车智能体”:物理AI时代的芯片革命 当智能汽车从“会说话的轮子”迈向真正的“物理AI智能体”,一场底层架构的范式转移正在悄然发生。过去十年,智能驾驶的核心任务是“感知环境、规划路径...

AI算力重构与商业航天共振

算力重构与星辰大海:AI与商业航天的双重变奏 当人工智能的浪潮席卷全球,算力正从幕后走向台前,成为驱动技术演进的核心引擎。与此同时,商业航天也在悄然提速,从遥不可及的星辰梦想,逐步落地为可量产、可复用...

从RAG到CAG:企业级AI系统的上下文进化

从 RAG 到 CAG:企业级 AI 系统的上下文进化 检索增强生成(RAG)作为当前企业集成大语言模型的主流范式,已在知识问答、智能客服等场景中展现出强大的实用性。它通过将外部知识库的检索结果注入模...

腾讯QClaw用5天打开全球AI智能体市场

从“养虾”到出海:腾讯QClaw如何用5天打开全球AI智能体新市场 4月20日晚,一条来自QClaw团队X账号的简短公告,悄然拉开了中国AI智能体产品走向全球的序幕——QClaw海外版正式开启内测,为...

AI让孕期可视化,奇世智能重塑母婴体验

从“听胎心”到“见成长”:AI如何重塑母婴智能硬件生态 当95后、00后逐渐成为育儿主力军,他们对科学育儿、情感陪伴与效率提升的追求,正在推动母婴行业进入一个全新的智能化时代。在这一背景下,专注于AI...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。