智能驾驶迎来物理AI范式革命
从“数字”到“物理”:智能驾驶的范式革命正在发生
当“物理AI”成为智能汽车行业的热词,一场静默却深刻的技术范式转移正在上演。卓驭科技在北京车展上发布的“面向移动物理AI的原生多模态基础模型”,正是这场变革的标志性产物。在卓驭科技副总裁于贝贝看来,这并非资本叙事下的概念包装,而是一条关乎企业存亡的技术生存法则——“如果不上这条技术路线,很可能今后就跑不出来了。”
物理AI:不只是感知,更是行动
传统智能驾驶系统多依赖“感知-决策-控制”的线性逻辑,将现实世界的信息转化为数字信号,再通过算法推导出最优路径。然而,这种“数字中介”模式存在天然瓶颈:语言转译的延迟、语义理解的偏差,以及跨模态信息融合的割裂感,都限制了系统在复杂物理环境中的实时响应能力。
卓驭提出的“原生多模态基础模型”,正是对这一范式的颠覆。它不再将视觉、音频、动作等输入强行映射到语言空间进行理解,而是让所有模态在预训练阶段就共同参与建模,形成一个统一的“物理世界理解空间”。这意味着,模型天生具备对现实世界的直觉式理解能力,而非依赖语言的二次转译。
正如于贝贝所言:“把所有信息转译到一个语言空间里去理解物理世界,是一种反常识的做法。”真正的智能,应当像人类一样,通过多感官协同直接感知并响应环境。
大模型范式:从“专家”到“基座”的必然跃迁
当前,智能驾驶行业正经历一场“范式切换”的转折点。过去,许多厂商专注于开发针对特定场景的“专家模型”——比如专为高速巡航或泊车设计的独立系统。然而,随着应用场景的泛化需求日益增强,这种碎片化的技术路线逐渐显现出局限性。
卓驭的选择是果断切入“基座模型”赛道。这一决策背后,是对大语言模型发展规律的深刻借鉴:在视觉语言模型的发展中,最终胜出的并非那些功能单一的“看病专家”,而是具备通用能力的“全科医生”。在物理AI领域,这一规律同样适用。
“我们相信演进的规律是一样的。”于贝贝强调。只有构建具备强泛化能力的基座模型,才能支撑起跨车型、跨场景、跨载具的规模化应用。目前,卓驭的模型已初步实现“开箱70分”的基础能力,虽未达“零样本泛化”的理想状态,但已为后续的泛化训练和快速部署打下坚实基础。
商业重构:从“卖硬件”到“卖能力”
技术路线的变革,必然催生商业模式的创新。传统Tier 1厂商依赖“卖硬件+收开发费”的单一盈利模式,在物理AI时代正面临解构。
卓驭已开始探索第二增长曲线:将乘用车技术延伸至Robotaxi、RoboVan等L4级自动驾驶领域,并尝试构建基于订阅制、利润分成和“动作令牌(Action Token)”的新商业形态。其中,“动作令牌”尤为值得关注——它可能代表一种按实际行驶行为或决策复杂度计费的全新价值分配机制,使AI系统的每一次有效行动都具备可量化的商业价值。
这种模式不仅提升了商业灵活性,也促使企业从“一次性交付”转向“持续服务能力”的竞争,真正将AI能力转化为可复用的资产。
新淘汰赛:跨界玩家的入场与护城河的构建
随着物理AI赛道的升温,算法厂商的对手已不再局限于同行。来自数字AI领域的科技巨头、具身智能初创公司,甚至传统车企的自主研发团队,都在加速入场。这场竞赛的维度已全面升级。
在这样的背景下,卓驭的护城河将建立在三个层面:一是原生多模态架构带来的技术领先性;二是跨场景、跨载具的泛化能力;三是基于基座模型构建的开放生态。唯有如此,才能在激烈的淘汰赛中脱颖而出,真正打开属于物理AI的商业空间。
从数字到物理,从感知到行动,智能驾驶的终极形态正在被重新定义。而卓驭的转型,或许正是这场变革中最具代表性的注脚。
标签: 物理AI 智能驾驶 多模态模型 商业创新 具身智能