当前位置:首页 > AI资讯 > 正文内容

昇腾拒绝捷径:构建自主AI算力体系

admin3小时前AI资讯4

当算力竞赛进入深水区:昇腾为何拒绝“捷径”?

AI 行业的浪潮从未停歇。从大模型的爆发到 Agent 应用的井喷,技术热点的切换速度令人目不暇接。然而,在表层喧嚣之下,一个底层趋势愈发清晰:模型规模的指数级增长、调用频率的持续提升以及应用复杂度的不断攀升,正合力推高对算力的渴求。当单纯依靠堆叠硬件已难以为继,开发者开始寻求一套成熟、稳定、覆盖全链路的体系作为支撑——这正是 CUDA 在过去十余年里构建起的坚固护城河。它不仅提供算力,更定义了从编程模型到部署流程的完整标准。

在这样的背景下,一个关键问题浮出水面:面对 CUDA 生态的闭环优势,后来者究竟该选择兼容并蓄,还是另起炉灶?华为昇腾团队给出了自己的答案:不做 CUDA 兼容层,坚持构建自主体系

从“能跑起来”到“体系重构”:底层逻辑的质变

在 AI 基础设施发展的早期,核心目标是“能不能跑起来”。那时的评判标准相对简单:框架是否可用、性能指标是否达标。但随着大模型进入工程化与规模化阶段,系统瓶颈已从“单点能力不足”转向“整体链路是否匹配真实负载”。

以 DeepSeek V4 的首发适配为例,其背后反映的正是这一深层转变。面对长序列带来的访存压力、低精度训练成为主流、MoE 等复杂架构的涌现,传统的软件优化或算子补丁已无法根本解决问题。昇腾团队意识到,若底层结构不改变,上层生态便难以真正建立。

这一认知促使昇腾在 2025 年前后“痛下决心”,不再围绕局部问题修修补补,而是从芯片与系统底层重新设计。最新一代昇腾 950 芯片在多个维度实现突破:编程模型更贴近主流并行计算范式,降低开发迁移成本;引入细粒度访存机制,减少大模型场景下的无效带宽消耗;提前支持 FP8 等低精度计算,提升吞吐能力以支撑更大模型规模。有客户在测试不到一周后便做出下单决策,足见其实际效能已获市场认可。

为何不选择“CUDA 兼容层”?一场关于自主权的博弈

面对 CUDA 生态的成熟与稳定,最现实的路径似乎是构建兼容层——通过接口对齐与生态复用,降低开发者迁移门槛。这是一条常见且高效的路,但昇腾却选择了另一条更艰难的道路。

华为张良在分享中直言:“如果基于 CUDA 来做,那我们做的一切生态发展,都无法彻底自主。”这句话揭示了问题的本质:技术依附意味着主动权的丧失。一旦核心体系建立在他人的标准之上,无论投入多少工程资源,最终强化的仍是原有系统,而非自身能力。

更深层的问题在于技术演进的主动权。当关键能力受限于既有框架,新特性难以落地,长期积累更无从谈起。张良指出:“一旦出现危机的时刻,这一套体系做不到,你的特性在里面就没了。”这里的“特性”,不仅是具体功能,更是体系持续演进的空间与可能性。

因此,昇腾采取了一种“分层处理”的策略:在虚拟指令集、编译器、运行时等底层关键环节坚持自研,确保技术自主;而在开发接口与使用方式上,则主动适配主流框架(如 PyTorch、TensorFlow),使开发者能在熟悉的环境中无缝使用昇腾系统。这种“底层独立、上层对齐”的思路,既避免了生态割裂,又保障了长期演进的自主性。

通用架构的远见:不止于“跑得更快”

在专用加速芯片兴起的背景下,针对特定场景深度优化往往能带来短期效率优势。但昇腾团队明确表示,并未沿此路径推进,而是坚持通用架构方向。原因在于:如果系统能力被限定在特定场景中,就很难形成外溢效应,也无法支撑多样化应用的持续增长

这一选择背后,是对 AI 发展规律的深刻理解。模型形态持续演化,负载类型不断扩展,开发范式也在快速迭代。一套真正有生命力的基础设施,必须能够承载这些变化,而非仅服务于当下。昇腾的目标,不是让模型“跑得更快”,而是构建一个能够随 AI 演进不断成长的体系。

从 DeepSeek V4 的首发适配可见,昇腾正在用实际行动证明:放弃兼容 CUDA 的“捷径”,并非退而求其次,而是一次围绕“体系”的重构。这场竞争,早已超越算力性能的比拼,进入生态自主与长期演进的深水区。

标签: AI基础设施 昇腾生态 CUDA替代 自主架构 大模型算力

相关文章

英伟达开源量子AI模型家族Ising

量子计算的“操作系统”来了?英伟达开源 Ising 模型家族当人们还在讨论大模型如何重塑经典计算世界时,英伟达已将目光投向更遥远的未来——量子计算的实用化。2026年4月,黄仁勋主导的 NVIDIA...

MaxHermes云端沙箱开启AI自主进化新纪元

从“执行者”到“进化者”:MaxHermes开启AI助手新纪元在人工智能技术迅猛发展的今天,AI助手早已不再是简单的问答工具或任务执行者。它们正逐步演变为具备自主学习与持续进化能力的智能体。近日,Mi...

中国AI日均调用量破140万亿

日均140万亿词元调用背后:中国AI商业化进入“高速车道” 4月16日,国家统计局在国新办新闻发布会上公布了一组令人瞩目的数据:截至今年3月,我国人工智能日均词元(Token)调用量已突破140万亿,...

Claude Opus 4.7:AI从聊天走向自主做事

从“会聊天”到“能做事”:Claude Opus 4.7 的范式跃迁 人工智能的竞争正在悄然转向。过去,我们衡量大模型优劣的标准往往是“对话是否流畅”“回答是否自然”,而如今,真正的分水岭已落在“它能...

极氪8X量产中国首款Grok+FSD车型

从实验室到方向盘:中国首个“Grok+FSD”体验正式落地 2026年4月17日,极氪全新旗舰SUV极氪8X正式量产上市,一个更具里程碑意义的消息随之揭晓——搭载阶跃Step 3.5 Flash等核心...

机器人迎来GPT-3时刻:π0.7实现自主思考

机器人终于迎来了它的“GPT-3时刻” 当人们还在争论具身智能是否真的能走向通用时,Physical Intelligence(PI)用一款名为 π0.7 的VLA(视觉-语言-动作)模型,给出了一个...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。