当前位置:首页 > AI资讯 > 正文内容

谷歌TPU一分为二:AI算力进入分工时代

admin2小时前AI资讯2

当AI进入“分工时代”:谷歌TPU为何一分为二?

在拉斯维加斯的Google Cloud Next大会上,谷歌高级副总裁Amin Vahdat没有展示一枚芯片,而是拿出了两枚——TPU 8t与TPU 8i。这不是简单的产品迭代,而是一场深刻的战略转向:谷歌首次将TPU家族明确“分家”,一枚专攻训练,一枚专注推理。这一举动,标志着AI算力发展从“粗放式全能”迈向“精细化分工”的新阶段。

训练与推理:从“一芯两用”到“术业专攻”

过去,AI芯片往往兼顾训练与推理,像一把瑞士军刀,什么都能干,但未必样样精通。训练如同“学霸啃书”,需要极致算力与海量内存,目标是锤炼出强大的模型;而推理则像“学霸上岗”,面对的是高频、低延迟、低成本的实时响应需求。

在AI早期,模型规模较小、应用场景有限,统一架构尚可应付。但随着Agentic AI(智能体AI)的崛起,推理负载呈指数级增长。一个AI智能体完成一项任务,可能需要调用数十次模型推理,事务量是普通聊天机器人的20到50倍。此时,若仍用昂贵的训练芯片跑推理,无异于“用洲际导弹送外卖”——性能过剩,成本失控。

谷歌正是看准了这一痛点,果断将芯片“一分为二”。TPU 8t专攻训练,追求极致算力与扩展性;TPU 8i则聚焦推理,目标是“又快又省”。

TPU 8i:为Agent时代量身打造的“推理暴君”

TPU 8i的设计哲学,是“精准打击”推理场景的核心瓶颈。

首先,它大幅强化了“短期记忆”——片上SRAM扩容3倍。这意味着芯片能更快访问关键数据,减少频繁读取外部内存带来的延迟与能耗。配合288GB的HBM高带宽内存,TPU 8i在处理复杂、多步推理任务时,几乎不会“卡顿”,堪称专为Agent设计的“思维加速器”。

更关键的是能效比。TPU 8i的能效较上一代提升117%,意味着在相同电力成本下,可支撑近双倍的推理服务。在数据中心电力日益成为瓶颈的今天,这一提升直接转化为商业竞争力。谷歌云人工智能与计算基础架构副总裁Mark Lohmeyer直言:“关键在于以最低的单次交易成本实现最低延迟。交易量在飙升,成本必须大幅下降,才能实现规模化。”

为什么是现在?Agentic AI引爆推理需求

谷歌的“分家”策略,背后是AI产业的结构性转变。过去两年,硅谷的风向已从“大模型狂热”转向“智能体热”。AI不再只是聊天工具,而是能自主接任务、调用工具、持续工作的“数字员工”。

据Gartner预测,到2026年底,40%的企业应用将嵌入特定任务的AI Agent。麦肯锡则估计,到2030年,Agentic AI带来的商业机会高达3万亿至5万亿美元。然而,技术再先进,若推理成本居高不下,商业化落地便无从谈起。

这正是谷歌TPU 8i的“偷家”逻辑:不打最贵的仗(不盲目比拼训练算力),只割最肥的肉(抢占高增长、高价值的推理市场)。它不正面硬刚英伟达的H100、B200,而是从企业最痛的“运营成本”切入,用极致性价比赢得市场。

生态联盟初现:Meta与Anthropic的站队

谷歌的预判,正被市场用真金白银验证。Meta与Anthropic已成为TPU v8系列的首批客户。Anthropic确认其下一代模型已在TPU 8t集群上运行数月,并计划持续合作;Meta则可能将TPU 8i用于其大规模推理服务,以降低运营成本。

这不仅是技术选择,更是生态站队。随着AI进入“分工时代”,算力供应商的角色也在分化:有人做“重装备”,有人做“轻骑兵”。谷歌显然押注后者——用专业化芯片,服务专业化场景。

未来,AI算力或将像现代工厂的流水线,训练与推理各司其职,高效协同。而TPU 8i,正是这场变革的先锋。

标签: AI芯片 TPU 8i Agentic AI 谷歌云 推理优化

相关文章

无人车与机器人重塑物流闭环

从“最后1公里”到“最后10米”:无人车与机器人如何重塑物流闭环 4月16日,一则看似低调却意味深长的合作官宣,悄然拉开了智能物流新阶段的序幕。自动驾驶企业佑驾创新(2431.HK)与全球知名智能终端...

行云芯片用LPDDR重构AI推理成本逻辑

从“天才少年”到芯片创业者:行云如何重构AI推理的成本逻辑 在AI大模型狂奔突进的今天,算力的军备竞赛正悄然从“性能至上”转向“成本优先”。当千亿参数模型成为标配,传统以HBM(高带宽内存)为核心的G...

Claude Opus 4.7:AI从聊天走向自主做事

从“会聊天”到“能做事”:Claude Opus 4.7 的范式跃迁 人工智能的竞争正在悄然转向。过去,我们衡量大模型优劣的标准往往是“对话是否流畅”“回答是否自然”,而如今,真正的分水岭已落在“它能...

谷歌开源Gemma 4重塑轻量级智能体生态

谷歌开源新里程碑:Gemma 4 如何重塑轻量级智能体生态 在开源大模型领域,谷歌再次迈出关键一步。最新发布的 Gemma 4 系列不仅延续了前代对轻量化与高性能的追求,更通过引入多模态能力、智能体原...

AI算力重构与商业航天共振

算力重构与星辰大海:AI与商业航天的双重变奏 当人工智能的浪潮席卷全球,算力正从幕后走向台前,成为驱动技术演进的核心引擎。与此同时,商业航天也在悄然提速,从遥不可及的星辰梦想,逐步落地为可量产、可复用...

从RAG到CAG:企业级AI系统的上下文进化

从 RAG 到 CAG:企业级 AI 系统的上下文进化 检索增强生成(RAG)作为当前企业集成大语言模型的主流范式,已在知识问答、智能客服等场景中展现出强大的实用性。它通过将外部知识库的检索结果注入模...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。