当前位置:首页 > AI资讯 > 正文内容

谷歌TPU一分为二:AI算力进入分工时代

admin2个月前 (04-30)AI资讯90

当AI进入“分工时代”:谷歌TPU为何一分为二?

在拉斯维加斯的Google Cloud Next大会上,谷歌高级副总裁Amin Vahdat没有展示一枚芯片,而是拿出了两枚——TPU 8t与TPU 8i。这不是简单的产品迭代,而是一场深刻的战略转向:谷歌首次将TPU家族明确“分家”,一枚专攻训练,一枚专注推理。这一举动,标志着AI算力发展从“粗放式全能”迈向“精细化分工”的新阶段。

训练与推理:从“一芯两用”到“术业专攻”

过去,AI芯片往往兼顾训练与推理,像一把瑞士军刀,什么都能干,但未必样样精通。训练如同“学霸啃书”,需要极致算力与海量内存,目标是锤炼出强大的模型;而推理则像“学霸上岗”,面对的是高频、低延迟、低成本的实时响应需求。

在AI早期,模型规模较小、应用场景有限,统一架构尚可应付。但随着Agentic AI(智能体AI)的崛起,推理负载呈指数级增长。一个AI智能体完成一项任务,可能需要调用数十次模型推理,事务量是普通聊天机器人的20到50倍。此时,若仍用昂贵的训练芯片跑推理,无异于“用洲际导弹送外卖”——性能过剩,成本失控。

谷歌正是看准了这一痛点,果断将芯片“一分为二”。TPU 8t专攻训练,追求极致算力与扩展性;TPU 8i则聚焦推理,目标是“又快又省”。

TPU 8i:为Agent时代量身打造的“推理暴君”

TPU 8i的设计哲学,是“精准打击”推理场景的核心瓶颈。

首先,它大幅强化了“短期记忆”——片上SRAM扩容3倍。这意味着芯片能更快访问关键数据,减少频繁读取外部内存带来的延迟与能耗。配合288GB的HBM高带宽内存,TPU 8i在处理复杂、多步推理任务时,几乎不会“卡顿”,堪称专为Agent设计的“思维加速器”。

更关键的是能效比。TPU 8i的能效较上一代提升117%,意味着在相同电力成本下,可支撑近双倍的推理服务。在数据中心电力日益成为瓶颈的今天,这一提升直接转化为商业竞争力。谷歌云人工智能与计算基础架构副总裁Mark Lohmeyer直言:“关键在于以最低的单次交易成本实现最低延迟。交易量在飙升,成本必须大幅下降,才能实现规模化。”

为什么是现在?Agentic AI引爆推理需求

谷歌的“分家”策略,背后是AI产业的结构性转变。过去两年,硅谷的风向已从“大模型狂热”转向“智能体热”。AI不再只是聊天工具,而是能自主接任务、调用工具、持续工作的“数字员工”。

据Gartner预测,到2026年底,40%的企业应用将嵌入特定任务的AI Agent。麦肯锡则估计,到2030年,Agentic AI带来的商业机会高达3万亿至5万亿美元。然而,技术再先进,若推理成本居高不下,商业化落地便无从谈起。

这正是谷歌TPU 8i的“偷家”逻辑:不打最贵的仗(不盲目比拼训练算力),只割最肥的肉(抢占高增长、高价值的推理市场)。它不正面硬刚英伟达的H100、B200,而是从企业最痛的“运营成本”切入,用极致性价比赢得市场。

生态联盟初现:Meta与Anthropic的站队

谷歌的预判,正被市场用真金白银验证。Meta与Anthropic已成为TPU v8系列的首批客户。Anthropic确认其下一代模型已在TPU 8t集群上运行数月,并计划持续合作;Meta则可能将TPU 8i用于其大规模推理服务,以降低运营成本。

这不仅是技术选择,更是生态站队。随着AI进入“分工时代”,算力供应商的角色也在分化:有人做“重装备”,有人做“轻骑兵”。谷歌显然押注后者——用专业化芯片,服务专业化场景。

未来,AI算力或将像现代工厂的流水线,训练与推理各司其职,高效协同。而TPU 8i,正是这场变革的先锋。

标签: AI芯片 TPU 8i Agentic AI 谷歌云 推理优化

相关文章

MaxHermes云端沙箱开启AI自主进化新纪元

从“执行者”到“进化者”:MaxHermes开启AI助手新纪元在人工智能技术迅猛发展的今天,AI助手早已不再是简单的问答工具或任务执行者。它们正逐步演变为具备自主学习与持续进化能力的智能体。近日,Mi...

中国AI换道超车:Agent时代的新突破

从“追赶者”到“领跑者”:中国AI的换道超车 当2026年第一季度的数据浮出水面,一个令人震惊的事实浮出水面:中国大模型的Token日均调用量首次超越美国。这一数字背后,不是用户基数的爆发,而是单个用...

腾讯混元3D世界模型2.0开启AI造世界新纪元

AI 迈入“造世界”时代:腾讯混元世界模型 2.0 开启 3D 创作新纪元 当 AI 还在“画图”“对话”“生成视频”的赛道上激烈竞争时,腾讯已经悄然将战场推向了更宏大的维度——创造完整、可交互的 3...

物理AI时代汽车芯片的颠覆性革命

从“控制轮子”到“整车智能体”:物理AI时代的芯片革命 当智能汽车从“会说话的轮子”迈向真正的“物理AI智能体”,一场底层架构的范式转移正在悄然发生。过去十年,智能驾驶的核心任务是“感知环境、规划路径...

机器人ToB规模化提速:数据短板仍是核心卡点

机器人ToB规模化提速:数据短板仍是核心卡点 近年来,机器人正以前所未有的速度渗透进工业制造、物流仓储、医疗服务等多个ToB(面向企业)场景。从仓储自动化中的拆码垛自主决策,到汽车工厂中流利架分拣与工...

从RAG到CAG:企业级AI系统的上下文进化

从 RAG 到 CAG:企业级 AI 系统的上下文进化 检索增强生成(RAG)作为当前企业集成大语言模型的主流范式,已在知识问答、智能客服等场景中展现出强大的实用性。它通过将外部知识库的检索结果注入模...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。