阿里云重构云架构应对AI Agent时代
从“为人服务”到“为AI服务”:阿里云为何要重构自己?
过去几年,云计算行业的关键词一直在变。从“上云”到“云上跑AI”,再到“算力军备竞赛”,行业的焦点始终围绕着如何更高效地为人提供计算资源。但今年,一个根本性的转变正在发生:云的主要使用者,正在从“人”变成“AI Agent”。
这一变化看似悄然,实则深刻。当AI不再只是工具,而是能自主决策、执行复杂任务的“数字劳动者”时,整个云计算的底层逻辑都面临重构。而阿里云,正在成为这场变革中最激进的推动者。
Agent时代:云的“用户”变了
如果你参加过近几年的云峰会,会发现一个明显趋势:过去大家讨论的是“怎么把服务器搬上云”“哪家GPU便宜”“模型推理延迟多高”,而今年,几乎所有厂商都在追问同一个问题——如何让AI Agent自主使用云?
这背后,是AI工作方式的根本转变。以内容创作为例,一个AI Agent如今可以自动扫描数十个信源、提炼观点、生成选题、起草初稿。整个过程,人类只需下达一句指令,而背后可能涉及上百次对云资源的调用:调模型推理、读存储数据、查实时信息、做语义匹配……真正频繁使用云服务的,不再是开发者,而是永不下线的AI。
阿里云公共云事业部总裁刘伟光在峰会上指出:AI劳动者的规模比人类多出N个数量级,且能24×7不间断运行。这意味着,云系统必须从“人机交互系统”进化为“机器执行系统”。
三大挑战:云必须被重写
当服务对象从人变为Agent,传统云架构暴露出三大结构性难题:
-
Agent看不懂云
现有云控制台是为人类设计的图形界面,而AI需要的是标准化接口和机器可读的“说明书”。阿里云的解决方案是推出100多个云产品Skill,将存储、数据库、网络等功能封装成可被Agent直接调用的原子能力。 -
海量Agent的调度难题
上百万Agent同时执行任务,对资源调度、隔离和成本控制提出全新要求。传统云的稳态负载模型不再适用,必须重构调度引擎与计费体系。 -
安全边界的重新定义
传统云安全防的是“坏人”,而Agent时代要防的是“好心办坏事”的AI。李飞飞曾指出:“很多人问的第一个问题就是,你把任务交给Agent后,如何确保它不会失控?”这要求云厂商建立全新的AI行为审计与权限控制机制。
这三个问题指向同一个结论:不是简单在云上叠加AI功能,而是要用Agent的逻辑,从头重写云。
全栈重构:从芯片到入口的系统性变革
阿里云的回应是彻底的。在5月20日的峰会上,其发布了一套覆盖四层架构的Agent原生基础设施:
- 芯片层:推出搭载自研真武M890芯片的超节点服务器,专为高并发AI任务优化;
- 模型层:发布国内领先的旗舰模型Qwen3.7-Max,强化复杂推理与工具调用能力;
- 平台层:升级百炼推理平台,支持Agent自主编排任务流;
- 入口层:重写云控制台,以“Skill”为核心构建机器优先的交互范式。
更关键的是,阿里云宣布将在今年内完成所有60多个云产品的控制面改造,使Agent成为优先用户。例如,OSS已推出Agent版,可自动优化冷存储策略;瑶池数据库内置Agent,能自主执行查询优化与故障恢复。
这一系列动作背后,是阿里云对未来的清晰判断:未来的云,不是“人用的云”,而是“AI用的云”。
商业验证:增长背后的战略定力
这场重构并非空谈。就在峰会前一周,阿里财报显示:AI相关收入连续11个季度保持三位数增长,百炼平台年度经常性收入(ARR)突破80亿元,消息公布当日股价大涨8%。
据行业人士透露,阿里云在大模型即服务(MaaS)市场已是国内第一,且在国际通用标准下(以大语言模型为核心)持续领跑。这份成绩单,印证了其“All in Agent”战略的前瞻性。
从财报到峰会,阿里云没有丝毫犹豫。正如吴泳铭所言,Agent时代是一场“计算范式的革命”。而阿里云,正用一场从芯片到入口的全栈重构,回应这场革命。
当云的服务对象从人变为AI,这场变革才刚刚开始。而阿里云的选择是:不是适应变化,而是重新定义云本身。
标签: 云计算 AI Agent 阿里云 MaaS 基础设施重构