<?xml version="1.0" encoding="utf-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0"><channel><title>玖捌肆贰</title><link>https://9842.cn/</link><description>玖捌肆贰AI集中营</description><item><title>腾讯云发布全球Agent生态底座全栈升级方案</title><link>https://9842.cn/?id=409</link><description>&lt;h2 id=&quot;aiaiagent&quot;&gt;从“能用AI”到“用好AI”：腾讯云如何重构全球Agent生态底座&lt;/h2&gt;
&lt;p&gt;当AI从概念验证走向业务落地，企业关注的焦点已悄然转变——不再是“要不要用AI”，而是“如何把AI Agent真正用起来”。在5月28日香港首届Tencent Cloud Day上，腾讯云用一场全栈升级给出了自己的答案：不仅发布专为Agent设计的原生基础设施，更将旗下多款AI产品推向全球市场，标志着其AI出海战略进入深水区。&lt;/p&gt;
&lt;h3 id=&quot;agent&quot;&gt;Agent基建全面重构：为智能体打造“专属操作系统”&lt;/h3&gt;
&lt;p&gt;传统云计算架构在面对AI Agent时显得力不从心。Agent的爆发式唤醒、长时间任务执行、多智能体协同等特性，对运行时环境提出全新挑战。为此，腾讯云推出全新升级的&lt;strong&gt;Agent Runtime&lt;/strong&gt;，构建覆盖运行、存储、记忆与安全访问的“Agent Infra”原生底座。&lt;/p&gt;
&lt;p&gt;在运行层，&lt;strong&gt;Agent Sandbox&lt;/strong&gt;实现50毫秒级极速唤醒，较主流方案提速20倍，真正做到“按需启动、闲时释放”，帮助企业节省70%的闲置算力成本。这意味着Agent不再是常驻后台的“重负载”，而是像真正的员工一样，只在需要时上线工作。&lt;/p&gt;
&lt;p&gt;存储层面，腾讯云推出&lt;strong&gt;Agent CBS&lt;/strong&gt;与&lt;strong&gt;Agent Bucket&lt;/strong&gt;两大新品。前者采用按实际容量计费的创新模式，让存储资源也能像算力一样弹性伸缩；后者则为亿级用户提供专属云空间，并支持原生多模态语义检索，覆盖从数据传输到智能查询的全链路需求。&lt;/p&gt;
&lt;p&gt;更关键的是记忆能力的突破。通过&lt;strong&gt;Context卸载&lt;/strong&gt;与&lt;strong&gt;符号化记忆技术&lt;/strong&gt;，Agent Memory在降低60% Token消耗的同时，将长任务成功率提升30%。这意味着Agent能更“聪明”地记住上下文，避免重复计算，在复杂业务流程中表现更稳定。&lt;/p&gt;
&lt;p&gt;安全方面，&lt;strong&gt;Agent Gateway&lt;/strong&gt;引入零信任与零凭证机制，使Agent无需接触企业真实凭证即可安全访问内部系统，极大降低了数据泄露风险。&lt;/p&gt;
&lt;h3 id=&quot;skillai&quot;&gt;“Skill化”云产品：让AI像人一样“会操作”&lt;/h3&gt;
&lt;p&gt;如果说基础设施是Agent的“身体”，那么技能就是它的“双手”。腾讯云正将100多款云产品能力封装为&lt;strong&gt;Tencent Cloud Infra Skill&lt;/strong&gt;，用户只需通过自然语言对话，就能让Agent完成资源查询、部署、运维等操作，彻底告别复杂的控制台操作。&lt;/p&gt;
&lt;p&gt;这一变革背后是&lt;strong&gt;SkillHub&lt;/strong&gt;的强力支撑——上线仅两个月，该平台已汇聚超76万个Skills，覆盖开发、办公、运维等场景，下载量突破3000万次。开发者可以快速调用这些“预制技能”，大幅降低Agent应用的开发门槛。&lt;/p&gt;
&lt;h3 id=&quot;_1&quot;&gt;全球化提速：三款核心产品同步出海&lt;/h3&gt;
&lt;p&gt;此次发布会上，腾讯云同时宣布&lt;strong&gt;WorkBuddy&lt;/strong&gt;、&lt;strong&gt;Miora&lt;/strong&gt;和&lt;strong&gt;TokenHub&lt;/strong&gt;正式面向海外市场开放，形成“效率+创意+平台”的完整出海矩阵。&lt;/p&gt;
&lt;p&gt;作为腾讯AI原生桌面级智能体，WorkBuddy凭借多任务并行处理能力，已成为中国最受欢迎的AI办公工具。第三方数据显示，其月访问量及增速均居PC端AI办公智能体市场首位。此次出海，它将帮助全球办公用户提升数据分析与日常任务处理效率。&lt;/p&gt;
&lt;p&gt;AI创意工作室&lt;strong&gt;Miora国际版&lt;/strong&gt;同步开启邀测，支持生成图片、视频、UI/UX甚至3D内容，为创作者提供一站式多模态内容生产平台。而&lt;strong&gt;TokenHub&lt;/strong&gt;作为大模型服务平台，则为开发者提供模型调用、训练与部署的全流程支持。&lt;/p&gt;
&lt;p&gt;此外，&lt;strong&gt;腾讯电子签海外版&lt;/strong&gt;也正式上线，适配亚欧美非多地法律框架，结合eKYC人脸核验与主流CA合作，构建全球可信的电子签名解决方案。&lt;/p&gt;
&lt;p&gt;依托覆盖23个地域、66个可用区的全球基础设施，腾讯云正通过&lt;strong&gt;EdgeOne Booster&lt;/strong&gt;边缘AI推理平台，将AI能力下沉至离用户最近的节点，实现毫秒级响应，加速全球核心区域覆盖。&lt;/p&gt;
&lt;p&gt;从香港出发，腾讯云正以更开放、更原生的能力，与全球客户共同迎接Agent时代的到来。正如汤道生所言：“AI的价值不在技术本身，而在业务结果。”当算力、模型与Agent真正打通，全球企业距离“用好AI”的目标，又近了一步。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;标签：&lt;/strong&gt; &lt;code&gt;腾讯云&lt;/code&gt; &lt;code&gt;AI Agent&lt;/code&gt; &lt;code&gt;全球化&lt;/code&gt; &lt;code&gt;云计算&lt;/code&gt; &lt;code&gt;智能体&lt;/code&gt;&lt;/p&gt;</description><pubDate>Thu, 28 May 2026 20:31:13 +0800</pubDate></item><item><title>智象未来：原生多模态通往AGI的World模型</title><link>https://9842.cn/?id=408</link><description>&lt;h2 id=&quot;agi&quot;&gt;从多模态到世界模型：智象未来的AGI路径探索&lt;/h2&gt;
&lt;p&gt;当整个AI行业还在为语言模型的边界反复试探时，智象未来已经悄然将目光投向了更远的“世界”。在2026年5月19日的首届开放日上，这家成立之初便专注多模态大模型的公司，给出了一个清晰的判断：“原生多模态是实现AGI的必经之路。”而这场以“Imaging the World”为主题的活动，真正想传递的信号，或许正是“World”本身。&lt;/p&gt;
&lt;h3 id=&quot;_1&quot;&gt;原生多模态：不止于拼接，而是重构&lt;/h3&gt;
&lt;p&gt;在梅涛看来，当前许多所谓的多模态模型，本质仍是“拼接式”的——将文本、图像、视频等模态分别处理后再进行融合。这种“后期缝合”的方式，难以真正理解跨模态之间的深层关联，更无法支撑对现实世界的完整建模。而智象未来的核心突破，在于其原生全模态Unified Transformer（UiT）架构。&lt;/p&gt;
&lt;p&gt;UiT架构的核心能力是“Any to Any”——支持任意模态的输入与输出。这意味着模型不再依赖独立的编码器或解码器，而是在统一框架下完成跨模态的理解与生成。这种设计不仅提升了效率，更重要的是，它为构建“世界模型”奠定了基础。因为一个能真正模拟现实的系统，必须能同时处理视觉、语言、动作甚至物理反馈，而原生架构正是实现这一目标的底层支撑。&lt;/p&gt;
&lt;h3 id=&quot;agi_1&quot;&gt;世界模型：通往AGI的下一站？&lt;/h3&gt;
&lt;p&gt;尽管“世界模型”一词在2026年已频繁出现在各大科技论坛，但梅涛对此保持谨慎。他坦言，目前市面上多数模型尚不足以被称为真正的世界模型。在智象未来的定义中，一个合格的世界模型需满足四大条件：掌握物理规律、支持长时间跨度的因果推理、实现全模态交互，以及具备绝对的安全性。&lt;/p&gt;
&lt;p&gt;这一定义背后，是对AGI（通用人工智能）路径的深刻思考。当前主流的两大世界模型路线——李飞飞倡导的“生成3D世界”与Yann LeCun主张的“自监督预测世界”——各有侧重，但都面临数据稀缺与高成本的瓶颈。智象未来的选择是另辟蹊径：从算法与架构创新入手，聚焦视频、图像与3D交互数据的生成，通过低成本合成数据突破现实数据采集的局限。&lt;/p&gt;
&lt;p&gt;这一策略不仅降低了训练门槛，更在过程中沉淀出可复用的视觉模型能力。正如梅涛所言：“我们不是要做一个‘像世界’的模型，而是要做一个‘懂世界’的模型。”&lt;/p&gt;
&lt;h3 id=&quot;_2&quot;&gt;从模型到平台：智象未来的商业进化&lt;/h3&gt;
&lt;p&gt;技术愿景之外，智象未来也在加速商业化落地。公司明确转向“1+1+3”MaaS（模型即服务）平台战略：底层是HiDream系列大模型，中间层是HiHarness企业服务平台，上层则聚焦商业营销、影视创作与社媒创作三大场景。&lt;/p&gt;
&lt;p&gt;这一转型标志着智象未来从“模型即产品”向“平台即服务”的跃迁。尤其在视频生成领域，面对Seedance 2.0、GPT Image 2.0等巨头的竞争，智象未来选择深耕垂类赛道，以更高的模态理解精度与更低的推理成本，争夺B端市场。值得注意的是，梅涛特别提醒：“在算力成本大幅下降前，视频生成初创公司应避免与巨头在To C端正面交锋。”这一判断，既是对行业现状的清醒认知，也体现了智象未来务实的发展节奏。&lt;/p&gt;
&lt;p&gt;资本市场的反应印证了其战略价值。继5月完成5亿元B轮融资后，智象未来又在两周内官宣新一轮亿元级融资，投资方包括安徽省产投与东方富海等机构。资本的持续加注，不仅为技术研发提供了弹药，更释放出市场对其“原生多模态+世界模型”路径的认可。&lt;/p&gt;
&lt;h3 id=&quot;_3&quot;&gt;未来已来，但路径未定&lt;/h3&gt;
&lt;p&gt;尽管智象未来尚未自称“世界模型公司”，但其技术布局已清晰指向这一终极目标。在通往AGI的漫长征途中，多模态能力正从“加分项”变为“必选项”。而原生架构、数据创新与平台化运营，构成了智象未来独特的竞争壁垒。&lt;/p&gt;
&lt;p&gt;当行业仍在争论“大模型是否过剩”时，智象未来已经用行动回答：真正稀缺的不是参数规模，而是对世界的理解能力。而这场从“Imaging”到“World”的跃迁，或许正是下一代AI的起点。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;标签：&lt;/strong&gt; &lt;code&gt;多模态大模型&lt;/code&gt; &lt;code&gt;世界模型&lt;/code&gt; &lt;code&gt;AGI&lt;/code&gt; &lt;code&gt;智象未来&lt;/code&gt; &lt;code&gt;原生AI架构&lt;/code&gt;&lt;/p&gt;</description><pubDate>Thu, 28 May 2026 20:30:56 +0800</pubDate></item><item><title>医学AI视觉觉醒：从被动看图到主动思考</title><link>https://9842.cn/?id=407</link><description>&lt;h2 id=&quot;ai&quot;&gt;医学AI的“视觉觉醒”：从被动看图到主动思考&lt;/h2&gt;
&lt;p&gt;长久以来，医学AI的发展似乎陷入了一种“解释幻觉”——模型可以流畅地输出诊断依据和推理过程，但这些文字背后，是否真的“看到”了关键病灶？一个微小的钙化点、一段几秒钟的血管异常搏动，往往决定着生死判断。然而，传统多模态模型只是将影像“喂”给大模型，再生成答案与解释，这种“被动接收”的机制，极易导致&lt;strong&gt;看错区域、漏看病灶、误判结构&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;如今，这一局面正在被打破。上海创智学院 LeapQuest 团队联合浙江大学、上海交通大学、复旦大学，在 ICML 2026 上连续发表两篇重磅论文，首次将 &lt;strong&gt;“Think with Images” 与 “Think with Videos”&lt;/strong&gt; 范式引入医学AI领域。他们提出：&lt;strong&gt;视觉不应只是输入，而应成为推理过程的一部分&lt;/strong&gt;。模型不再只是“看完再解释”，而是在思考中主动“决定看哪里、怎么看、看完如何修正”。&lt;/p&gt;
&lt;p&gt;这一突破，标志着医学AI智能体正迎来关键拐点。&lt;/p&gt;
&lt;h3 id=&quot;_1&quot;&gt;从“写解释”到“用证据思考”&lt;/h3&gt;
&lt;p&gt;传统医学多模态模型的运作逻辑，类似于一个“视觉翻译官”：它将CT、MRI或超声视频编码成特征向量，再交给大模型生成诊断结论与解释。问题在于，这种流程中，&lt;strong&gt;视觉信息是一次性输入的静态快照&lt;/strong&gt;。模型无法在推理过程中“回头再看一眼”某个可疑区域，也无法主动放大、分割或定位关键结构。&lt;/p&gt;
&lt;p&gt;而 LeapQuest 团队提出的 Ophiuchus（面向医学图像）和 MedScope（面向临床长视频）两个系统，彻底改变了这一模式。它们将大模型改造成一个&lt;strong&gt;能与视觉工具协同工作的智能体&lt;/strong&gt;，在推理链中动态调用外部工具，获取新的视觉证据，并据此修正判断。&lt;/p&gt;
&lt;p&gt;以 Ophiuchus 为例，它在诊断过程中可以主动调用 SAM2 进行病灶分割、使用 BiomedParse 根据文字提示定位特定解剖结构，或通过 Zoom-in 放大可疑区域。这些工具调用的结果，不是孤立的数据，而是以“observation”（观察）的形式反馈回推理链，推动模型重新评估之前的假设。&lt;/p&gt;
&lt;p&gt;这意味着，模型不再只是“会写解释”，而是真正开始“用视觉证据思考”。&lt;/p&gt;
&lt;h3 id=&quot;7b-o3-gpt-5&quot;&gt;7B 模型为何能击败 o3 与 GPT-5？&lt;/h3&gt;
&lt;p&gt;令人惊讶的是，在多个医学视觉问答（VQA）基准测试中，仅拥有 70 亿参数的 &lt;strong&gt;Ophiuchus-7B&lt;/strong&gt;，平均得分达到 &lt;strong&gt;68.0&lt;/strong&gt;，超越了 OpenAI-o3（62.2）、Gemini 2.5 Pro（61.8）和 GPT-5（59.9）。更关键的是，其工具调用准确率高达 &lt;strong&gt;97.9%&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;这一结果揭示了医学AI的一个深层规律：&lt;strong&gt;在真正依赖细粒度视觉证据的任务中，模型规模并非决定性因素&lt;/strong&gt;。o3 和 GPT-5 虽然语言能力更强，但在“看”的能力上，仍受限于被动输入机制。它们可能“说得头头是道”，却未必“看得清清楚楚”。&lt;/p&gt;
&lt;p&gt;而 Ophiuchus 的优势，正在于它让模型学会了“&lt;strong&gt;何时看、看哪里、怎么看&lt;/strong&gt;”。例如，在面对一张肺部CT时，模型可能先初步判断“疑似结节”，但随即调用分割工具确认边界是否清晰，再放大观察密度变化。这种“边想边看”的闭环推理，极大提升了诊断的可靠性。&lt;/p&gt;
&lt;h3 id=&quot;_2&quot;&gt;“回看关键时刻”：长视频诊断的新可能&lt;/h3&gt;
&lt;p&gt;如果说 Ophiuchus 解决了静态图像的“精细观察”问题，那么 MedScope 则将这一范式延伸至动态场景——临床长视频，如内窥镜手术录像、超声心动图等。&lt;/p&gt;
&lt;p&gt;在这些场景中，关键信息往往只出现在几秒钟内。传统模型一次性编码整个视频，极易遗漏短暂但关键的异常动作或结构变化。MedScope 的突破在于，它允许模型在推理过程中&lt;strong&gt;主动“回看”特定时间段&lt;/strong&gt;，重新分析某一段视频帧，甚至逐帧比对。&lt;/p&gt;
&lt;p&gt;例如，在判断心脏瓣膜是否反流时，模型可能先基于整体视频做出初步判断，随后调用“回看”工具聚焦于舒张期，观察血流方向是否异常。这种“时间维度的视觉推理”，使得模型能够捕捉到人类医生依赖经验才能发现的细微动态变化。&lt;/p&gt;
&lt;h3 id=&quot;ai_1&quot;&gt;医学AI的新范式：视觉即推理&lt;/h3&gt;
&lt;p&gt;Ophiuchus 与 MedScope 的共同贡献，不仅是技术上的创新，更在于提出了一种全新的医学AI范式：&lt;strong&gt;让视觉证据进入模型的中间思考过程&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;过去，解释是事后的语言包装；如今，解释是推理中的证据查证。模型不再“假装理解”，而是通过工具交互，真正“看见”并“验证”关键信息。这种从“被动接收”到“主动探索”的转变，正是医学AI迈向临床可用的关键一步。&lt;/p&gt;
&lt;p&gt;未来，随着更多视觉工具的集成（如3D重建、多模态对齐、实时反馈），医学AI智能体将不再只是辅助诊断的“黑箱”，而成为医生真正的“视觉协作者”——不仅能看，还能问：“这里是不是有问题？我们再仔细看看。”&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;标签：&lt;/strong&gt; &lt;code&gt;医学AI&lt;/code&gt; &lt;code&gt;多模态模型&lt;/code&gt; &lt;code&gt;视觉推理&lt;/code&gt; &lt;code&gt;智能体&lt;/code&gt; &lt;code&gt;ICML2026&lt;/code&gt;&lt;/p&gt;</description><pubDate>Thu, 28 May 2026 20:30:34 +0800</pubDate></item><item><title>AI重构游戏未来：腾讯发布会揭秘三大原生产品</title><link>https://9842.cn/?id=406</link><description>&lt;h2 id=&quot;ai&quot;&gt;AI，正在重塑游戏的未来&lt;/h2&gt;
&lt;p&gt;5月27日晚，2026年腾讯游戏发布会如约而至。与往年聚焦新游上线、IP联动不同，今年的主角悄然易位——AI，成了整场发布会最耀眼的“One More Thing”。&lt;/p&gt;
&lt;p&gt;尽管新品数量从2025年的24款缩减至15款，但腾讯并未在内容密度上妥协，反而将更多精力倾注于技术底层变革。从《和平精英》中能与玩家协同作战的AI队友“小田”，到《王者荣耀》内置的AI助手“灵宝”，再到电竞赛事中实时解说的AI解说员，AI早已不再是概念，而是悄然融入玩家日常体验的“隐形伙伴”。&lt;/p&gt;
&lt;p&gt;然而，真正引爆全场期待的，是压轴登场的三款AI原生产品：&lt;strong&gt;AI渲染方案「MagicDawn」&lt;/strong&gt;、&lt;strong&gt;模拟经营游戏《数字景德镇·瓷都小匠》&lt;/strong&gt;，以及&lt;strong&gt;AI游戏创作平台「代号Craft」&lt;/strong&gt;。这三者共同勾勒出一个由AI驱动的游戏新生态——从画面呈现、内容生成，到创作流程，AI正在全面渗透游戏产业的核心环节。&lt;/p&gt;
&lt;h3 id=&quot;ai_1&quot;&gt;从渲染到创作：AI如何重构游戏生产链&lt;/h3&gt;
&lt;p&gt;「MagicDawn」是本次技术亮点的重中之重。它基于神经网络实时推理技术，突破了传统全局光照（Global Illumination）在性能和效果上的瓶颈，实现了接近电影级的光影表现。更关键的是，它已完成与Arm的深度适配，可在新一代移动GPU上流畅运行，这意味着高品质渲染不再局限于高端PC或主机，而是真正走向大众设备。&lt;/p&gt;
&lt;p&gt;而腾讯选择将MagicDawn全面开源，这一举动极具战略意义。开源不仅加速了行业技术共享，也倒逼自身持续迭代，更彰显了腾讯在AI渲染领域的信心与野心——它不再只是“使用AI”，而是“定义AI标准”。&lt;/p&gt;
&lt;p&gt;如果说MagicDawn解决了“如何让游戏画面更真实”的问题，那么「代号Craft」则直面“如何让游戏创作更简单”。这个AI游戏创作平台允许用户通过自然语言输入，快速生成2D或3D游戏雏形。无论是“一个会飞的猫在月球上收集星星”，还是“中世纪城堡里的密室逃脱”，AI都能在几分钟内搭建出可玩原型。&lt;/p&gt;
&lt;p&gt;平台还内置了完整的AIGC工具链，并免费开放超一万种预制美术资产，极大降低了美术产能门槛。对于独立开发者、学生团队甚至普通玩家而言，这无疑是通往游戏创作世界的“一键入口”。据悉，该平台即将开启首次测试，或将掀起一场全民游戏创作的浪潮。&lt;/p&gt;
&lt;h3 id=&quot;ai_2&quot;&gt;AI+文化：当游戏成为传承的载体&lt;/h3&gt;
&lt;p&gt;在技术与创意之外，腾讯还展现了AI在文化表达上的潜力。《数字景德镇·瓷都小匠》并非传统意义上的“爆款游戏”，但它意义深远。作为腾讯与景德镇官方联合推出的首款瓷业主题小游戏，它通过多模态AI数据集，融合AI数字人、3D生成等技术，让玩家从学徒做起，逐步成长为窑主，体验千年瓷艺的传承脉络。&lt;/p&gt;
&lt;p&gt;这不仅是一款游戏，更是一次数字文保的创新尝试。AI在这里不再是“效率工具”，而是文化记忆的激活者。它让年轻一代在互动中理解传统工艺，也让非物质文化遗产以全新方式“活”在数字世界。&lt;/p&gt;
&lt;h3 id=&quot;ai_3&quot;&gt;从辅助到主导：AI正在改变游戏行业的游戏规则&lt;/h3&gt;
&lt;p&gt;回顾腾讯在AI领域的布局，可以清晰看到一条演进路径：从早期的客服机器人、内容审核等后端应用，到NPC行为优化、赛事解说等用户体验增强，再到如今深入渲染引擎、创作工具、玩法设计等核心生产环节——AI的角色，正从“辅助者”向“共创者”转变。&lt;/p&gt;
&lt;p&gt;这种全链路的AI能力整合，不仅提升了开发效率，更催生了全新的游戏类型与交互体验。未来，我们或许将看到更多由AI生成的动态剧情、个性化关卡，甚至完全由玩家语音指令驱动的自定义游戏世界。&lt;/p&gt;
&lt;p&gt;更重要的是，腾讯通过开源、合作与产品落地，正在为整个行业铺设一条可复用的AI发展路径。当技术不再高高在上，当创作不再遥不可及，游戏的边界将被无限拓宽。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;标签：&lt;/strong&gt; &lt;code&gt;AI游戏&lt;/code&gt; &lt;code&gt;腾讯游戏&lt;/code&gt; &lt;code&gt;MagicDawn&lt;/code&gt; &lt;code&gt;代号Craft&lt;/code&gt; &lt;code&gt;数字景德镇&lt;/code&gt;&lt;/p&gt;</description><pubDate>Thu, 28 May 2026 14:32:44 +0800</pubDate></item><item><title>金融AI进入“数字员工”时代：阿里云点金发布</title><link>https://9842.cn/?id=405</link><description>&lt;h2 id=&quot;ai&quot;&gt;从辅助到自主：金融AI进入“数字员工”时代&lt;/h2&gt;
&lt;p&gt;2026年，金融与AI的融合不再是“要不要做”的试探性命题，而是“如何做得更好”的实战攻坚。当行业普遍还在讨论大模型能否落地时，阿里云已用“点金”通用智能体的发布，给出了一个清晰的答案：金融AI的奇点时刻已至，真正的变革不再是“外挂式辅助”，而是将AI深度嵌入业务流程，成为能独立执行任务的“数字员工”。&lt;/p&gt;
&lt;h3 id=&quot;ai_1&quot;&gt;金融AI的范式跃迁：从工具到员工&lt;/h3&gt;
&lt;p&gt;过去几年，金融AI的应用多停留在RAG（检索增强生成）和简单问答层面，智能体更像是一个“高级搜索框”。然而，金融业务的复杂性决定了其需要的不是“会聊天的助手”，而是“能干活的专业人才”。阿里云智能集团公共云事业部副总裁张翅指出，2026年将成为金融行业的“智能体元年”——衡量AI价值的标尺，已从“能否跑通Demo”转向“有多少智能体真正嵌入端到端业务流程”。&lt;/p&gt;
&lt;p&gt;这一转变的背后，是金融行业对“可解释性、可审计性、可闭环性”的刚性需求。以风控为例，传统AI模型可能给出“拒绝贷款”的结论，但无法清晰说明决策路径；而“点金”这样的金融通用智能体，不仅能输出结果，还能完整记录推理链条、数据依据与合规检查节点，实现“决策可追溯、过程可审计”。&lt;/p&gt;
&lt;h3 id=&quot;_1&quot;&gt;“点金”进化论：三次跨越，走向自主闭环&lt;/h3&gt;
&lt;p&gt;回顾“点金”的发展历程，清晰呈现出金融智能体的三次关键跨越：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;1.0阶段&lt;/strong&gt;：以Agent平台与RAG技术为基础，实现“让机器读懂金融”，解决信息检索与初步理解问题；&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;2.0阶段&lt;/strong&gt;：通过“双飞轮”机制（数据飞轮+能力飞轮）与行业评测集，实现多任务编排与业务串联，让AI能力在不同场景中自由流转；&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;3.0阶段&lt;/strong&gt;：迈向“Harness新纪元”，打造具备自主规划、长程调度与断点续传能力的“全能数字员工”，真正实现“让智能自主闭环”。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如今的“点金”，已不再是一个被动响应的工具，而是一个能主动理解业务意图、调用专业数据、执行复杂任务（如跑回测、训模型、写报告、做合规审查）的虚拟岗位。正如阿里云新金融解决方案总经理郑淼所言：“我们希望老专家愿意用我们的数字员工，把他们头脑中的业务Skill沉淀下来。”&lt;/p&gt;
&lt;h3 id=&quot;_2&quot;&gt;五大原生能力，构建金融级智能底座&lt;/h3&gt;
&lt;p&gt;“点金”之所以能胜任“数字员工”角色，源于其五大金融原生能力：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;内置十大核心岗位角色&lt;/strong&gt;：开箱即用的分析师、风控员、合规官等角色，让业务经验快速转化为可复用的AI技能（Skill）；&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;全链路合规与可审计&lt;/strong&gt;：每一步操作留痕，满足金融行业强监管要求；&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;顶尖数据直连&lt;/strong&gt;：原生对接Wind、东方财富、盈米且慢等权威数据源，确保输入质量；&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;金融级云上沙箱&lt;/strong&gt;：任务隔离、安全执行，保障系统稳定性；&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;7×24在线与长程调度&lt;/strong&gt;：支持复杂任务的断点续传，适应高频交易、批量处理等场景。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;这些能力并非孤立存在，而是由阿里云“芯-云-模-智”全栈架构支撑。从平头哥真武M890 AI芯片提供的高算力底座，到智算云的安全合规环境，再到Qwen3.7-Max大模型对复杂任务的原生支持，最终通过AgentScope金融版平台实现能力整合。每一层技术都在回答同一个问题：如何让AI在金融场景中跑得快、跑得准、跑得稳。&lt;/p&gt;
&lt;h3 id=&quot;_3&quot;&gt;开源共建，定义行业新标准&lt;/h3&gt;
&lt;p&gt;技术领先之外，阿里云更推动行业生态共建。峰会同期发布的《金融行业Agent百技图》首次提出“金融通用智能体的10大要素”，为行业标准化提供框架；129项金融AI Skill开源计划与FinGDPVal评测体系共建，则让智能体能力直接对齐真实业务产出。&lt;/p&gt;
&lt;p&gt;这一系列动作表明，阿里云的目标不仅是推出一款产品，更是推动整个金融AI生态从“AI Plus”（AI辅助）向“AI Native”（AI原生）演进。当越来越多的机构能够基于统一标准构建、评测和部署智能体，金融行业的AI应用将真正进入规模化、可复制的新阶段。&lt;/p&gt;
&lt;p&gt;从“点石成金”的愿景，到“数字员工”的现实，金融AI正在经历一场静默而深刻的变革。而这，或许只是智能体重塑金融业的开始。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;标签：&lt;/strong&gt; &lt;code&gt;金融AI&lt;/code&gt; &lt;code&gt;智能体&lt;/code&gt; &lt;code&gt;阿里云&lt;/code&gt; &lt;code&gt;数字员工&lt;/code&gt; &lt;code&gt;AI原生&lt;/code&gt;&lt;/p&gt;</description><pubDate>Thu, 28 May 2026 14:32:25 +0800</pubDate></item><item><title>医学影像AI：从看图到理解科研的范式跃迁</title><link>https://9842.cn/?id=404</link><description>&lt;h2 id=&quot;ai&quot;&gt;从“看图识病”到“理解科研”：医学影像 AI 的范式跃迁&lt;/h2&gt;
&lt;p&gt;长期以来，医学影像 AI 的核心命题是：模型能否比人类医生看得更准？围绕这一目标，大量研究聚焦于病灶检测、器官分割、影像分类等任务，追求在标准数据集上的 SOTA 指标。然而，现实中的医学与生物科研场景远比 benchmark 复杂——设备异构、协议多样、数据质量参差、标注稀缺，使得“高分模型”往往难以落地。&lt;/p&gt;
&lt;p&gt;CVPR 2026 的最新研究揭示了一个关键趋势：医学影像 AI 正从“会看图”迈向“会理解任务”，从“模型越大越好”转向“系统整体更有用”。真正的价值不再仅由单一指标决定，而在于模型能否快速适配新场景、用更少标注完成有效推理，并融合多模态异构信息。&lt;/p&gt;
&lt;h3 id=&quot;ai_1&quot;&gt;少数据、少微调、少人工：让 AI 成为科研“协作者”&lt;/h3&gt;
&lt;p&gt;在真实科研流程中，工具适配成本极高。同一款分割模型，在不同实验室的显微镜图像上可能表现迥异。传统做法依赖专家手动调整预处理参数或编写后处理脚本，耗时且难以复用。&lt;/p&gt;
&lt;p&gt;加州理工学院等机构在《Simple Agents Outperform Experts in Biomedical Imaging Workflow Optimization》中提出了一种新思路：用轻量级 AI agent 自动优化现有工具链。该研究并未训练新模型，而是让 agent 基于 LLM 能力，为 Polaris、Cellpose、MedSAM 等成熟工具自动生成适配代码。实验表明，这些“简单 agent”在 MedSAM 医学图像分割任务上甚至超越了专家手写的官方优化方案。&lt;/p&gt;
&lt;p&gt;这一成果的关键启示在于：在目标明确、数据有限的科研场景中，复杂架构并非最优解。透明、低成本的 agent 已足够有效，反而能避免 AutoML 或专家系统因过拟合或搜索偏置带来的性能下降。AI 正从“替代医生”转向“辅助科研”，成为降低工程门槛的实用伙伴。&lt;/p&gt;
&lt;h3 id=&quot;1-90&quot;&gt;数据智能筛选：用 1% 的数据，达成 90% 的效果&lt;/h3&gt;
&lt;p&gt;另一个瓶颈在于医学推理模型对标注数据的依赖。当前 VLM/LLM 的监督微调通常需要海量带推理链的数据，但其中大量样本重复、低质或优化价值有限，导致训练成本高而收益递减。&lt;/p&gt;
&lt;p&gt;华东师范大学与上海人工智能实验室团队提出的 DIQ（Difficulty-Influence Quadrant）方法，提供了一种高效解法。该方法同时评估每个样本的“医学推理难度”和“训练影响力”，将数据划分为四个象限，优先选择“高难度、高影响力”样本进行微调。&lt;/p&gt;
&lt;p&gt;实验显示，在 Huatuo 和 FineMed 等医学推理数据集上，仅使用 1% 的 DIQ 精选数据，模型性能即可接近全量数据微调效果；使用 10% 数据时，甚至在某些任务上实现反超。这不仅大幅降低计算成本，更揭示了医学 AI 训练的关键：质量优于数量，智能采样比盲目扩量更有效。&lt;/p&gt;
&lt;h3 id=&quot;_1&quot;&gt;跨模态融合：打破信息孤岛，构建临床“全知视角”&lt;/h3&gt;
&lt;p&gt;医学影像从来不是孤立存在的。CT 显示结构，超声捕捉动态，病理揭示细胞形态，空间转录组提供基因表达图谱，IMU 传感器记录运动状态，fMRI 反映脑活动……如何让模型理解这些异构信息的关联，是迈向临床智能的关键一步。&lt;/p&gt;
&lt;p&gt;CVPR 2026 的多项研究正推动这一进程：三维 CT 基础模型实现跨器官泛化；超声图文预训练让模型理解图像与临床描述的语义对应；空间转录组预测模型将组织图像与基因表达关联；IMU-视频对齐技术融合运动传感器与视觉数据；fMRI 视频重建尝试从脑活动还原视觉体验；双视角 X-ray 推理则提升骨折检测的鲁棒性。&lt;/p&gt;
&lt;p&gt;这些工作共同指向一个未来：医学 AI 不再局限于“看一张图”，而是能整合多源信息，构建对患者状态的全面理解。这种跨模态推理能力，正是从“辅助诊断”迈向“接管科研与临床工作流”的核心支撑。&lt;/p&gt;
&lt;p&gt;医学 AI 的下一站，不是更大的模型，而是更聪明的系统。当模型能自动适配工具、高效学习知识、融合多元信息，它才能真正嵌入真实世界的工作流，成为医生与科研人员的得力伙伴。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;标签：&lt;/strong&gt; &lt;code&gt;医学影像AI&lt;/code&gt; &lt;code&gt;多模态学习&lt;/code&gt; &lt;code&gt;AI for Science&lt;/code&gt; &lt;code&gt;轻量化适配&lt;/code&gt; &lt;code&gt;临床推理&lt;/code&gt;&lt;/p&gt;</description><pubDate>Thu, 28 May 2026 14:32:05 +0800</pubDate></item><item><title>Agent时代：流量护城河崩塌，智能体崛起</title><link>https://9842.cn/?id=403</link><description>&lt;h2 id=&quot;agent&quot;&gt;Agent时代来临：流量护城河正在崩塌&lt;/h2&gt;
&lt;p&gt;当蚂蚁集团CEO韩歆毅在支付宝AI生态大会上说出“AI会带来很多改变，但归根结底，AI服务于人，人掌握着最终决策权”时，他不仅点明了AI发展的伦理边界，更揭示了商业世界正在发生的深层变革——&lt;strong&gt;Agent（智能体）正在成为新的交易主体&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;这不再是“技术辅助人”的渐进式升级，而是一场关于“谁来做决策”的根本性迁移。&lt;/p&gt;
&lt;h3 id=&quot;_1&quot;&gt;从“人的流量”到“智能体生态”&lt;/h3&gt;
&lt;p&gt;移动互联网时代，平台的护城河建立在“人的注意力”之上。用户打开哪个App、在哪个搜索框输入关键词、在哪个推荐流停留更久，直接决定了商业机会的流向。所谓“流量为王”，本质是&lt;strong&gt;人类行为路径构建的入口垄断&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;但如今，这一逻辑正在被颠覆。&lt;/p&gt;
&lt;p&gt;韩歆毅提出一个惊人预判：&lt;strong&gt;中国14亿人，但Agent可能会有1400亿个&lt;/strong&gt;。这意味着，未来商业链路上的决策主体，将从“人”大规模转向“智能体”。用户不再亲自完成搜索、比价、领券、下单的全流程，而是将意图交给Agent，由它调度资源、协同服务、完成交易。&lt;/p&gt;
&lt;p&gt;入口，正在从用户可见的页面，迁移到Agent背后的任务调度网络。&lt;/p&gt;
&lt;p&gt;这一转变的底层逻辑是：&lt;strong&gt;当决策权转移，流量价值必然重构&lt;/strong&gt;。过去争夺的是用户点击，未来争夺的是Agent的“接入权”与“信任度”。&lt;/p&gt;
&lt;h3 id=&quot;_2&quot;&gt;全球巨头押注：协议先行，生态为王&lt;/h3&gt;
&lt;p&gt;这一趋势并非孤立现象，而是全球科技巨头的共同选择。&lt;/p&gt;
&lt;p&gt;Google推出&lt;strong&gt;A2A协议&lt;/strong&gt;（Agent-to-Agent），目标是让不同平台、不同框架的Agent能够跨系统通信与协作。这意味着，一个企业的客服Agent可以调用银行的支付Agent，再联动物流Agent完成履约——&lt;strong&gt;智能体之间的“通用语言”正在建立&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;OpenAI与Stripe联合推出&lt;strong&gt;ACP协议&lt;/strong&gt;（Agentic Commerce Protocol），则直接将ChatGPT从对话工具升级为交易入口。用户只需说“帮我买一台适合编程的笔记本”，Agent就能完成商品发现、参数对比、优惠匹配、支付下单的全流程。&lt;strong&gt;消费的起点，不再是货架或搜索框，而是Agent的任务链&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;而在中国，支付宝早已布局。今年初，支付宝联合千问App、淘宝闪购、Rokid、阿里云百炼等发布&lt;strong&gt;ACT协议&lt;/strong&gt;（Agent Cross-Terminal Protocol），成为中国首个支持跨终端、跨系统智能体协作的通用协议。仅两个月，共建伙伴增至20家，覆盖AI原生公司、智能硬件与服务平台。&lt;/p&gt;
&lt;p&gt;这些动作共同指向一个结论：&lt;strong&gt;未来的竞争，不再是App之间的流量争夺，而是智能体生态的构建能力&lt;/strong&gt;。&lt;/p&gt;
&lt;h3 id=&quot;_3&quot;&gt;信任逻辑崛起：新的护城河正在形成&lt;/h3&gt;
&lt;p&gt;当Agent成为交易主体，一个新的问题浮出水面：&lt;strong&gt;用户凭什么相信一个Agent能代表自己完成关键决策？&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;这正是韩歆毅强调的——“流量的逻辑会失效，但信任的逻辑会崛起”。&lt;/p&gt;
&lt;p&gt;在Agent时代，平台的价值不再取决于有多少用户点击，而在于：&lt;br /&gt;
- 能否接入足够多、足够可靠的Agent；&lt;br /&gt;
- 能否保障Agent之间的安全协作；&lt;br /&gt;
- 能否在任务执行中保持透明、可追溯、可干预。&lt;/p&gt;
&lt;p&gt;换句话说，&lt;strong&gt;信任机制&lt;/strong&gt;正在成为新的护城河。&lt;/p&gt;
&lt;p&gt;这包括技术层面的身份认证、权限控制、数据隐私保护，也包括产品设计中的“人类最终决策权”保障——比如关键步骤的确认机制、任务进度的可视化反馈、异常情况的人工接管通道。&lt;/p&gt;
&lt;p&gt;蚂蚁集团强调“人掌握最终决策权”，正是对这一趋势的回应。AI可以执行，但人必须可控。&lt;/p&gt;
&lt;h3 id=&quot;_4&quot;&gt;结语：不是颠覆，而是重构&lt;/h3&gt;
&lt;p&gt;Agent时代的到来，并非“AI推翻一切重来”。商业的本质——满足需求、完成交易、创造价值——依然不变。但参与其中的主体、决策的路径、竞争的维度，正在发生深刻重构。&lt;/p&gt;
&lt;p&gt;1400亿Agent入场，意味着未来的商业世界将更加自动化、智能化，也更加复杂。流量不再是唯一的入口，生态才是新的战场。&lt;/p&gt;
&lt;p&gt;对于企业而言，真正的挑战不再是“如何获取更多用户”，而是“如何成为Agent愿意接入、用户愿意信任的节点”。&lt;/p&gt;
&lt;p&gt;在这场变革中，谁先构建起开放、安全、高效的智能体协作网络，谁就将在下一代商业秩序中占据先机。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;标签：&lt;/strong&gt; &lt;code&gt;AI Agent&lt;/code&gt; &lt;code&gt;智能体生态&lt;/code&gt; &lt;code&gt;流量变革&lt;/code&gt; &lt;code&gt;ACP协议&lt;/code&gt; &lt;code&gt;ACT协议&lt;/code&gt;&lt;/p&gt;</description><pubDate>Thu, 28 May 2026 08:33:28 +0800</pubDate></item><item><title>微分智飞11项成果入选ICRA 2026：五大空中机器人突破</title><link>https://9842.cn/?id=402</link><description>&lt;h2 id=&quot;11icra-2026&quot;&gt;微分智飞11项成果入选ICRA 2026：空中机器人智能系统的五大突破方向&lt;/h2&gt;
&lt;p&gt;2026年5月，国际机器人与自动化领域顶级会议ICRA 2026正式公布论文录用结果，微分智飞团队一举斩获11项科研成果，覆盖&lt;strong&gt;决策大脑、敏捷小脑、协同群脑、高精感知、灵巧操作&lt;/strong&gt;五大核心技术方向。这一系列成果不仅展现了团队在空中机器人系统与智能决策规划领域的深厚积淀，更标志着我国在高性能智能体自主化与协同化研究上迈出了关键一步。&lt;/p&gt;
&lt;h3 id=&quot;_1&quot;&gt;决策大脑：从单模态到多模态的自主探索跃迁&lt;/h3&gt;
&lt;p&gt;在传统机器人探索任务中，地面或空中单一模态的移动方式往往受限于地形复杂度与续航能力。微分智飞团队提出的&lt;strong&gt;陆空双模机器人自主探索框架&lt;/strong&gt;，基于其早前研发的两栖机器人平台，实现了在未知环境中“地面穿行+空中飞跃”的无缝切换。该框架通过动态路径评估与模态切换策略，显著提升了大范围复杂地形下的建图效率与探索成功率。这一“决策大脑”的进化，使得机器人不再局限于“走”或“飞”，而是具备环境自适应的智能决策能力，为应急救援、野外勘探等场景提供了全新可能。&lt;/p&gt;
&lt;h3 id=&quot;_2&quot;&gt;敏捷小脑：突破飞行性能边界的硬件革新&lt;/h3&gt;
&lt;p&gt;在高机动性与长续航之间，传统多旋翼无人机长期面临“鱼与熊掌不可兼得”的困境。此次入选的&lt;strong&gt;COMET双斜盘共轴双旋翼平台&lt;/strong&gt;，通过创新的机械结构与控制算法，实现了高动态响应与低能耗飞行的统一。其双斜盘设计增强了姿态控制精度，使无人机可在强风扰动下保持稳定，同时延长了作业时间。此外，团队还提出了&lt;strong&gt;Tracailer轨迹规划器&lt;/strong&gt;，专为牵引车-拖车机器人设计，解决了非结构化环境中拖车摆动与路径跟踪难题。这些“敏捷小脑”级别的技术突破，为特种作业机器人提供了更可靠、更灵活的硬件基础。&lt;/p&gt;
&lt;p&gt;值得一提的是，团队还开发了&lt;strong&gt;基于RGB-D相机的人体投掷物威胁感知与躲避系统&lt;/strong&gt;。该系统通过实时人体姿态估计与抛物轨迹预测，实现毫秒级应急响应，极大提升了无人机在城市或人群密集区域的安全运行能力。这不仅是感知与控制的融合，更是对“主动安全”理念的深刻实践。&lt;/p&gt;
&lt;h3 id=&quot;_3&quot;&gt;协同群脑：大规模集群的鲁棒与高效协同&lt;/h3&gt;
&lt;p&gt;随着无人机集群应用日益广泛，如何在复杂干扰下维持编队稳定性成为关键挑战。&lt;strong&gt;RE-Formation&lt;/strong&gt;方法提出了一种分布式、可重构的编队规划框架，支持集群在部分节点失效或环境突变时快速自愈与重组。该算法通过局部信息交互与全局目标对齐，实现了千级规模集群的高效协同，为未来城市空中交通、大规模物资投送等场景奠定了技术基础。&lt;/p&gt;
&lt;h3 id=&quot;_4&quot;&gt;高精感知：从深度估计到自由空间建模的跃升&lt;/h3&gt;
&lt;p&gt;感知是智能体理解世界的“眼睛”。微分智飞团队在&lt;strong&gt;全向深度估计&lt;/strong&gt;与&lt;strong&gt;自由空间建模&lt;/strong&gt;两方面取得重要进展。&lt;strong&gt;FastViDAR&lt;/strong&gt;利用交替分层注意力机制，实现了高帧率、高精度的360度深度感知，显著优于传统基于稀疏点云的方法。而&lt;strong&gt;FIRI算法&lt;/strong&gt;则通过快速迭代区域膨胀与椭球优化，高效构建大规模障碍物自由空间的凸多面体表示，极大提升了路径搜索的安全性与效率。这两项技术共同构成了机器人“看得清、判得准”的感知基石。&lt;/p&gt;
&lt;h3 id=&quot;_5&quot;&gt;灵巧操作：移动机械臂的实时轨迹生成&lt;/h3&gt;
&lt;p&gt;在智能制造与仓储物流场景中，差速驱动移动机械臂的轨迹规划长期面临计算复杂度高、实时性差的问题。团队提出的&lt;strong&gt;TopAY方法&lt;/strong&gt;，结合拓扑路径搜索与弧长-偏航角参数化，实现了复杂环境下安全、平滑、实时轨迹生成。该方法不仅降低了计算开销，还提升了机械臂在狭窄空间中的操作精度，为“移动+操作”一体化机器人系统提供了高效解决方案。&lt;/p&gt;
&lt;p&gt;微分智飞此次11项成果的系统性突破，不仅体现了从感知、决策到执行的全链条创新能力，更彰显了其在空中智能体领域的战略布局。未来，随着多模态融合、集群智能与自主交互技术的持续演进，空中机器人将不再只是“会飞的机器”，而是真正具备类人智能的“空中工作者”。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;标签：&lt;/strong&gt; &lt;code&gt;空中机器人&lt;/code&gt; &lt;code&gt;自主探索&lt;/code&gt; &lt;code&gt;集群智能&lt;/code&gt; &lt;code&gt;轨迹规划&lt;/code&gt; &lt;code&gt;ICRA2026&lt;/code&gt;&lt;/p&gt;</description><pubDate>Thu, 28 May 2026 08:33:06 +0800</pubDate></item><item><title>小米DeepSeek价格战：AI暗涌背后的技术博弈</title><link>https://9842.cn/?id=401</link><description>&lt;h2 id=&quot;deepseekai&quot;&gt;价格战的背后：小米与DeepSeek的AI暗涌&lt;/h2&gt;
&lt;p&gt;当DeepSeek在5月22日宣布V4-Pro模型API价格永久下调75%，将缓存命中输入成本压至每百万Tokens 0.025元时，整个AI开发者社区为之震动。然而仅仅五天之后，小米以更激进的姿态入场——MiMo-V2.5系列API最高降价99%，Pro版定价与DeepSeek持平，标准版甚至低至0.02元。这场看似简单的价格博弈，实则是两种技术路线与商业逻辑的正面交锋。&lt;/p&gt;
&lt;h3 id=&quot;vs&quot;&gt;技术降本 vs 资本摊薄：两种“永久降价”的逻辑&lt;/h3&gt;
&lt;p&gt;大模型API的定价本质是算力成本、运营成本与利润空间的叠加。DeepSeek的底气来自底层技术的颠覆性创新：其V3模型仅用约600万美元训练成本就实现了对标GPT-4的性能，仅为行业平均水平的数十分之一。更关键的是，其自研的稀疏注意力机制使V4系列在百万级Token长上下文处理中，算力消耗降至上一代的27%，KV Cache占用减少90%。这种“用技术换成本”的模式，让降价成为可持续的商业模式。&lt;/p&gt;
&lt;p&gt;相比之下，小米的降价逻辑更依赖规模效应与战略投入。雷军宣布未来三年在AI领域投入600亿元，今年一季度研发支出已达90亿元，同比增长33.4%。这笔真金白银不仅用于追赶技术差距，更旨在通过大规模采购与集群优化摊薄推理成本。此外，小米独有的“人车家全生态”战略，使其能将MiMo大模型无缝嵌入手机、汽车、智能家居等终端设备，实现端侧推理的边际成本趋近于零。&lt;/p&gt;
&lt;h3 id=&quot;_1&quot;&gt;技术对标：从追赶者到并行者&lt;/h3&gt;
&lt;p&gt;价格之外，真正的较量在于模型能力。DeepSeek的核心壁垒在于MoE（混合专家）架构的极致工程化：V3模型总参数达671B，但单Token仅激活约37B参数，激活占比仅5.5%。配合MLA（多头潜在注意力）机制，其KV缓存压缩至传统架构的几分之一，极大降低了长文本推理的内存开销。&lt;/p&gt;
&lt;p&gt;而小米的MiMo-V2.5系列同样采用MoE架构，Pro版总参数达1.02T（激活42B），预训练数据量高达27万亿Token，原生支持32K序列并扩展至1M上下文。更值得关注的是其全模态能力——MiMo-V2.5支持文本、图像、视频、音频的统一理解，在Artificial Analysis综合智能指数和Agent指数上均位列全球开源模型第一。在SWE-bench Pro测试中，其得分57.2%，超越DeepSeek V4 Pro的55.4%；在ClawEval Agent任务中，得分63.8%，稳居全球开源榜首。&lt;/p&gt;
&lt;p&gt;尤其值得注意的是，小米在Token效率上的突破：同等任务下，MiMo-V2.5-Pro的Token消耗比GPT-5.4减少40%-60%。这意味着其推理成本本就具备结构性优势，降价并非单纯的价格战，而是技术能力提升的自然结果。&lt;/p&gt;
&lt;h3 id=&quot;ai&quot;&gt;生态战略：硬件巨头的AI野望&lt;/h3&gt;
&lt;p&gt;如果认为小米只是想通过低价API抢占开发者市场，那就低估了其战略纵深。DeepSeek作为纯AI技术公司，其目标是构建通用大模型生态；而小米的野心，是用AI重塑“人车家全生态”。&lt;/p&gt;
&lt;p&gt;自AGI研究者罗福莉加盟担任MiMo大模型负责人后，小米在短短几个月内完成了从语言模型到多模态、语音模型的全矩阵布局。MiMo已深度集成进小米手机的小爱同学、小米汽车的智能座舱、以及米家智能家居系统。这种软硬协同的落地能力，是DeepSeek所不具备的“王牌”。&lt;/p&gt;
&lt;p&gt;在端侧部署方面，小米可利用其庞大的硬件用户基数，将模型推理任务下沉至设备端，大幅降低云端调用频率。这种“云+端”混合架构不仅提升响应速度，更显著压缩了长期运营成本。&lt;/p&gt;
&lt;h3 id=&quot;_2&quot;&gt;结语：价格战的终局是生态战&lt;/h3&gt;
&lt;p&gt;小米与DeepSeek的降价之争，表面是价格，实则是技术路线与商业模式的较量。DeepSeek以技术创新驱动成本革命，小米则以生态整合实现规模效应。两者殊途同归，都在推动AI普惠化，但路径截然不同。&lt;/p&gt;
&lt;p&gt;对于开发者而言，这无疑是最好的时代——更低的使用门槛、更强的模型能力、更丰富的落地场景。而对于行业来说，这场博弈才刚刚开始。当硬件巨头与技术新锐正面交锋，AI的下一站，或许不再是单纯的性能竞赛，而是生态整合能力的终极考验。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;标签：&lt;/strong&gt; &lt;code&gt;小米AI&lt;/code&gt; &lt;code&gt;DeepSeek&lt;/code&gt; &lt;code&gt;大模型降价&lt;/code&gt; &lt;code&gt;MoE架构&lt;/code&gt; &lt;code&gt;AI生态&lt;/code&gt;&lt;/p&gt;</description><pubDate>Thu, 28 May 2026 08:32:47 +0800</pubDate></item><item><title>伦敦重夺欧洲科技王座：AI浪潮下的城市跃迁</title><link>https://9842.cn/?id=400</link><description>&lt;h2 id=&quot;ai&quot;&gt;伦敦重夺欧洲科技王座：AI浪潮下的城市跃迁&lt;/h2&gt;
&lt;p&gt;2026年，欧洲科技版图迎来关键转折。根据全球知名科技数据平台Dealroom发布的《2026年全球科技生态系统指数》，伦敦以强劲的复苏势头，重新夺回欧洲最大科技中心的地位，超越近年来风头正劲的巴黎。这一转变并非偶然，而是人工智能与深度科技投资浪潮推动下，城市创新生态系统性进化的结果。&lt;/p&gt;
&lt;h3 id=&quot;177&quot;&gt;资本回流：177亿美元背后的信心投票&lt;/h3&gt;
&lt;p&gt;伦敦科技生态的复苏，首先体现在资本市场的强势回归。2025年，伦敦科技公司共获得177亿美元融资，这一数字不仅创下历史新高，更显著领先于巴黎同期的融资规模。资本的流向，往往是最敏锐的市场信号。在经历脱欧初期的不确定性后，全球投资者正重新将目光聚焦于这座金融与科技交融的古老都市。&lt;/p&gt;
&lt;p&gt;尤其值得注意的是，这些资金大量流向人工智能、量子计算、生物科技等前沿领域。例如，专注于自动驾驶AI的Wayve获得超10亿美元融资，成为欧洲AI领域最大单笔融资之一；语音合成公司ElevenLabs估值突破百亿美元，成为新晋“语音AI之王”。这些高成长性企业的涌现，不仅拉高了整体融资水位，更标志着伦敦正从“互联网应用中心”向“硬科技创新高地”转型。&lt;/p&gt;
&lt;h3 id=&quot;138&quot;&gt;独角兽森林：138家企业的创新密度&lt;/h3&gt;
&lt;p&gt;如果说融资规模是“量”的体现，那么独角兽企业的数量则是“质”的证明。目前，伦敦拥有138家估值超过10亿美元的初创企业，这一数字远超巴黎的97家，稳居欧洲首位。这些独角兽企业不仅覆盖金融科技、健康科技、清洁能源等传统优势领域，更在AI原生应用、机器人流程自动化、合成生物学等新兴赛道占据领先地位。&lt;/p&gt;
&lt;p&gt;以Granola为例，这家专注于AI驱动的食品研发公司，利用生成式模型加速新配方开发，已与多家全球食品巨头达成合作；而OLIX则通过深度学习的工业视觉系统，为制造业提供高精度质检解决方案，客户遍布欧洲与亚洲。这些企业并非孤立存在，而是嵌入一个高度互联的创新网络中——高校提供人才，风投提供资金，大企业开放场景，政府提供政策支持。&lt;/p&gt;
&lt;h3 id=&quot;ai_1&quot;&gt;AI与深度科技：伦敦的新引擎&lt;/h3&gt;
&lt;p&gt;伦敦此次重夺领先地位，核心驱动力在于其在人工智能与深度科技领域的战略布局。近年来，英国政府持续加大对AI基础研究的投入，伦敦大学学院（UCL）、帝国理工学院等高校在机器学习、自然语言处理等领域成果频出，为产业转化提供了坚实支撑。&lt;/p&gt;
&lt;p&gt;与此同时，伦敦正加速构建“AI产业走廊”。从国王十字区的Google DeepMind总部，到肖尔迪奇区的初创孵化器集群，再到金丝雀码头的金融科技AI实验室，一条贯穿南北的科技创新带正在形成。更关键的是，伦敦拥有欧洲最成熟的科技金融生态——顶级律所、审计机构、上市通道一应俱全，使得初创企业从诞生到退出的全周期服务链条高度完善。&lt;/p&gt;
&lt;p&gt;此外，人才吸引力也是伦敦的隐形优势。尽管面临签证政策挑战，但伦敦仍凭借其多元文化、英语环境与国际资源，持续吸引全球顶尖工程师与创业者。据Dealroom统计，2025年伦敦科技岗位中，近40%由海外人才填补，其中亚洲与北美背景的技术高管比例显著上升。&lt;/p&gt;
&lt;h3 id=&quot;_1&quot;&gt;超越巴黎：生态系统的全面较量&lt;/h3&gt;
&lt;p&gt;巴黎近年来在科技领域表现亮眼，尤其在政府主导的“法国2030”计划推动下，本土AI企业如Mistral AI迅速崛起。然而，与伦敦相比，其生态系统仍存在短板：融资渠道相对单一，退出机制不够成熟，国际化程度有待提升。而伦敦凭借其深厚的资本市场底蕴、开放的监管环境以及成熟的跨国企业网络，在吸引全球资本与人才方面更具优势。&lt;/p&gt;
&lt;p&gt;更重要的是，伦敦的科技生态更具“自生长”能力。独角兽企业不仅数量多，且具备更强的全球扩张能力。例如，ElevenLabs已在美国、新加坡设立研发中心，Wayve则与多家国际车企达成技术合作。这种“本地孵化、全球输出”的模式，正是成熟科技中心的标志。&lt;/p&gt;
&lt;p&gt;展望未来，随着AI大模型、具身智能、可控核聚变等技术的突破，欧洲科技竞争将进入新阶段。伦敦能否持续领跑，取决于其能否在基础研究、产业转化与政策协同上保持平衡。但可以确定的是，这座千年之城，正以科技之名，书写新的时代篇章。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;标签：&lt;/strong&gt; &lt;code&gt;伦敦科技&lt;/code&gt; &lt;code&gt;人工智能&lt;/code&gt; &lt;code&gt;独角兽企业&lt;/code&gt; &lt;code&gt;欧洲创新&lt;/code&gt; &lt;code&gt;深度科技&lt;/code&gt;&lt;/p&gt;</description><pubDate>Thu, 28 May 2026 08:32:25 +0800</pubDate></item></channel></rss>