大模型推理新范式:KVCache从临时缓存升级为智能体工作记忆,Mooncake框架实现Prefill与Decode解耦,提升多智能体协同效率。...
百度2026年成立模型委员会整合大模型研发,试图打通AI全链路。然而文心一言用户下滑,DeepSeek崛起,暴露百度困于流量变现思维。技术代差成关键变量,百度变革是否太晚?...
上海电信上线Token资费套餐,1元享25万额度点,支持话费支付,可调用30+主流大模型,降低AI使用门槛,开启大众消费新阶段。...
华为云INSPIRE大会发布Agentic AI战略,打造全栈能力体系,推动AI从模型走向智能体驱动,提升基础设施效率与行业落地效果。...
中国土味短剧借助AI技术实现内容工厂化生产,低成本批量生成剧情紧凑的剧集,推动全球短剧市场爆发式增长。...
蚂蚁百灵正式开源Ring-2.6-1T,支持动态推理强度调节,专为代理任务设计,实现从‘思考’到‘执行’的能力跃迁,助力企业AI落地。...
当算力受限,AI 大厂转向算法优化。CVPR 2026 上字节 Seed 团队发布 TEMF、MoD Attention 等四项创新,实现单步高质量图像生成与高效推理,开启 AI 效率新战场。...
AI正重塑消费决策,品牌如何抢占AI推荐力?36氪联合PureblueAI发布2026消费品牌AI推荐力名册,解析四大维度提升AI认知占位。...
蚂蚁百灵正式开源Ring-2.6-1T模型,引入‘按需思考’机制与双推理模式,在PinchBench、AIME等评测中表现优异,为Agent应用落地提供高效、可控的新路径。...
SpaceX收购xAI后爆发大规模人才流失,50余名核心研发人员离职,暴露AI战略与管理深层矛盾,折射出组织融合困境。...