KVCache成智能体记忆中枢

admin2小时前3
大模型推理新范式:KVCache从临时缓存升级为智能体工作记忆,Mooncake框架实现Prefill与Decode解耦,提升多智能体协同效率。...