当前位置:主页 > 快讯 >

Ramp Labs提出多智能体记忆共享新方案,Token消耗最高降低65%

时间:2026-04-11 13:47:12

  消息,4 月 11 日,AI 基础设施公司 Ramp Labs 发布研究成果「Latent Briefing」,通过直接压缩大模型 KV 缓存实现多智能体系统间的高效记忆共享,在不损失准确率的前提下大幅降低 Token 消耗。在主流多智能体架构中,编排者将任务拆解并反复调用工作者模型,随着推理链路不断延伸,Token 用量呈指数级膨胀。Latent Briefing 的核心思路是:借助注意力机制识别上下文中真正关键的部分,在表示层直接丢弃冗余信息,而非依赖速度慢的 LLM 摘要或稳定性差的 RAG 检索。在 LongBench v2 基准测试中,该方法表现亮眼:Worker 模型 Token 消耗降低 65%,中等长度文档的 Token 节省中位数达 49%,整体准确率较基线 个百分点,而每次压缩的额外耗时仅约 1.7 秒,较原始算法提速约 20 倍。实验以 Claude Sonnet 4 作为编排者、Qwen3-14B 作为工作者模型,覆盖学术论文、法律文书、小说及政府报告等多类文档场景。研究还发现,最优压缩阈值因任务难度和文档长度而异——难题适合激进压缩以过滤投机性推理噪声,长文档则更适合轻度压缩以保留分散的关键信息。

热点推荐
1 Polymarket:Claude Fable 5恢复美国访问概率降

消息,预测市场显示,Polymarket上关于Claude Fable 5将在6月26日前为美国客户恢复的概率降至41%,...

2 日本企业年金计划在2026财年配置1%加密资

日本一家企业年金计划将在2026财年开始投资加密资产,计划将约1%的总资产配置到加密资产,...

3 日本国家企业年金基金将1%资产配置于加

消息,日本国家企业年金基金宣布将其资产的1%分配给加密货币。这一举措标志着日本在加密资...

4 美国消费者技术协会敦促参议院推进数字

消息,代表逾1200家科技公司的美国消费者技术协会致信参议院两党领袖,敦促参议院尽快推进...

5 特斯拉AI工程师:算法调优不是万能药,

消息,特斯拉AI高级主任工程师蔡云达指出,外界常以为机器学习项目99%的工作都在跑训练,实...

6 桑德斯提案对AI巨头征50%股权税,背后推

消息,参议员伯尼桑德斯提交法案,提议对年销售额超2亿美元的AI公司征收50%股权税,以建立...

7 Solana价格分析:SOL反弹触发潜在$80重测

消息,Solana价格分析显示,SOL在近期低点反弹,向关键阻力位靠近,交易者关注其是否能达到...

8 俄罗斯冒充莫斯科交易所的加密货币诈骗

消息,据мошеловка平台披露,俄罗斯出现冒充莫斯科交易所的加密货币诈骗,用户损失约...

9 特斯拉申请“Megapod”商标,旨在开发AI计

消息,特斯拉近日提交了Megapod商标申请,该产品被描述为用于AI计算的模块化数据中心硬件。...

10 伊朗革命卫队警告船只远离霍尔木兹海峡

消息,在伊朗于周六宣布关闭霍尔木兹海峡后,伊朗伊斯兰革命卫队海军部门警告各类船只不...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。