消息,4 月 11 日,AI 基础设施公司 Ramp Labs 发布研究成果「Latent Briefing」,通过直接压缩大模型 KV 缓存实现多智能体系统间的高效记忆共享,在不损失准确率的前提下大幅降低 Token 消耗。在主流多智能体架构中,编排者将任务拆解并反复调用工作者模型,随着推理链路不断延伸,Token 用量呈指数级膨胀。Latent Briefing 的核心思路是:借助注意力机制识别上下文中真正关键的部分,在表示层直接丢弃冗余信息,而非依赖速度慢的 LLM 摘要或稳定性差的 RAG 检索。在 LongBench v2 基准测试中,该方法表现亮眼:Worker 模型 Token 消耗降低 65%,中等长度文档的 Token 节省中位数达 49%,整体准确率较基线 个百分点,而每次压缩的额外耗时仅约 1.7 秒,较原始算法提速约 20 倍。实验以 Claude Sonnet 4 作为编排者、Qwen3-14B 作为工作者模型,覆盖学术论文、法律文书、小说及政府报告等多类文档场景。研究还发现,最优压缩阈值因任务难度和文档长度而异——难题适合激进压缩以过滤投机性推理噪声,长文档则更适合轻度压缩以保留分散的关键信息。
消息,据Whale Alert监测,未知钱包刚刚转入236,023,250枚USDT,按实时价格计算约合235,736,953美元。...
2 作为与美国结束战争的初步协议的一部分消息,据半岛电视台:伊朗总统表示,作为与美国结束战争的初步协议的一部分,目前由卡塔...
3 Polymarket:Claude Fable 5恢复美国访问概率降消息,预测市场显示,Polymarket上关于Claude Fable 5将在6月26日前为美国客户恢复的概率降至41%,...
4 日本企业年金计划在2026财年配置1%加密资日本一家企业年金计划将在2026财年开始投资加密资产,计划将约1%的总资产配置到加密资产,...
5 日本国家企业年金基金将1%资产配置于加消息,日本国家企业年金基金宣布将其资产的1%分配给加密货币。这一举措标志着日本在加密资...
6 美国消费者技术协会敦促参议院推进数字消息,代表逾1200家科技公司的美国消费者技术协会致信参议院两党领袖,敦促参议院尽快推进...
7 特斯拉AI工程师:算法调优不是万能药,消息,特斯拉AI高级主任工程师蔡云达指出,外界常以为机器学习项目99%的工作都在跑训练,实...
8 桑德斯提案对AI巨头征50%股权税,背后推消息,参议员伯尼桑德斯提交法案,提议对年销售额超2亿美元的AI公司征收50%股权税,以建立...
9 Solana价格分析:SOL反弹触发潜在$80重测消息,Solana价格分析显示,SOL在近期低点反弹,向关键阻力位靠近,交易者关注其是否能达到...
10 俄罗斯冒充莫斯科交易所的加密货币诈骗消息,据мошеловка平台披露,俄罗斯出现冒充莫斯科交易所的加密货币诈骗,用户损失约...
成都来彰科技 蜀ICP备2025134723号-1
资讯来源互联网,如有版权问题请联系管理员删除。