当前位置:主页 > 快讯 >

Ramp Labs提出多智能体记忆共享新方案,Token消耗最高降低65%

时间:2026-04-11 13:47:12

  消息,4 月 11 日,AI 基础设施公司 Ramp Labs 发布研究成果「Latent Briefing」,通过直接压缩大模型 KV 缓存实现多智能体系统间的高效记忆共享,在不损失准确率的前提下大幅降低 Token 消耗。在主流多智能体架构中,编排者将任务拆解并反复调用工作者模型,随着推理链路不断延伸,Token 用量呈指数级膨胀。Latent Briefing 的核心思路是:借助注意力机制识别上下文中真正关键的部分,在表示层直接丢弃冗余信息,而非依赖速度慢的 LLM 摘要或稳定性差的 RAG 检索。在 LongBench v2 基准测试中,该方法表现亮眼:Worker 模型 Token 消耗降低 65%,中等长度文档的 Token 节省中位数达 49%,整体准确率较基线 个百分点,而每次压缩的额外耗时仅约 1.7 秒,较原始算法提速约 20 倍。实验以 Claude Sonnet 4 作为编排者、Qwen3-14B 作为工作者模型,覆盖学术论文、法律文书、小说及政府报告等多类文档场景。研究还发现,最优压缩阈值因任务难度和文档长度而异——难题适合激进压缩以过滤投机性推理噪声,长文档则更适合轻度压缩以保留分散的关键信息。

热点推荐
1 Selini Capital 24小时内从币安购入2000万枚

消息,据Onchain Lens发推称:Selini Capital 在过去 24 小时内从币安累计积累了价值 564 万美元的 ...

2 Ramp Labs提出多智能体记忆共享新方案,

消息,4 月 11 日,AI 基础设施公司 Ramp Labs 发布研究成果「Latent Briefing」,通过直接压缩大模型...

3 Arthur Hayes:期待“大规模危机”触发美联

消息,BitMEX 联合创始人 Arthur Hayes 在 X 平台发文表示,期待大规模危机,这样就能促使美联储...

4 Anthropic推出Word文档AI助手,支持三款Off

消息,4 月 11 日,Anthropic 旗下 AI 产品 Claude 正式推出 Word 文档插件测试版。用户可直接在侧边...

5 Bitwise提交Hyperliquid ETF二次修订

消息,据吴说区块链发推称:Bitwise 已向美国证券交易委员会提交 Hyperliquid ETF 申请文件的第二...

6 Abra计划斥资1.5亿美元收购比特币

消息,据Coin Bureau发推称:Cantor 支持的 Abra 计划购买价值 1.5 亿美元的比特币,其首席执行官表...

7 Coinbase转移2亿美元USDC至未知钱包

消息,据Whale Alert发推称:Coinbase Institutional 向未知钱包转移了 2 亿枚 USDC,价值约 2 亿美元。...

8 「76人vs.火箭」24H 成交量达到 $1.5M

消息,4 月 11 日, 预测市场数据显示,「76人vs.火箭」过去 24 小时成交量达到 $1.8M,市场参与...

9 4月10日24小时加密货币涨跌幅榜

消息,4 月 11 日,4月10日24小时内,涨幅最大的加密货币为RaveDAO,上涨223.34%;Dash上涨35.99%;...

10 特朗普:与伊朗的会谈结果将在24小时内

消息,美国总统特朗普 10 日接受《纽约邮报》采访时表示,与伊朗的会谈结果将在 24 小时内明...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。