当前位置:主页 > 动态 >

CMU教授开源Agent框架Motus,多模型编排SWEbench跑到79%且成本减半

时间:2026-04-15 21:17:34

  消息,4 月 15 日,据 动察 Beating 监测,卡内基梅隆大学计算机科学系教授 Dimitrios Skarlatos和 Zhihao Jia创办的 AI 基础设施公司 Lithos AI 开源了 Agent 服务框架 Motus,Apache 2.0 许可证。团队由 CMU 和斯坦福研究人员组成,成员有 AWS、谷歌、Meta 和英伟达的生产基础设施经验。 Motus 的核心思路:不同任务适合不同模型,与其始终用最贵的前沿模型跑所有步骤,不如让系统从生产运行的轨迹中学习,自动把不同子任务路由到最合适的模型。当前 Agent 部署后是静态的,提示框架、模型和上下文策略固定不变,Motus 则从每次运行中提取任务成功率、延迟和成本信号,持续优化。 据 Lithos AI 官网数据,在 SWE-bench Verified 上,Motus 多模型编排达到 79% 准确率,高于 Claude Opus 4.6 的 75.8% 和 GPT-5.3-Codex 的 72.6%,成本不到单用 Opus 的一半。在 Terminal-Bench 2.0 上,准确率从 Opus 的 64% 提至 80.1%,成本同样约减半。框架还会根据具体工作负载调整上下文记忆策略,并自动检测可并行执行的步骤来降低延迟。 Motus 不绑定模型提供商,支持 OpenAI Agents SDK、Anthropic SDK、Google ADK 及纯 Python 构建的 Agent,提供 Claude Code、Codex 和 Cursor 插件,一条命令本地部署或推送至云端。早期预览阶段免费提供算力。

热点推荐
1 欧佩克+计划在9月底前恢复全部减产份额

消息,欧佩克+计划继续增产,目标是在9月底前恢复全部减产份额。尽管目前很多增产实际上仍...

2 美国财长贝森特:三大人工智能巨头与美

消息,美国财长贝森特近期连续发表以下观点:一、三大人工智能巨头与美国政府合作良好二...

3 泽连斯基:俄罗斯无人机袭击联合国车辆

消息,乌克兰总统泽连斯基表示,俄罗斯周四在乌克兰南部赫尔松地区两次用无人机袭击联合...

4 Nous新方案TST预训练提速2到3倍,陷入「撞

消息,Nous Research发布了大模型预训练新方案词元叠加训练,该方案通过打包压缩相邻词元,将...

5 OKX Agent Trade Kit上线“宏观经济日历”

消息,OKX Agent Trade Kit已推出宏观经济日历功能,整合全球宏观经济事件库、历史回测分析及每...

6 翔业集团与溥泉资本达成战略合作

消息,据厦门翔业消息,翔业集团旗下产投集团与宁德时代产投平台溥泉资本签署战略合作协...

7 CFTC为预测市场提供法律救济,缓解法律斗

消息,美国商品期货交易委员会为完全抵押的事件合约提供了无行动救济,涵盖某些掉期数据...

8 三菱日联:美通胀数据高于预期,日元承

消息,三菱日联分析师Michael Wan表示,在美国通胀数据高于预期后,日元成为美元重新走强过程...

9 Glassnode:美国现货比特币ETF净流出达880

消息,据Glassnode数据,美国现货比特币ETF 7日均线月中旬以来最大流出规模。Glassnode表示,与...

10 鸿海第一季度利润增长18.5%,超出预期

消息,全球最大的电子代工制造商鸿海周四报告称,其第一季度利润增长了18.5%,超出了分析师...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。