当前位置:主页 > 动态 >

给Agent贴“产品经理”标签不会让它更专业,只会让它拒绝越界

时间:2026-04-15 20:03:21

  消息,4 月 15 日,据 动察 Beating 监测,CrewAI、MetaGPT 等框架推广了一种多 Agent 设计:让不同 Agent 扮演产品经理、架构师、测试工程师,像公司部门一样传文档、跑流水线。SagaSu 发了一篇万字分析,把这种模式叫「三省六部幻觉」,翻遍 Anthropic、OpenAI、谷歌三家的工程文档后发现,没有一家这么干。 文章指出两个根本问题。第一是假边界:人类需要分工是因为一个人干不了所有事,但 LLM 能写需求文档也能写代码,不存在「专业壁垒」。贴了角色标签的 Agent 不会因此变专业,反而在遇到角色外的问题时直接跳过,而最有价值的推理往往发生在边界上。第二是信息在流转中死亡。Agent A 产出一份文档传给 B,传的是结论不是推理过程,B 要重建上下文,隐含假设逐层丢失,链条越长越容易「每个节点都对,整体已经歪了」。 有人反驳:三家厂商用的 progress.txt、spec 文件不也是传文件?文章认为区别在于,角色间的文档是单向交接,A 写完传给 B 就不管了,信息被压缩成结论;而状态文件是同一个任务的增量日志,写和读的是同一个角色在不同时间点,信息是连续积累的,推理链能跨会话保持连贯。 三家的具体做法: - Anthropic 把每个新会话比作「轮班工程师」,用 progress.txt 当交班记录,第一个会话由专门的 Initializer Agent 搭环境、写操作手册,后续会话读取后接着干。多 Agent 采用 orchestrator-worker 模式,一个主 Agent 拆任务,多个子 Agent 并行探索不同方向,结果回流汇总,不是流水线接力 - OpenAI 在任务启动时用 spec 文件锁死目标,runbook 同时充当操作手册和审计日志,还引入 Skills。GPT-5.3-Codex 用这套机制跑了约 25 小时不间断,完成了一个完整设计工具,全程保持连贯 - 谷歌用 1M token 长上下文硬扩窗口,同时把项目意图写进代码库的持久化 Markdown 文件,不依赖聊天记录。Gemini 3 还加了 Thought Signatures,在长会话里保存推理链关键节点,防止前后逻辑自相矛盾 从三家实践中可以提炼几条共同原则。多 Agent 的价值是并行覆盖搜索空间,不是模拟分工。Anthropic Research 系统的数据表明,token 用量解释了 80% 的性能差异:多派几个 Agent 效果更好,本质上是花了更多算力同时探索不同方向,跟怎么分工没关系。如果要加验证环节,让验证 Agent 专门挑毛病,不是接棒继续做。给 Agent 配什么工具决定了它能做什么,角色标签只决定它愿意做什么。 文章最后提醒,模型能力在快速迭代,今天写进系统里的补丁六个月后可能变成死代码。Anthropic 已经踩过这个坑:Sonnet 4.5 快到上下文上限时会提前收尾,团队专门加了 context reset 机制,结果换成 Opus 4.5 后这个行为消失了,reset 随即成了无用代码。保持架构可演化,比选一个「完美架构」更重要。

热点推荐
1 美国4月进口价格上涨1.9%成本压力持续上

消息,美国4月进口价格环比上涨1.9%,远超市场预期的1.0%。出口价格也飙升3.3%。这一涨幅表明...

2 稳定币供应在BNB链同比增长73%

消息,BNB链上的稳定币供应同比增长73%,从约90亿美元增加至约160亿美元,数据来源于Artemis。...

3 美国4月零售销售增长0.5%

消息,美国4月零售销售继续增长,增幅为0.5%,符合市场预期,而3月增幅被下修至1.6%。部分涨...

4 Hyperion DeFi第一季度财报:净利润884万美元

消息,吴说获悉,纳斯达克上市公司Hyperion DeFi公布了截至2026年3月31日的第一季度财报。财报显...

5 克宫:普京访华筹备工作已就绪

克里姆林宫发言人佩斯科夫在新闻发布会上表示,俄罗斯总统普京即将访华,相关筹备工作已...

6 欧佩克+计划在9月底前恢复全部减产份额

消息,欧佩克+计划继续增产,目标是在9月底前恢复全部减产份额。尽管目前很多增产实际上仍...

7 美国财长贝森特:三大人工智能巨头与美

消息,美国财长贝森特近期连续发表以下观点:一、三大人工智能巨头与美国政府合作良好二...

8 泽连斯基:俄罗斯无人机袭击联合国车辆

消息,乌克兰总统泽连斯基表示,俄罗斯周四在乌克兰南部赫尔松地区两次用无人机袭击联合...

9 Nous新方案TST预训练提速2到3倍,陷入「撞

消息,Nous Research发布了大模型预训练新方案词元叠加训练,该方案通过打包压缩相邻词元,将...

10 OKX Agent Trade Kit上线“宏观经济日历”

消息,OKX Agent Trade Kit已推出宏观经济日历功能,整合全球宏观经济事件库、历史回测分析及每...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。