当前位置:主页 > 动态 >

给Agent贴“产品经理”标签不会让它更专业,只会让它拒绝越界

时间:2026-04-15 20:03:21

  消息,4 月 15 日,据 动察 Beating 监测,CrewAI、MetaGPT 等框架推广了一种多 Agent 设计:让不同 Agent 扮演产品经理、架构师、测试工程师,像公司部门一样传文档、跑流水线。SagaSu 发了一篇万字分析,把这种模式叫「三省六部幻觉」,翻遍 Anthropic、OpenAI、谷歌三家的工程文档后发现,没有一家这么干。 文章指出两个根本问题。第一是假边界:人类需要分工是因为一个人干不了所有事,但 LLM 能写需求文档也能写代码,不存在「专业壁垒」。贴了角色标签的 Agent 不会因此变专业,反而在遇到角色外的问题时直接跳过,而最有价值的推理往往发生在边界上。第二是信息在流转中死亡。Agent A 产出一份文档传给 B,传的是结论不是推理过程,B 要重建上下文,隐含假设逐层丢失,链条越长越容易「每个节点都对,整体已经歪了」。 有人反驳:三家厂商用的 progress.txt、spec 文件不也是传文件?文章认为区别在于,角色间的文档是单向交接,A 写完传给 B 就不管了,信息被压缩成结论;而状态文件是同一个任务的增量日志,写和读的是同一个角色在不同时间点,信息是连续积累的,推理链能跨会话保持连贯。 三家的具体做法: - Anthropic 把每个新会话比作「轮班工程师」,用 progress.txt 当交班记录,第一个会话由专门的 Initializer Agent 搭环境、写操作手册,后续会话读取后接着干。多 Agent 采用 orchestrator-worker 模式,一个主 Agent 拆任务,多个子 Agent 并行探索不同方向,结果回流汇总,不是流水线接力 - OpenAI 在任务启动时用 spec 文件锁死目标,runbook 同时充当操作手册和审计日志,还引入 Skills。GPT-5.3-Codex 用这套机制跑了约 25 小时不间断,完成了一个完整设计工具,全程保持连贯 - 谷歌用 1M token 长上下文硬扩窗口,同时把项目意图写进代码库的持久化 Markdown 文件,不依赖聊天记录。Gemini 3 还加了 Thought Signatures,在长会话里保存推理链关键节点,防止前后逻辑自相矛盾 从三家实践中可以提炼几条共同原则。多 Agent 的价值是并行覆盖搜索空间,不是模拟分工。Anthropic Research 系统的数据表明,token 用量解释了 80% 的性能差异:多派几个 Agent 效果更好,本质上是花了更多算力同时探索不同方向,跟怎么分工没关系。如果要加验证环节,让验证 Agent 专门挑毛病,不是接棒继续做。给 Agent 配什么工具决定了它能做什么,角色标签只决定它愿意做什么。 文章最后提醒,模型能力在快速迭代,今天写进系统里的补丁六个月后可能变成死代码。Anthropic 已经踩过这个坑:Sonnet 4.5 快到上下文上限时会提前收尾,团队专门加了 context reset 机制,结果换成 Opus 4.5 后这个行为消失了,reset 随即成了无用代码。保持架构可演化,比选一个「完美架构」更重要。

热点推荐
1 125.93万SOL转至未知新钱包

消息,据Whale Alert发推称:125.93 万枚 SOL从一个未知钱包转移至一个新的未知钱包。...

2 特朗普威胁解雇鲍威尔

消息,据Coin Bureau发推称:特朗普表示,如果鲍威尔不主动离职,他将不得不解雇这位美联储主...

3 市场回暖,山寨币交易量复苏

消息,据CryptoQuant发推称:山寨币交易量近期开始回升,暗示市场参与动态可能出现转变。加密...

4 孙宇晨向HTX充值3亿JST

消息,据Ai 姨发推称:孙宇晨将价值 2280 万美元的 3 亿枚 JST 代币转入 HTX 交易所,这是其时隔...

5 标普500指数有望创1月以来新高

消息,据彭博社发推称:标普500指数有望自1月以来首次创下收盘纪录,因交易员在美国与伊朗...

6 特朗普威胁:鲍威尔若不及时离职,我将

消息,美国总统特朗普在接受福克斯商业频道采访时表示,如果美联储主席鲍威尔不及时离职...

7 CMU教授开源Agent框架Motus,多模型编排SW

消息,4 月 15 日,据 动察 Beating 监测,卡内基梅隆大学计算机科学系教授 Dimitrios Skarlatos和 ...

8 WLFI治理委员会投票决定销毁45.2亿枚代币

消息:WLFI 治理委员会投票决定销毁 45.2 亿枚代币,并将 623 亿枚 WLFI 锁定 2-5 年;早期支持者...

9 给Agent贴“产品经理”标签不会让它更专

消息,4 月 15 日,据 动察 Beating 监测,CrewAI、MetaGPT 等框架推广了一种多 Agent 设计:让不同...

10 阿里云:对大模型服务平台百炼部分MU模

消息,4 月 15 日,据 动察 Beating 监测,阿里云公告,为持续保障底层硬件的稳定供应、提升平...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。