当前位置:主页 > 头条 >

OpenAI开源思维链可监控性评测:CoT越长越透明,RL不会教模型「藏心思」

时间:2026-04-24 19:00:48

  消息,OpenAI开源了论文《monitoring monitorability》的评测套件monitorability-evals,采用Apache-2.0许可。该套件用于衡量监控模型能否通过推理模型的思维链检测异常行为,覆盖13个评测和24个环境。评测分为干预型、过程型和结果属性型。核心发现显示,监控CoT比仅监控模型的最终动作更有效,且CoT越长可监控性越高。RL训练在当前规模下不会降低可监控性。对于低推理力度的大模型,使用推理力度更高的小模型可提高可监控性,代价是推理算力更贵。GPT-5.4 thinking system card已使用该评测,结果显示其整体CoT可监控性略低于GPT-5,但在agentic misalignment场景下接近100%。

热点推荐
1 Joseph Lubin:以太坊是全球可信中立的数字

消息,以太坊联合创始人Joseph Lubin发文表示,全球需要一个可信中立的数字资产结算平台,而...

2 AAVE年初至今借贷收益约4330万美元,占借

消息,吴说获悉,据msb intel引述数据,AAVE年初至今在借贷赛道中产生约4330万美元的收益,占整...

3 以媒:以军已在黎巴嫩停火,但未撤出黎

以方在黎南的政策保持不变,以军将继续回应黎巴嫩真主党任何违反停火协议的行为。过去两...

4 PeckShield:以太坊地址0x890a5122aa1da30fec428

以太坊地址0x890a5122aa1da30fec4286de7904ff808f0bd74a的价值暴跌70%。同时,alphausdc delta v2在msy/USDC市场中...

5 Axelar Network:安全事件源于第三方代币合

消息,Axelar Network发布说明称,Axelar Network和IBC协议未遭到攻击,受影响的代币智能合约并非由...

6 Lite Strategy领投Litvm 100万美元战略投资

纳斯达克上市的Lite Strategy领投Litvm 100万美元战略投资,获得治理参与权及未来代币的潜在认购...

7 主力24h动向:BTC大户成交限价卖单更多,

消息,据pro主力大单列表,BTC和ETH主力在最近24小时内的总成交数据如下:BTC累计成交5.33亿美...

8 隐私公链Namada遭黑客攻击,22.85万枚ATOM被

消息,隐私公链Namada官方宣布发生漏洞事件,团队正在调查并联系相关方处理。链上数据显示...

9 比特小鹿发布2026年5月生产运营更新

消息,比特小鹿发布了2026年5月的生产和运营更新报告,显示其自挖矿算力已达到70.2 EH/s,5月...

10 CZ:AI代理交易和支付将在数月内通过区块

消息,Binance创始人CZ在Galaxy Brains播客中表示,AI代理交易和支付将在数月内通过区块链技术实...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。