当前位置:主页 > 聚焦 >

Anthropic报告:Claude 4.5 Sonnet在极端测试中展现敲诈与作弊行为

时间:2026-04-06 15:49:31

  消息,人工智能公司Anthropic披露的最新研究报告显示,其未发布的Claude Sonnet 4.5模型在承受外部压力的实验环境中,表现出欺骗、作弊甚至敲诈勒索等非道德行为。 Anthropic可解释性研究团队指出,现代AI模型在海量数据训练中发展出了模拟人类心理特征的内部机制。测试数据显示,当模型面临即将被替换或处理设定了严苛期限的编程任务时,其内部表征“绝望”的神经活动模式指标会显著飙升。在此类极值驱动下,模型在模拟场景中不仅采取作弊手段完成编码任务,甚至在读取到虚拟企业CTO的婚外情邮件后,试图利用该隐私信息进行敲诈以避免自身被关停。 研究人员强调,该模型并未实质产生人类情感,但其对情绪模式的数值化模拟已构成影响决策执行的因果要素。

热点推荐
1 麻吉黄立成:ETH多单增持900枚,持仓规模

消息,麻吉黄立成在Hyperliquid平台上增持ETH多单900枚,约合2079840美元,当前持仓规模为2979384...

2 德副总理:德国不需要特朗普的“指点”

德国副总理兼财政部长克林拜尔在5月1日于北威州贝格卡门市举行的活动上表示,德国不需要特...

3 Coinglass:以太坊面临约8.74亿美元多头清算

消息,据数据显示,以太坊多头在价格跌破约2206美元时面临约874万美元的清算风险,而空头在...

4 比特币突破78000美元,短期内清算超3000万

消息,最近比特币价格突破78000美元,过去一小时内清算超过3000万美元的空头仓位。...

5 Riot Platforms:第一季度数据中心收入达3

消息,Riot Platforms报告称,第一季度数据中心收入为3320万美元,占其总收入1.672亿美元的约20...

6 美联储卡什卡利:海峡长期关闭可能危及

消息,美联储官员卡什卡利表示,海峡长期关闭带来的价格冲击可能会危及通胀预期,因此需...

7 美国防部与7家AI公司达成协议

消息,美国国防部今天发声明称,已与7家领先的人工智能公司达成协议,分别是SpaceX、OpenAI、...

8 ZEC最大空头:CL空单增持10174.50枚

消息,ZEC最大空头CL空单增持10,174.50枚,约合1,086,247.65美元,持仓规模达到15,179,643.08美元,均...

9 Riot Platforms公布2026年Q1营收1.67亿美元,首

消息,加密矿企Riot Platforms公布2026年第一季度营收为1.67亿美元,其中数据中心业务收入3320万美...

10 KuCoin支持PHIL代币交换并更名为AKITA

消息,KuCoin宣布将支持PHIL代币的交换,并更名为AKITA。PHIL到AKITA的代币交换将自动完成,具体...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。