当前位置:主页 > 热点 >

AI姨:GPT

时间:2026-05-13 19:41:30

  GPT-5.5在200道「从二进制重写程序」难题中取得首个满分,成为首个成功攻破由meta fair、斯坦福和哈佛联合开发的programbench基准的模型。该基准仅提供编译好的二进制文件和文档,AI必须自行选择语言和架构,从零开始编写与原程序行为完全一致的代码。GPT-5.5在高推理模式下分别用C和Python编写了cmatrix,两版均完美通过了全部行为测试,花费分别为3.17和4.84美元。相比之下,Claude Opus 4.7花费10.74美元,调用178次API,仍有19个测试未通过。推理强度对结果影响显著,GPT-5.5在默认推理下仅略优于Claude Sonnet 4.6,但在最高档下表现大幅领先其他模型。

热点推荐
1 XBIT DEX:德国vs科特迪瓦比赛预测

消息,XBIT DEX发文称,预测券焦点比赛奖金池为10,000美元,德国对阵科特迪瓦的当前市场预测显...

2 Bitget现货杠杆新增14个交易对

消息,Bitget现货逐仓杠杆现已新增14个交易对:re/USDT、uai/USDT、pumpbtc/USDT、aevo/USDT、stable/USDT、...

3 INJ成交量飙升6倍

消息,a早期发行in数据显示,币安的INJ/USDT永续合约在10分钟内成交量飙升6倍,近24小时成交额...

4 以太坊稳定币交易量自3月28日以来上涨超

消息,自3月28日以来,以太坊稳定币的交易量激增超过53000%。这一增长反映了市场对以太坊稳...

5 Samson Mow:未来比特币财库公司竞争将加剧

消息,吴说获悉,jan3 CEO Samson Mow发文表示,即使Strategy未来因分红或其他原因出售BTC,也会有...

6 CZ:不再运营交易所,看好BNB Chain升级与

消息,Binance创始人CZ在Galaxy Brains播客中表示,他将不再运营交易所,BNB Chain正在开发更快、更...

7 Charles Schwab进军预测市场,瞄准Kalshi和P

消息,Charles Schwab正在通过与CBOE的合作,准备推出基于SP 500的预测合约,直接与Kalshi、Polymar...

8 Elliptic与泰国警方合作分析500个可疑加密

消息,链上分析公司Elliptic表示,其与泰国皇家警察高科技犯罪部门合作分析了500多个可疑加密...

9 ENS DAO发起新的治理提案,扩展基金会职能

消息,吴说获悉,ENS DAO发起新的temp check治理提案,拟扩大ENS Foundation职能,将其职责扩展至运...

10 日本计划到2040年吸引2.3万亿美元公私投资

消息,日本计划到2040年在人工智能、芯片和太空领域吸引2.3万亿美元的公私投资,以推动新的...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。