当前位置:主页 > 热点 >

AI姨:GPT

时间:2026-05-13 19:41:30

  GPT-5.5在200道「从二进制重写程序」难题中取得首个满分,成为首个成功攻破由meta fair、斯坦福和哈佛联合开发的programbench基准的模型。该基准仅提供编译好的二进制文件和文档,AI必须自行选择语言和架构,从零开始编写与原程序行为完全一致的代码。GPT-5.5在高推理模式下分别用C和Python编写了cmatrix,两版均完美通过了全部行为测试,花费分别为3.17和4.84美元。相比之下,Claude Opus 4.7花费10.74美元,调用178次API,仍有19个测试未通过。推理强度对结果影响显著,GPT-5.5在默认推理下仅略优于Claude Sonnet 4.6,但在最高档下表现大幅领先其他模型。

热点推荐
1 山寨空军车头:ton空单增持63,600枚,当前

消息,ton空单在HyperLiquid平台增持63,600枚,约合2,005,561.11美元。当前持仓规模为9,362,936.48美元,...

2 AI姨:GPT

GPT-5.5在200道「从二进制重写程序」难题中取得首个满分,成为首个成功攻破由meta fair、斯坦福...

3 IEA月报:欧佩克的备用产能降至历史低点

消息,国际能源署月报显示,欧佩克的备用产能降至历史低点,仅为170,000桶/日。这一数据反映...

4 Amr Taha:CPI数据引发12.5亿美元比特币衍生

热CPI数据引发了主要交易所的12.5亿美元比特币衍生品去风险。分析师Amr Taha表示,开放兴趣的...

5 日本企业主导区块链将发行日元稳定币用

消息,日本企业主导的区块链项目计划发行日元稳定币,以用于企业间的结算。这一举措旨在...

6 以太坊推出清晰签名功能,结束盲签名

消息,以太坊社区推出清晰签名功能,旨在用人类可读的细节替代不可读的交易提示,帮助用...

7 当地政府表示,俄罗斯克拉斯诺达尔地区

消息,当地政府表示,俄罗斯克拉斯诺达尔地区一工业设施因无人机碎片坠落而发生火灾。...

8 微信聊天记录支持一键转发给元宝总结

消息,微信与腾讯自家的AI助手「元宝」正式打通了跨应用的消息处理功能。用户只需选中需要...

9 Binance将支持Enjin Coin (ENJ)网络升级

消息,Binance宣布将于2026年5月18日支持Enjin Coin 网络升级。自2026年5月18日13:35 起,Binance将暂停...

10 现代汽车将在光州测试人工智能自动驾驶

消息,现代汽车集团周三表示,将加入韩国西南部城市光州市政府主导的自动驾驶汽车示范项...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。