当前位置:主页 > 热点 >

罗福莉:大模型迈入后训练时代,顶尖团队预训练与后训练算力比达1:1

时间:2026-04-24 13:11:44

  消息,罗福莉表示,大模型竞争已从预训练主导的chat时代,全面转向后训练主导的agent时代。当前的核心赛点是如何在agent上做好强化学习的scaling。她透露,在chat时代,用于研究、预训练和后训练的算力比例约为3:5:1而在如今的agent时代,合理的算力分配比例变为3:1:1,即预训练与后训练的算力投入已基本相当,目前顶尖模型团队在这两项的投入比例已达到1:1。同时,系统架构的要求也发生巨变,过去的强化学习基础设施主要以模型推理引擎为核心,处理纯文本演算现在的基建必须以agent为核心,支持异构集群调度,并能容忍agent在复杂工作流中因各类不可控因素中断的模糊性。

热点推荐
1 DeFiLlama:活跃RWA市场市值从41亿美元激增

活跃的RWA市场市值在一年多的时间里激增五倍,从41亿美元增至252亿美元,主要由代币化基金、...

2 比特币ETF在8天内流入超过20亿美元

消息,最近8天内,比特币现货ETF的资金流入超过20亿美元,延续了机构需求强劲的趋势。...

3 美军士兵因内幕交易被控,利用机密信息

美国士兵Gannon Ken Van Dyke因利用机密军事信息在加密预测平台Polymarket上进行内幕交易而被控,获...

4 罗福莉:大模型迈入后训练时代,顶尖团

消息,罗福莉表示,大模型竞争已从预训练主导的chat时代,全面转向后训练主导的agent时代。...

5 KuCoin调整部分交易对最低价格波动

消息,KuCoin宣布将于2026年4月27日02:00调整部分币币交易对的最低上落价位,以提高市场流动性...

6 中宣部版权管理局:将文创领域版权保护

消息,中宣部版权管理局局长王志成在国务院新闻办公室举行的新闻发布会上表示,今年计划...

7 美国石油业高管预计原油产量将上升

消息,随着伊朗持续的战事扰乱全球供应并推高原油和燃料价格,美国石油业高管预计原油产...

8 Megaeth:首次KPI达成,七天倒计时至代币生

以太坊Layer 2区块链Megaeth已成功清除其自设的第一个KPI,并将其原生代币Mega的代币生成事件定...

9 黑客转移100枚ETH至新钱包,仍持有21900枚

经过5个月的沉寂,黑客已将100枚ETH转移至新钱包,并开始再次转移ETH。目前,黑客仍持有219...

10 美特种兵因赌马杜罗下台获利40万美元遭

消息,美国司法部于4月23日证实,参与强行控制并转移委内瑞拉总统马杜罗的美国陆军特种部...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。