OpenAI劲敌拟融资20亿美元背后：大模型融资竞赛提速 “AI六小龙”齐让路大厂？

时间：2025-01-09 23:44:03

　　“阿里云正在洽谈收购零一万物的预训练团队，已谈好报价。”彼时，阿里云未对该消息作出回应。

　　相比于“零一万物出售预训练团队”的说法，更接近事实的是，零一万物的确在进行预训练团队及Infra团队的调整，部分人员以跳槽形式加入阿里旗下公司。其中预训练算法团队获得通义团队offer，Infra团队则获得阿⾥云offer。

　　1月7日，李开复回应表示，只有大厂能够“烧”超大模型，零一万物内部愿意继续训练超大参数模型的成员，加入了零一万物和阿里云成立的“产业大模型联合实验室”。

　　去年5月，在零一万物发布千亿参数模型Yi-Large时，李开复还宣布公司已经启动下一代万亿参数Yi-XLarge MoE模型训练。当时，智谱、MiniMax、百川、月之暗面、零一万物、阶跃星辰在内的“AI六小龙”也在全力追逐AGI。

　　困扰李开复的“预训练”是什么？所谓“预训练”，指对大模型的基础教育，即赋予模型海量而通用的知识，来决定模型性能，这是模型厂商最核心的技术壁垒。而狂堆参数的Scaling Law，目前是预训练的主流路径，同时也意味着高昂且持续的算力和数据投入。

　　马斯克曾估算，GPT-5的训练可能需要3万-5万张H100，仅芯片成本就超过7亿美元，对于尚未规模化盈利的创业公司而言，继续堆参数训练模型，要跨越高企的资金门槛。

　　而大模型发展至当下阶段，边际效应显现。在接受晚点时，李开复提到，去年9、10月时，公司看到Scaling Law明显进入 diminishing return。不是说用更多算力和数据做不出进步，而是进步不符合投资回报，“从一张卡加到10张卡时，可以达到9.5张卡的价值，但从10万张卡加到100万张卡，也许只能达到 30万张卡的价值”。

　　事实上，去年10月有报道称，“AI六小龙”中已经有两家公司逐步放弃预训练模型，缩减了预训练算法团队人数，业务重心转向AI应用。而目前，放弃预训练的公司数量还在攀升。

　　“当下的技术路径很容易同质化和到达瓶颈，再多投入也可能无法建立有效壁垒。”一位业内高管告诉

　　从一级市场资金流向来看，侧重落地的细分领域AIGC投融资情况相对乐观。IT桔子的数据显示，2024年国内人工智能行业投资事件466个，投资金额634亿元，相比2023年分别减少27%、9%；细分领域AIGC方面，国内AIGC投资事件117个，同比减少26个，投资金额370亿元，增加164.82亿元，平均每个投资事件投资金额增加了一倍。

　　“从资金消耗程度来看，训练模型比开发推广应用要大。”上述高管向

上一篇：2024年度A股IPO融资报告：融资额和新股数齐创十年冰点返回首页

下一篇：NVIDIA CEO黄仁勋不惧川普关税，乐观期待监管放松

热点推荐

1 美国众议员Bryan Steil指出美联储实施GENI

消息，美国众议员Bryan Steil表示，美联储实施GENIUS Act规则的截止日期为本周六。...

2 协调导弹和无人机袭击目标美国在科威特

消息，协调的导弹和无人机袭击目标是美国在科威特的军事设施。这一海湾紧张局势的升级突...

3 DeepMind CEO提议独立标准机构，关注前沿

消息，DeepMind CEO提议成立一个独立的标准机构来监管前沿AI，认为加密行业应对此保持关注。该...

4 Shunyet Jan：Binance正专注于支付和金融服务

消息，Binance现货交易与衍生品负责人Shunyet Jan表示，Binance正在将重心从单纯的交易转向支付和...