业界
OpenAI劲敌拟融资20亿美元背后:大模型融资竞赛提速 “AI六小龙”齐让路大厂?
“阿里云正在洽谈收购零一万物的预训练团队,已谈好报价。”彼时,阿里云未对该消息作出回应。
相比于“零一万物出售预训练团队”的说法,更接近事实的是,零一万物的确在进行预训练团队及Infra团队的调整,部分人员以跳槽形式加入阿里旗下公司。其中预训练算法团队获得通义团队offer,Infra团队则获得阿⾥云offer。
1月7日,李开复回应表示,只有大厂能够“烧”超大模型,零一万物内部愿意继续训练超大参数模型的成员,加入了零一万物和阿里云成立的“产业大模型联合实验室”。
去年5月,在零一万物发布千亿参数模型Yi-Large时,李开复还宣布公司已经启动下一代万亿参数Yi-XLarge MoE模型训练。当时,智谱、MiniMax、百川、月之暗面、零一万物、阶跃星辰在内的“AI六小龙”也在全力追逐AGI。
困扰李开复的“预训练”是什么?所谓“预训练”,指对大模型的基础教育,即赋予模型海量而通用的知识,来决定模型性能,这是模型厂商最核心的技术壁垒。而狂堆参数的Scaling Law,目前是预训练的主流路径,同时也意味着高昂且持续的算力和数据投入。
马斯克曾估算,GPT-5的训练可能需要3万-5万张H100,仅芯片成本就超过7亿美元,对于尚未规模化盈利的创业公司而言,继续堆参数训练模型,要跨越高企的资金门槛。
而大模型发展至当下阶段,边际效应显现。在接受晚点时,李开复提到,去年9、10月时,公司看到Scaling Law明显进入 diminishing return。不是说用更多算力和数据做不出进步,而是进步不符合投资回报,“从一张卡加到10张卡时,可以达到9.5张卡的价值,但从10万张卡加到100万张卡,也许只能达到 30万张卡的价值”。
事实上,去年10月有报道称,“AI六小龙”中已经有两家公司逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用。而目前,放弃预训练的公司数量还在攀升。
“当下的技术路径很容易同质化和到达瓶颈,再多投入也可能无法建立有效壁垒。”一位业内高管告诉
从一级市场资金流向来看,侧重落地的细分领域AIGC投融资情况相对乐观。IT桔子的数据显示,2024年国内人工智能行业投资事件466个,投资金额634亿元,相比2023年分别减少27%、9%;细分领域AIGC方面,国内AIGC投资事件117个,同比减少26个,投资金额370亿元,增加164.82亿元,平均每个投资事件投资金额增加了一倍。
“从资金消耗程度来看,训练模型比开发推广应用要大。”上述高管向