业界
中国AI模型迅速发展,引起美媒关注
时间:2024-12-26 17:33
据《华尔街日报》报道,中国人工智能(AI)创业公司在大模型领域的发展速度超出了许多业内人士的预期,正迅速追赶美国领先AI模型。今年11月,深度求索公司发布了其最新大语言模型的预览版,该公司声称在数学和编程任务上超越了OpenAI的预览版推理模型o1。
中国公司在大模型性能方面取得的进展得到了美国专家的认可。前OpenAI研究员、现AI企业家安德鲁·卡尔表示,中国公司在AI大模型上取得的进展令人印象深刻。月之暗面创始人杨植麟提到,公司专注于强化学习,模仿人类的试错过程,可能在提升模型性能的同时减少算力需求。
自去年年底以来,AI开发人员越来越多地使用“混合专家”(MoE)模型技术,通过组合多个“专家”模型来协同完成任务。腾讯在11月发布的MoE模型可媲美Meta在7月推出的Llama 3.1模型,且算力使用可能仅为Meta的十分之一。
美国AI创业公司Anthropic的联合创始人杰克·克拉克认为,中国公司的方法就是利用其能够获得的硬件,构建极其优秀的软件和硬件训练堆栈,中国制造将成为AI模型的一个标签。中国AI创业公司正在自己所擅长的领域深耕,例如深度求索专注于开源模型,月之暗面的聊天机器人Kimi擅长处理长文本。
尽管中国AI创业公司的估值还远低于美国公司,但随着技术进步和市场竞争的加剧,AI模型供应商之间的价格战已经开始出现。智谱AI已推迟了上市计划,因为投资银行家告知该公司不太可能获得其期望的估值。