头条
如何把商业交给大模型?京东科技何晓冬:需要更严肃地把大模型“
从谈参数、谈技术,再到谈协同、谈应用,百模大战初始的狂热开始变得冷静,今年,大模型公司们明显变得更加务实、实际,市场也逐渐回归理性。
7月30日,京东云对外发布了一系列产品,包括企业大模型服务、言犀智能体平台、智能编程助手JoyCoder、言犀数字人3.0等。无论是否拥有产业一侧的基因,大模型都开始在不同场景更实际地落地,大模型公司们也从参数和技术的比拼,来到了商业生态之上,端到端产品的较量。比如,今年以来一些云厂商开始聚焦AI PC的落地,谈起具身智能的前景等。
不过,在产业应用之前,大模型依然有很多待解的难题。京东探索研究院院长、京东科技人工智能业务负责人何晓冬认为,想在更多产业侧应用落地,其一就是需要更严肃地把大模型的“幻觉率”降下来。
也就是说,在答错“13.8和13.11哪个数字大”,生成画面变形扭曲严重之时,你都还无法将自己的商业交给大模型。
京东2亿元再度战略投资AI炒菜机器人公司橡鹿科技,目的是探索“机器人+”产业,在端侧做更多AI、大模型技术的尝试。
OpenAI推出最具成本效益的小模型GPT-4o mini。据OpenAI介绍,小模型产品是想通过显著降低AI使用成本,扩大AI使用范围。包括Meta、谷歌等科技巨头也纷纷推出最新产品,并在价格上无一例外地开卷。
国内大模型价格战也被点燃。5月6日,大模型公司DeepSeek深度求索宣布将输入价格降至1元/百万tokens。随后,字节跳动的豆包大模型、阿里巴巴的通义系列模型以及百度的文心一言模型等纷纷跟进,均采取了降价策略。
何晓冬认为,价格战在短期内的确可以带来繁荣,但长期来看并不见得是件好事。“很可能连电费都付不起。”他坦言。
最直接的影响在于,短期内,价格战有助于大模型在B端、C端等市场层面的普及。但牺牲短期利益,是否可以实现长期的用户价值,实现规模化的应用,最终推动技术成为基础设施,这还需要打个问号。
何晓冬说:“我们看到一方面大模型技术在飞速发展,但目前也面临一些问题,首先就是Scaling Law。由于数据和算力的持续限制,如果简单只是提升模型规模,看起来这个天花板其实并不远。某种意义上,我们的大模型从百亿到千亿再到万亿的增长,问题还是出现在其所带来的经济效益在何处。”
因此,他判断,如果大模型带来经济效益不足以支撑大模型本身的成本的话,那么这个模式是难以持续的。他还坦言,大模型的商业化落地,现在目前看起来还是稍微有些落后,从中长期看起来,会成为一个问题。他觉得,产业和技术应该是互为驱动的。