业界
|关注卖水人,DeepSeek对投资的意义
对于DeepSeek,此前笔者就曾说过,其意义不在这个模型有多先进,而在于其模式的创新,包括DeepSeek自身以及其对整个产业和投资的影响。
如果一定要蹭热点,DeepSeek更像最近大火的哪吒,不管是魔是仙,只要成功了人人都喜欢,英雄从来不问出处。梁文锋其实很谦虚,他说DeepSeek的成功是站在巨人的肩膀上。
这其实没错,没有GPT-4等一众大模型训练数据的基础,DeepSeek也没有蒸馏数据的本钱。从人类社会科技进步的发展史上看,从来都是后浪推前浪,先来者未必一定就是永远领先者。
比如福特发明了汽车,但现在最成功的却是欧洲的ABB;莱特兄弟发明了飞机,最后成功的却是波音和空客;手机的鼻祖是摩托罗拉,但在功能机时代却被诺基亚这个巨无霸取代,而到了智能机时代苹果一统天下。大家都是利用前人的成功再继续努力推动科技不断进步,只要是能提高生产效率的,都是好事。
很多人不理解DeepSeek的模式。其实也好理解,DeepSeek对比之前的其他大模型,模式更为灵活,固定资产摊销成本低,没有前期训练这一大块成本,所以产品价格具有极大的的竞争力。其实DeepSeek和Open AI的成本之争关键就在于此,Open AI在数据训练上烧了太多的钱。
市场都是以成败论英雄,DeepSeek成功了,让很多终端的中小AI企业看到了希望。可以预见,未来将有更多比DeepSeek性价比还要好,或者说在细分领域上更成功的AI应用会层出不穷,因为他们可以在现有成熟的大模型上直接蒸馏,做垂直细分产品,并且快速部署。
DeepSeek的成功,也给AI应用提出了一个命题,那就是如果按传统模式等着自建千卡万卡集群,然后再去训练和推理,可能会被时代淘汰。是的,这样一条龙下来可能技术是没什么问题,但市场没了。我曾预见未来AI应用不会是大厂的天下,果然,智谱、月之暗面、DeepSeek……没有一个是大厂的产品。因为现有AIDC云计算企业的算力足够终端企业去做推理出产品了,这对小米、字节跳动是个考验,几百亿投资万卡集群,还要搞一两年基建,是否值得?
因此,DeepSeek对于投资领域的机会,其实不是股权投资,而是卖水人。这里的卖水人就是提供智能算力的云计算数据中心企业,无论怎么蒸馏,都需要算力支撑,只是以前需要自己搞千卡万卡集群,现在直接租算力。
很多中小AI终端推理产品的企业可以直接上AIDC的云端去运作,但他们都会尽力避免上大厂的云,因为大厂自己也在做AI应用,你去他的云上开发数据,分分钟被蒸馏,抄得渣都不剩。
第三方公立云企业会脱颖而出,这是不争的事实,但需注意的是,AI推理对算力特别是智算算力需求非常依赖,因此云计算必须是新锐的AIDC,而不是传统的IDC。IDC和AIDC的关系很像CPU和GPU,都是数据计算,但侧重点不同。IDC主要靠CPU服务器输出数据,特点就是平稳,尽量减少输出波动,适合智慧城市管理这样需要大量数据正常运行的领域,主要的IDC企业包括三大运营商和各大互联网企业;AIDC主要靠GPU服务器输出数据,能满足AIGC对于数据训练和数据推理等瞬间数据爆发的要求。至于这两个领域的差别,其实也就是英特尔和英伟达的差别。英特尔的CPU到现在都是属于顶尖产品,但是在AIGC时代,英特尔的通用CPU就干不过英伟达专用数据而生的GPU,两个公司在资本市场表现也是一个在天上一个在地下。
目前,国内很多云计算企业的数据中心都还是传统的IDC,那么,如何分辨IDC和AIDC?可以从数据中心的建成时间来区别,三年前已经建好的数据中心大部分都是利用CPU服务器的,那时候英伟达还是英特尔的小弟,最近几年建设的数据中心很多用的是GPU服务器,也就是智算数据中心。
目前,在国内智算算力规模居前的AIDC包括万国数据、世纪互联、商汤、青云和优刻得等,其中商汤有自己的大模型,第三方公立云叠加AIDC规模化的是万国数据、世纪互联、青云和优刻得。万国数据、世纪互联和背靠小米的金山云三家都在海外上市,最近一年的涨幅都是7倍左右,由此可见,其实资本早就发现了AIGC时代卖水人的价值,对比来看A股的青云和优刻得更是小荷才露尖尖角。