兴中资讯

要闻

DeepSeek-V3重磅发布:低成本挑战行业巨头

时间:2024-12-30 18:20

  在人工智能领域,DeepSeek公司再度引发关注,推出了全新系列大模型——DeepSeek-V3。这个模型凭借强大的性能,迅速打破了业内的传统格局,成为众多AI爱好者和业内专家的热议话题。官方数据显示,DeepSeek-V3在多项基准测试中超越了阿里Qwen2.5-72B和Meta的Llama-3.1-405B等领先开源模型,甚至与GPT-4o、Claude-3.5-Sonnet等顶级闭源模型相当。

  DeepSeek-V3的技术亮点不止于其出色的性能。该模型的参数量达到惊人的6710亿,采用了创新的混合专家(MoE)架构,预训练数据量高达14.8万亿tokens。更让人瞩目的是,它的训练成本仅为557.6万美元,相较于GPT-4o的1亿美元,差距可谓天壤之别。更低的成本意味着更高的性价比,使得DeepSeek-V3成为大模型市场中的黑马。

  随着DeepSeek-V3的正式发布,定价策略也格外引人关注。每百万输入tokens仅需0.5元(缓存命中)/2元(缓存未命中),输出tokens定价为8元,并提供45天的优惠期。显然,DeepSeek正凭借其极具竞争力的价格,迅速抢占市场份额。

  这一突破性的创新让许多人重新思考大模型的商业模式。尽管大公司如字节跳动、腾讯等纷纷调整价格,DeepSeek凭借其高效的运算和低廉的成本,在AI大模型领域中迅速崭露头角,预计将在未来几年中对整个行业产生深远的影响。