DeepSeek-V3重磅发布：低成本挑战行业巨头

时间：2024-12-30 18:20:46

　　在人工智能领域，DeepSeek公司再度引发关注，推出了全新系列大模型——DeepSeek-V3。这个模型凭借强大的性能，迅速打破了业内的传统格局，成为众多AI爱好者和业内专家的热议话题。官方数据显示，DeepSeek-V3在多项基准测试中超越了阿里Qwen2.5-72B和Meta的Llama-3.1-405B等领先开源模型，甚至与GPT-4o、Claude-3.5-Sonnet等顶级闭源模型相当。

　　DeepSeek-V3的技术亮点不止于其出色的性能。该模型的参数量达到惊人的6710亿，采用了创新的混合专家（MoE）架构，预训练数据量高达14.8万亿tokens。更让人瞩目的是，它的训练成本仅为557.6万美元，相较于GPT-4o的1亿美元，差距可谓天壤之别。更低的成本意味着更高的性价比，使得DeepSeek-V3成为大模型市场中的黑马。

　　随着DeepSeek-V3的正式发布，定价策略也格外引人关注。每百万输入tokens仅需0.5元（缓存命中）/2元（缓存未命中），输出tokens定价为8元，并提供45天的优惠期。显然，DeepSeek正凭借其极具竞争力的价格，迅速抢占市场份额。

　　这一突破性的创新让许多人重新思考大模型的商业模式。尽管大公司如字节跳动、腾讯等纷纷调整价格，DeepSeek凭借其高效的运算和低廉的成本，在AI大模型领域中迅速崭露头角，预计将在未来几年中对整个行业产生深远的影响。

上一篇：中科电气调整负极材料项目资金规模，以应对市场竞争返回首页

下一篇：国际美妆大牌失意2024：囤货倒卖也带不动，有柜姐自掏腰包冲KPI

热点推荐

1 Barratt Redrow推出4亿英镑回购计划

消息，Barratt Redrow宣布将在投资者压力下启动4亿英镑的股票回购计划，此举是在受到激进投资...

2 李彦宏提出新指标「日活智能体数」衡量

消息，李彦宏在2026百度AI开发者大会上提出了一个新指标「日活智能体数」，以衡量智能经济...

3 BTC昨天的筹码压力变成今天的支撑

消息，据A早期发行in监测，BTC昨天的筹码压力已转变为今天的支撑。当前BTC正在测试近一个月...

4 美国国防部评估与伊朗战争成本最高达