兴中资讯

快讯

DeepSeek发布强大开源模型DeepSeek-V3

时间:2024-12-30 11:45

  中国AI企业DeepSeek发布新一代开源模型DeepSeek-V3,拥有671B参数,主打长文本、程序码、数学题目及中文处理。DeepSeek-V3评测表现超越多个知名开源模型,且生成速度较V2.5快3倍。

  TechCrunch称DeepSeek-V3为目前最强大的开源模型之一,其预训练数据达14.8T词元。不过,AI模型需好硬件支撑,未优化前可能性能过剩。

  DeepSeek-V3提供API服务,优惠期价格极低,原价也远低于市场水平,引发AI模型价格战。DeepSeek由幻方量化支持,储备有NVIDIA A100,是中国少数具备此条件的企业。

  DeepSeek创始人梁文峰表示,DeepSeek-V2开发者均来自中国顶尖大学,无海归人才。DeepSeek的低价策略让字节跳动、阿里巴巴等企业跟进,成为中国AI模型价格战的源头。