当前位置:主页 > 动态 >

DeepSeek V4发布:1.6T参数旗舰支持1M上下文,推理算力仅V3.2的27%

时间:2026-04-24 11:58:49

  消息,DeepSeek发布了V4系列,旗舰模型总参数为1.6T,支持1M上下文,推理算力仅为V3.2的27%。该系列包含两款MOE模型:v4-pro总参数1.6T,每token激活49Bv4-flash总参数284B,激活13B。架构升级包括混合注意力机制,显著降低长上下文开销,v4-pro单token推理FLOPS仅为V3.2的27%。预训练数据超过32T token,后训练分两阶段进行,v4-pro-max自称当前最强开源模型,推理表现接近闭源前沿。权重以FP4+FP8混合精度存储。

热点推荐
1 比特币现货ETF昨日净流入2.23亿美元,以太

消息,据sosovalue数据,昨日比特币现货ETF总净流入2.23亿美元,持续8日净流入。而以太坊现货...

2 摩根士丹利推出稳定币储备投资组合

摩根士丹利推出了稳定币储备投资组合,这是一个政府货币市场基金,旨在为稳定币发行者提...

3 DeepSeek V4发布:1.6T参数旗舰支持1M上下文

消息,DeepSeek发布了V4系列,旗舰模型总参数为1.6T,支持1M上下文,推理算力仅为V3.2的27%。该系...

4 渣打:市场目前只是在原地踏步

消息,渣打银行纽约分行全球G10外汇研究及北美宏观策略主管Steve Englander表示,目前市场并非...

5 黑石ETH ETF 4月23日净流出9060枚ETH,价值约

消息,黑石ETH ETF在4月23日的净流出为9060枚ETH,按当前价格计算约合2095万美元,交易量为5亿美...

6 mantlecore提交mip

消息,吴说获悉,mantlecore提交mip-34预案草案,拟授权mantle treasury向AAVE DAO提供最高3万枚ETH贷款...

7 鲸鱼0x2d2d过去9小时再购入2.83亿ASTEROID

消息,鲸鱼地址0x2d2d在过去9小时内再次花费368.23枚ETH购买了28.3亿枚ASTEROID。目前该地址持有...

8 Stani Kulechov:AAVE是我的“毕生事业”,个

AAVE创始人Stani Kulechov表示,AAVE是他的毕生事业,并确认他个人向DEFI United贡献了5000 ETH,以支持...

9 Jane Street向法院申请驳回Terraform内幕交易

Jane Street已向法院申请驳回一项指控其在Terraform崩盘前进行内幕交易的诉讼,否认相关内幕交易...

10 伊朗领导层集体否认内斗分裂

消息,伊朗领导层于4月23日晚通过社交媒体集体否认内斗分裂。伊朗总统佩泽希齐扬、议长卡...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。