当前位置:主页 > 要闻 >

英伟达开源120B智能体模型Nemotron 3 Super:仅激活十分之一参数,吞吐量最高达前代5倍

时间:2026-03-12 10:09:51

  消息,据 1M AI News 监测,英伟达发布开源大语言模型 Nemotron 3 Super,面向多智能体应用场景设计。模型总参数量 1200 亿,采用混合 Mamba-Transformer MoE 架构,推理时每个 token 仅激活 120 亿参数。其核心技术「潜在 MoE」将 token 嵌入压缩到低秩潜在空间后再路由至专家网络,实现以单个专家的计算成本同时激活 4 个专家,推理吞吐量较上一代 Nemotron Super 最高提升 5 倍。模型原生支持 100 万 token 上下文窗口,适用于需要长时间保持工作流状态的自主智能体。在评估智能体工作负载的 PinchBench 基准测试中,Nemotron 3 Super 得分 85.6%,是同类开源模型中的最高分。英伟达同步开源了超过 10 万亿 token 的训练数据集、15 个强化学习训练环境和评估方案,采用 NVIDIA Nemotron Open Model License 许可协议。模型已上线 Hugging Face、Perplexity、OpenRouter 等平台,并支持通过 Google Cloud、Oracle、AWS Bedrock、Azure 等云服务部署。Perplexity、CodeRabbit、Cadence、达索系统、西门子等公司已率先采用。

热点推荐
1 Arkham监测到疑似Mult早期发行in地址持有

消息,据Arkham在X平台发文表示,监测到一疑似Mult早期发行in地址,该地址曾在收到Galaxy Digit...

2 马斯克:XAI使用OpenAI训练模型是标准做法

消息,埃隆马斯克在审判证词中透露,XAI使用OpenAI来训练其自身模型,并称这是使用其他AI验证...

3 Lookonchain:Riot Platforms向NYDIG存入500枚BTC,

消息,据Lookonchain监测,加密矿企Riot Platforms继续出售BTC,其于5小时前向NYDIG存入500枚BTC,按当...

4 bubblemaps:8360个钱包已收到mega代币分配

消息,据bubblemaps披露,8360个钱包已收到mega代币分配,其中50%仍在持有,40%已全部卖出,10%已...

5 Tether过去30天铸造40亿美元USDT

消息,Tether在过去30天内铸造了40亿美元的USDT,其中最近一次铸造金额为10亿美元。...

6 伊朗股市暂停交易至

消息,伊朗证券交易组织宣布,根据最高证券委员会的决议,伊朗股市将暂停交易至5月4日。该...

7 Bitso报告:拉美稳定币购买超越比特币

消息,Bitso的一份报告显示,拉丁美洲的用户行为正在发生变化,美元挂钩的稳定币在日常金融...

8 美联储维持利率不变,BTC跌破75000美元

消息,4月29日,美联储宣布将基准利率维持在3.5%至3.75%不变,导致比特币价格在随后的交易中...

9 美国抵押贷款利率飙升至6.3%一个月来首次

消息,美国抵押贷款利率在一个月内首次上涨,现已飙升至6.3%。房地美周四报告称,30年期固...

10 伊朗称其40%的贸易可转向陆路运输

消息,伊朗航运协会集装箱委员会主席在4月30日表示,尽管敌方企图通过海上封锁切断伊朗的...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。