当前位置:主页 > 要闻 >

英伟达开源120B智能体模型Nemotron 3 Super:仅激活十分之一参数,吞吐量最高达前代5倍

时间:2026-03-12 10:09:51

  消息,据 1M AI News 监测,英伟达发布开源大语言模型 Nemotron 3 Super,面向多智能体应用场景设计。模型总参数量 1200 亿,采用混合 Mamba-Transformer MoE 架构,推理时每个 token 仅激活 120 亿参数。其核心技术「潜在 MoE」将 token 嵌入压缩到低秩潜在空间后再路由至专家网络,实现以单个专家的计算成本同时激活 4 个专家,推理吞吐量较上一代 Nemotron Super 最高提升 5 倍。模型原生支持 100 万 token 上下文窗口,适用于需要长时间保持工作流状态的自主智能体。在评估智能体工作负载的 PinchBench 基准测试中,Nemotron 3 Super 得分 85.6%,是同类开源模型中的最高分。英伟达同步开源了超过 10 万亿 token 的训练数据集、15 个强化学习训练环境和评估方案,采用 NVIDIA Nemotron Open Model License 许可协议。模型已上线 Hugging Face、Perplexity、OpenRouter 等平台,并支持通过 Google Cloud、Oracle、AWS Bedrock、Azure 等云服务部署。Perplexity、CodeRabbit、Cadence、达索系统、西门子等公司已率先采用。

热点推荐
1 Securitize起诉tZERO,专利争议升级至特拉华

消息,Securitize已在美国特拉华州地方法院提起诉讼,回应tZERO对其专利侵权的指控。Securitize希...

2 高位布空交易员:HYPE空单减持4449.56枚,

消息,高位布空交易员近期减持HYPE空单4,449.56枚,按当前币价计算约合2,281,617.90美元。该交易...

3 加密游说团反对五年质押和挖矿税上限

消息,三大加密贸易组织已向国会请求通过《挖矿和质押税收明确法案》,反对对质押和挖矿...

4 郑迪:区块链最大问题是“路已经修好了

消息,web3投资人郑迪在南方东英CSOP代币化产品发布会圆桌论坛上接受南方东英副行政总裁兼...

5 石油对全球经济和地缘政治的主导性影响

消息,每日电讯报金融专栏作家马修林恩表示,对能源市场而言,美以对伊朗的军事行动本是...

6 火山引擎总裁谭待:豆包大模型日均Tok

消息,火山引擎总裁谭待在6月23日的force原动力大会上宣布,截至6月,豆包大模型日均tokens使...

7 Upbit新增Archylium (ARX)交易支持

消息,Upbit交易所新增对Archylium 的交易支持,涵盖KRW、BTC和USDT市场。Archylium 当前市值为6190万...

8 两名巨鲸今日合计开多2754枚BTC,总价值

消息,据链上分析师余烬监测,两名巨鲸今日合计开多2754枚BTC,总价值约1.75亿美元。其中,地...

9 高通公司正就收购Modular进行深入谈判

高通公司正就收购AI芯片初创公司Modular进行深入谈判,交易估值约为40亿美元。...

10 高位布空交易员:mu减持空单1131.42枚

消息,高位布空交易员mu减持空单1,131.42枚,约合1,216,965.71美元。其持仓规模为18,864,485.29美元,...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。