英伟达发布Nemotron 3 Super，优化智能体AI推理架构

内容摘要

英伟达推出1200亿参数Nemotron 3 Super模型，采用混合MoE架构结合Mamba与Transformer层，实现5倍吞吐量提升。该模型专为多智能体工作流设计，支持100万令牌上下文窗口，解决任务目标漂移问题。通过开放权重和云服务部署，降低企业智能体应用门槛。

核心要点

英伟达发布Nemotron 3 Super模型，采用混合专家架构（MoE）集成Mamba层和Transformer层，引入潜在MoE与多令牌预测技术。模型在Blackwell平台上以NVFP4精度运行，相比Hopper FP8提升4倍推理速度无精度损失。提供完整训练方法、10万亿令牌数据集及评估方案，通过官网、Perplexity、Hugging Face及主流云平台部署。

重要性说明

英伟达通过开放模型战略强化AI基础设施竞争力，推动企业级智能体架构向高效推理方向演进，可能加速多智能体工作流在企业环境规模化部署。...

登录查看完整战略分析

免费注册

来源： NVIDIA Newsroom

查看原文 →