N
NVIDIA
2026-03-12
Vendor Strategy Important High 90% Confidence

英伟达发布Nemotron 3 Super,优化智能体AI推理架构

内容摘要

英伟达推出1200亿参数Nemotron 3 Super模型,采用混合MoE架构结合Mamba与Transformer层,实现5倍吞吐量提升。该模型专为多智能体工作流设计,支持100万令牌上下文窗口,解决任务目标漂移问题。通过开放权重和云服务部署,降低企业智能体应用门槛。

核心要点

英伟达发布Nemotron 3 Super模型,采用混合专家架构(MoE)集成Mamba层和Transformer层,引入潜在MoE与多令牌预测技术。模型在Blackwell平台上以NVFP4精度运行,相比Hopper FP8提升4倍推理速度无精度损失。提供完整训练方法、10万亿令牌数据集及评估方案,通过官网、Perplexity、Hugging Face及主流云平台部署。

重要性说明

英伟达通过开放模型战略强化AI基础设施竞争力,推动企业级智能体架构向高效推理方向演进,可能加速多智能体工作流在企业环境规模化部署。...

登录查看完整战略分析

免费注册
来源: NVIDIA Newsroom
查看原文 →