Vendor Strategy
Important
High
90% Confidence
英伟达发布Nemotron 3 Super,优化智能体AI推理架构
内容摘要
英伟达推出1200亿参数Nemotron 3 Super模型,采用混合MoE架构结合Mamba与Transformer层,实现5倍吞吐量提升。该模型专为多智能体工作流设计,支持100万令牌上下文窗口,解决任务目标漂移问题。通过开放权重和云服务部署,降低企业智能体应用门槛。
核心要点
英伟达发布Nemotron 3 Super模型,采用混合专家架构(MoE)集成Mamba层和Transformer层,引入潜在MoE与多令牌预测技术。模型在Blackwell平台上以NVFP4精度运行,相比Hopper FP8提升4倍推理速度无精度损失。提供完整训练方法、10万亿令牌数据集及评估方案,通过官网、Perplexity、Hugging Face及主流云平台部署。
重要性说明
英伟达通过开放模型战略强化AI基础设施竞争力,推动企业级智能体架构向高效推理方向演进,可能加速多智能体工作流在企业环境规模化部署。...