这项动态的影响程度如何？

该情报被评估为对企业具有重大影响，建议技术决策者关注。

Anthropic 2026-06-18

Product Launch 影响: Major 置信: 90%

NVIDIA GB300 NVL72 AgentPerf基准测试：每兆瓦代理数提升20倍，定义AI推理新标准

Q: 为什么Anthropic的这项动态对企业重要？

NVIDIA 推出 AgentPerf 基准测试并展示 GB300 的 20x 优势，本质上是**防御竞争对手（AMD、Intel、Cerebras）** 在推理领域崛起的战略动作。通过定义一个以**每兆瓦代理数**为核心的新指标，NVIDIA 试图将客户的采购标准从原始吞吐量转向其**Blackwell 架构的功耗效率**，从而锁定高端数据中心升级周期。 然而，该基准测试**故意淡化了实际部署中的成本陷阱**：GB300 NVL72 需要专用的液冷基础设施和极高功耗（超过 100kW/机架），对于现有风冷数据中心意味着巨大的改造开销。此外，代理型工作负载对**内存带宽和低尾部延迟**极其敏感，GB300 的 HBM3e 虽然带宽高，但在多代理并发场景下仍可能出现**PFC/ECN 拥塞控制瓶颈**，导致任务完成时间波动。NVIDIA 通过 **CUDA 生态和 NVLink** 进一步锁定用户，使得迁移到其他架构的**工具链和优化成本**极高。

内容摘要

NVIDIA GB300 NVL72在首个代理型AI基准测试AgentPerf中，运行DeepSeek V4 Pro模型，每兆瓦可处理多达20倍于H200的AI代理。该基准测试聚焦多步骤工具调用工作负载，揭示代理型AI对基础设施的新压力点，并推动行业向功耗效率优先的推理架构转型。

核心要点

Artificial Analysis 发布了首个专门针对代理型AI（Agentic AI）基础设施的基准测试 AgentPerf。该测试使用前沿的混合专家模型 DeepSeek V4 Pro，在真实的编码代理轨迹（coding-agent trajectories）上运行，模拟代理任务链式调用数十到数百个LLM和工具调用的场景。

NVIDIA 的 GB300 NVL72 系统在该基准测试中表现最佳，相比 H200 系统，每兆瓦可运行多达 20倍 的AI代理。GB300 NVL72 是一个机架级系统，连接72个GPU，测试时每个代理的生成速度设定为 20和60 tokens per second。目前，Baseten、DeepInfra 和 Together AI 等推理服务商已在 Blackwell 架构上提供代理型工作负载服务。AgentPerf结果于2026年6月12日发布。

重要性说明

NVIDIA 推出 AgentPerf 基准测试并展示 GB300 的 20x 优势，本质上是防御竞争对手（AMD、Intel、Cerebras） 在推理领域崛起的战略动作。通过定义一个以每兆瓦代理数为核心的新指标，NVIDIA 试图将客户的采购标准从原始吞吐量转向其Blackwell 架构的功耗效率，从而锁定高端数据中心升级周期。

然而，该基准测试故意淡化了实际部署中的成本陷阱：GB300 NVL72 需要专用的液冷基础设施和极高功耗（超过 100kW/机架），对于现有风冷数据中心意味着巨大的改造开销。此外，代理型工作负载对内存带宽和低尾部延迟极其敏感，GB300 的 HBM3e 虽然带宽高，但在多代理并发场景下仍可能出现PFC/ECN 拥塞控制瓶颈，导致任务完成时间波动。NVIDIA 通过 CUDA 生态和 NVLink 进一步锁定用户，使得迁移到其他架构的工具链和优化成本极高。

PRO 决策建议

【厂商（AMD、Intel、Cerebras等）】立即开发自己的代理型AI基准测试，突出每瓦特代理数或每美元代理数，并展示在现有机架式风冷环境下的实际部署优势。重点攻击GB300的液冷依赖和高TCO，提供可插拔的替代方案，如AMD CDNA4或Intel Gaudi 3，并强调开放软件栈（如ROCm、OneAPI）的灵活性。

【企业（CIO与架构师）】对AgentPerf结果进行零信任审计：要求NVIDIA提供GB300在真实数据中心环境（非理想实验室）的功耗、冷却和任务完成时间数据。进行独立基准测试，比较GB300与竞争对手在混合工作负载（聊天+代理）下的总体拥有成本。警惕NVLink和CUDA锁定，评估跨平台可移植性，确保未来不被单一供应商绑架。

【投资者】AgentPerf基准测试强化了NVIDIA在AI推理领域的护城河，但需关注竞争对手的追赶速度和数据中心改造成本对GB300渗透率的限制。长期看，代理型AI将推动推理市场爆发，但硬件供应商集中度风险可能引发监管关注。建议分散投资于白盒推理方案和云服务商自研芯片。

来源： ContentBuffer

查看原文 →

觉得这篇分析有用？

每周收到3-5条AI基础设施关键信号 →

内容摘要

核心要点

重要性说明

PRO 决策建议

觉得这篇分析有用？

💬 评论 (0)