N
NVIDIA
2026-06-15
Architecture Shift 影响: Major 置信: 85%

NVIDIA携ASUS推桌面级DGX Station:GB300芯片下放,控制点从云转向本地硬件生态

内容摘要

ASUS发布ExpertCenter Pro ET900N G3,基于NVIDIA DGX Station GB300架构,搭载GB300 Grace Blackwell Ultra芯片,提供748GB统一内存和20 PFLOPS AI性能。该桌面级AI超算支持本地LLM微调、推理及AI agent工作负载,通过NVLink-C2C实现高速互连,并集成NVIDIA AI软件栈与NemoClaw框架。

核心要点

ASUS ExpertCenter Pro ET900N G3是一款桌面级AI超级计算机,核心基于NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip,通过NVLink-C2C高带宽互连技术实现748GB的统一相干内存,提供高达20 PFLOPS的AI算力。该设备专为本地AI开发设计,支持大模型微调、生成式AI、物理AI及自主AI代理等现代工作负载。

性能方面,ASUS使用vLLMQwen开源模型进行压力测试,输出吞吐量达864 tokens/s,综合输入输出处理约1600 tokens/s。系统同时支持NVIDIA NemoClaw工作流,用于构建始终在线的AI助手和自主代理。整个平台集成NVIDIA AI软件栈,提供开箱即用的机器学习、分析及AI实验环境。ET900N G3旨在让企业无需数据中心即可部署超算级AI基础设施,兼顾数据隐私、低延迟和可控成本。

重要性说明

表面看,NVIDIA与ASUS合作提供了便捷的本地AI算力,但本质上这是一次控制平面转移:将AI工作负载的控制权从公有云(AWS、Azure、GCP)拉回到NVIDIA的专有硬件生态。企业一旦部署ET900N G3,就会深度绑定CUDANVLink-C2CNVIDIA AI EnterpriseNemoClaw等软件栈,形成强锁定。

隐性锁定资产:企业的AI模型、训练脚本、推理优化都将依赖NVIDIA的专有工具链(如vLLM的NVIDIA优化版、Nemo框架),迁移到AMD Instinct或Intel Gaudi几乎不可能。

物理限制与成本陷阱:748GB统一内存虽大,但受限于Grace Blackwell的ARM架构,与x86传统数据中心软件兼容性存疑。20 PFLOPS的峰值性能需要高功耗散热(可能需专用空调和电源),实际持续性能可能远低于峰值。此外,NVLink-C2C是NVIDIA专有互连,无法与其他厂商加速器混合使用,限制了未来异构扩展。NVIDIA此举是在合围AMD和Intel,通过提供完整的桌面级解决方案阻止它们进入企业AI桌面市场。

PRO 决策建议

【厂商】 AMD与Intel应加速推出基于开放标准(如OCP Accelerator ModuleCXL互连)的桌面级AI工作站,强调与x86生态兼容、多供应商互操作性,并联合云厂商提供混合部署方案。重点攻击NVIDIA的专有锁定ARM兼容性风险,推动PyTorchONNX Runtime等框架对非NVIDIA硬件的优化。

【企业】 CIO和架构师应进行零信任技术审计:评估长期TCO(包括电力、冷却、运维成本),要求供应商提供跨平台迁移路径(如模型导出为ONNX格式、使用标准化推理引擎)。避免将核心AI资产锁定在NVIDIA NemoClawvLLM专有优化上,坚持使用开源框架并测试AMD/Intel替代品的兼容性。考虑混合部署策略,保留部分云端弹性以对冲本地硬件折旧风险。

【投资者】 看穿NVIDIA此举是扩大护城河的战术:通过桌面级DGX Station将更多企业客户纳入其生态,提高替换成本。但需警惕反垄断风险开放生态(如RISC-V、开放加速器)的长期威胁。短期利好NVIDIA,但长期需关注AMD和Intel的反击以及云厂商(如AWS Trainium)的本地化方案。

来源: Techpowerup
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)