Architecture Shift
影响: Important
强度: High
置信: 85%
英伟达通过OCP开放MRC协议,推动AI以太网架构标准化
内容摘要
英伟达宣布将其在Spectrum-X以太网硬件上验证的MRC(多路径可靠连接)RDMA传输协议通过开放计算项目(OCP)开放。该协议旨在通过多路径负载均衡和硬件级故障绕过,提升大规模AI训练集群的网络吞吐量、弹性和GPU利用率。
核心要点
MRC是一种新的RDMA传输协议,允许单个RDMA连接将流量分布到多个网络路径上,从而提高吞吐量、负载均衡和可用性。该协议已在OpenAI、微软等公司的AI工厂中部署,用于支撑前沿大模型训练。
MRC的关键特性包括:硬件加速的动态负载均衡、微秒级故障检测与重路由、智能重传以减少GPU空闲时间。它与Spectrum-X的多平面网络架构协同,可扩展至数十万GPU规模。
英伟达强调此举是将Spectrum-X定位为开放、可组合的AI原生以太网平台,并与AMD、博通、英特尔、微软、OpenAI合作开发MRC,推动其成为行业标准。
MRC的关键特性包括:硬件加速的动态负载均衡、微秒级故障检测与重路由、智能重传以减少GPU空闲时间。它与Spectrum-X的多平面网络架构协同,可扩展至数十万GPU规模。
英伟达强调此举是将Spectrum-X定位为开放、可组合的AI原生以太网平台,并与AMD、博通、英特尔、微软、OpenAI合作开发MRC,推动其成为行业标准。
重要性说明
此举是控制层转移型信号,将高性能AI网络的关键控制点从封闭的硬件/软件堆栈向开放协议层扩展。英伟达通过开放核心传输协议,试图定义AI以太网架构的行业标准,从而巩固其在AI基础设施生态中的核心地位,并加速企业级AI集群对以太网架构的采纳。
PRO 决策建议
**控制层转移型**
**厂商/Vendors**:网络与芯片厂商需评估支持或兼容MRC协议的战略必要性,不参与则可能在新一代AI网络标准中边缘化。
**企业/Enterprises**:需重新评估AI集群网络架构,将基于开放标准(如MRC)的以太网方案纳入未来18个月的技术选型框架。
**投资者/Investors**:关注价值从专有InfiniBand解决方案向开放、可组合的以太网AI网络平台迁移的趋势,监测其他主要厂商的跟进信号。
**厂商/Vendors**:网络与芯片厂商需评估支持或兼容MRC协议的战略必要性,不参与则可能在新一代AI网络标准中边缘化。
**企业/Enterprises**:需重新评估AI集群网络架构,将基于开放标准(如MRC)的以太网方案纳入未来18个月的技术选型框架。
**投资者/Investors**:关注价值从专有InfiniBand解决方案向开放、可组合的以太网AI网络平台迁移的趋势,监测其他主要厂商的跟进信号。
💬 评论 (0)