NVIDIA | Product Launch |

NVIDIA Rubin GPU生产目标下调,Blackwell 2026年占比升至71%

NVIDIA Rubin GPU生产目标从200万颗下调至150万颗,主要因HBM4内存验证延迟。TrendForce数据显示2026年Blackwell占比从61%升至71%,巩固主导地位。美光退出Rubin HBM4供应链,SK海力士将占70%份额。分析师维持增持评级,认为影响有限。Rubin延迟可能延长SK海力士HBM3E的市场主导期。

2026-04-27 10:35
NVIDIA | Other |

英伟达内部规模化部署GPT-5.5驱动AI代理,定义企业AI基础设施新范式

英伟达宣布其超过1万名员工已通过Codex应用,在基于GB200 NVL72的NVIDIA基础设施上规模化使用GPT-5.5。此举不仅展示了前沿模型推理在企业内部工作流中实现‘变革性’生产力的技术可行性,更通过专用的安全云VM架构,为企业部署AI代理提供了可审计、隔离的参考范式。

2026-04-24 02:57
NVIDIA | Other |

NVIDIA与Google Cloud深化合作,构建面向AI工厂与物理AI的云基础设施

NVIDIA与Google Cloud宣布合作升级,推出基于Vera Rubin和Blackwell GPU的新实例,旨在构建支持近百万GPU集群的“AI工厂”,并整合Gemini、Nemotron等模型平台,加速从智能体到物理AI(如机器人、数字孪生)的生产级部署。

2026-04-22 20:00
NVIDIA | Other |

英伟达推动AI基础设施评估指标从FLOPS转向每token成本

英伟达提出应将“每token成本”而非“每美元FLOPS”作为评估AI基础设施的核心经济指标。这标志着从衡量计算输入转向衡量商业输出,涉及硬件、软件、网络的全栈优化,以降低企业AI推理的总拥有成本。

2026-04-15 23:00
NVIDIA | Financial News |

NVIDIA GPU租金2个月上涨48%

NVIDIA Blackwell GPU租金达4.08美元/小时,2个月上涨48%。中国云厂商同步涨价,智谱API Q1累计上调83%。

2026-04-15 14:46
Google | Other |

谷歌发布Gemma 4开源模型,瞄准边缘推理与AI代理架构

谷歌推出Gemma 4开源模型家族,包含从2B到31B的四个版本,强调单位参数性能突破,并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化,旨在将前沿推理能力扩展至移动与IoT场景。

2026-04-03 00:00
Google | Other |

Google发布Gemma 4开源模型系列

Google推出Gemma 4开源模型系列,包含四种规模变体,特别优化边缘计算和移动设备。该系列支持多模态处理、长上下文窗口和140多种语言,采用Apache 2.0许可。

2026-04-03 00:00
NVIDIA | Other |

英伟达联合能源机构展示AI算力工厂参与电网调峰

英伟达与能源研究机构EPRI、英国国家电网及初创公司Emerald AI合作,成功演示了基于Blackwell GPU集群的AI算力工厂如何根据电网实时需求,动态调节自身功耗以充当电网的“减震器”,同时保障高优先级AI工作负载的性能。

2026-03-25 19:00
NVIDIA | Other |

英伟达与Emerald AI展示AI工厂动态能耗调节能力

英伟达联合Emerald AI在96块Blackwell Ultra GPU集群上实现电网指令响应,通过NVIDIA System Management Interface获取秒级功耗数据,Emerald AI Conductor平台确保高优先级AI工作负载维持性能的同时动态调节能耗。

2026-03-25 19:00
NVIDIA | Other |

NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区

NVIDIA将其GPU动态资源分配(DRA)驱动捐献给CNCF,使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区,并协同多家云厂商推动标准化。

2026-03-24 16:00
ARM | Other |

ARM与NVIDIA推动AI工作站本地化变革

ARM与NVIDIA联合推出基于GB10 Grace Blackwell芯片的DGX Spark AI工作站系列,八家主流OEM厂商同步发布产品。该方案采用统一内存架构支持2000亿参数模型本地运行,第三方测试显示较x86方案提升41%渲染性能与3.2倍AI处理速度,实现云端工具链向边缘端无缝迁移。

2026-03-24 00:59
NVIDIA | Other |

NVIDIA Blackwell架构实现25倍能效提升

NVIDIA发布Blackwell GPU架构,通过Transformer引擎和NVLink互联技术创新,实现比前代Hopper架构25倍的能效提升。这一架构级突破将显著降低AI训练和推理的运营成本,直接影响数据中心TCO和可持续性指标。

2026-03-21 01:29
Cisco | Other |

思科UCS集成NVIDIA Blackwell GPU并实现动态资源池化

思科在UCS平台集成NVIDIA RTX PRO 4500 Blackwell GPU,支持在数据中心和边缘部署。通过Intersight管理平台实现动态GPU资源池化,可实时分配PCIe GPU资源。该方案提供验证设计蓝图,加速AI推理、视觉AI等多工作负载的规模化部署。

2026-03-18 23:00
NVIDIA | Other |

英伟达与电信运营商共建AI网格,重构分布式推理基础设施

英伟达与AT&T、康卡斯特等全球电信运营商合作,将现有分布式网络站点(如中心局、基站)升级为“AI网格”,旨在将AI推理能力部署到网络边缘,以降低延迟和成本。此举标志着电信网络从数据管道向分布式AI计算平台的战略转变。

2026-03-18 01:00
NVIDIA | Other |

NVIDIA联合电信运营商构建分布式AI推理网格

NVIDIA与AT&T、Comcast等电信运营商合作,将全球10万个网络站点和100GW备用电力转化为分布式AI计算平台,支持低延迟推理。该AI网格已在物联网、云游戏等场景验证,实现端到端低于500毫秒延迟和50%成本降低。

2026-03-18 01:00
Hewlett Packard Enterprise | Other |

HPE与NVIDIA推出AI Grid Solution,构建AI WAN fabric

HPE宣布与NVIDIA合作推出AI Grid Solution,旨在安全扩展边缘AI。该方案将WAN转化为AI WAN fabric,连接分布式推理站点与AI工厂,提供一致策略和可预测性能。支持服务提供商从连接转向AI服务提供。

2026-03-17 21:15
Cisco | Other |

Cisco与NVIDIA扩展AI工厂架构覆盖边缘和安全

Cisco宣布扩展与NVIDIA的Secure AI Factory,支持从数据中心到边缘站点的AI部署,新增安全功能如防火墙策略在DPUs和AI防御集成,提供灵活架构选择加速生产部署。

2026-03-17 04:30
Intel | Other |

英特尔至强6成为NVIDIA DGX Rubin主机CPU,强化AI推理基础设施

英特尔至强6处理器被选为NVIDIA DGX Rubin NVL8 AI系统的主机CPU,提供3倍内存带宽提升和全路径机密计算能力。该合作凸显了CPU在AI推理负载中负责数据编排、调度和安全的架构价值。

2026-03-17 02:18
NVIDIA | Other |

英伟达发布Nemotron 3 Super,优化智能体AI推理架构

英伟达推出1200亿参数Nemotron 3 Super模型,采用混合MoE架构结合Mamba与Transformer层,实现5倍吞吐量提升。该模型专为多智能体工作流设计,支持100万令牌上下文窗口,解决任务目标漂移问题。通过开放权重和云服务部署,降低企业智能体应用门槛。

2026-03-12 00:00
NVIDIA | Other |

NVIDIA与Thinking Machines Lab达成千兆瓦级AI基础设施合作

NVIDIA与Thinking Machines Lab宣布部署至少一千兆瓦的下一代Vera Rubin系统,用于前沿AI模型训练。该合作体现了超大规模AI算力需求的新标杆,标志着AI基础设施向千兆瓦级部署迈进。

2026-03-11 23:00
NVIDIA | Other |

NVIDIA推出RTX PRO Server虚拟化方案优化游戏开发AI基础设施

NVIDIA发布RTX PRO Server,基于RTX PRO 6000 GPU和vGPU软件构建集中式虚拟化GPU平台。支持MIG技术将单GPU划分为48个用户实例,提升资源利用率和团队协作效率。整合AI训练与图形工作流,实现动态资源分配和跨地域开发统一。

2026-03-10 23:30
Cisco | Other |

思科联合NVIDIA推出澳大利亚首个主权AI工厂

思科与Sharon AI合作,在澳大利亚部署基于1024个NVIDIA Blackwell Ultra GPU的AI工厂,整合UCS服务器、Nexus Hyperfabric和VAST Data存储,提供境内数据处理的AI基础设施。

2026-02-23 13:06