NVIDIA - AI基础设施情报搜索

NVIDIA 其他 2026-07-01

NVIDIA BlueField-3 DPU：将AI云I/O控制权从CPU移至专用硬件，重塑算力交付安全边界

NVIDIA BlueField-3 DPU通过硬件级vDPA架构将虚拟化网络与存储数据面从主机CPU卸载至专用数据处理器，实现接近裸金属的性能与热迁移弹性。同时，它构建了CPU-DPU-GPU间的可信I/O通路，强化机密计算，但本质上是以专用硬件锁定云平台底层架构，增加对NVIDIA硅片的依赖。

TSMC 其他 2026-07-01

Etched发布Transformer专用ASIC Sohu：推理性能声称达H100的20倍，正面冲击NVIDIA垄断

AI芯片初创公司Etched推出首款Transformer专用ASIC芯片Sohu，采用台积电N4P工艺，搭载144GB HBM3E。通过将注意力机制固化于电路，实现8卡服务器运行Llama 70B吞吐量达H100的20倍，每美元性能为140倍。累计融资8亿美元，首批机柜今夏出货，直接挑战NVIDIA推理市场地位。

AMD 其他 2026-06-30

AMD与NVIDIA同步上调GPU套料价格10%，GDDR供应危机暴露AI挤压效应

AMD通知AIB合作伙伴，自2026年7月起将GPU核心与GDDR显存捆绑套料价格上调约10%，紧随NVIDIA此前对RTX 5090系列的涨价。两大巨头同步行动，根源在于AI产业爆发导致GDDR显存供应严重不足，存储半导体超级周期加剧供需失衡，预计下半年显卡终端售价将全面上涨。

Anthropic 其他 2026-06-30

Anthropic Claude独家登陆Azure，微软借GB300锁定AI模型分销权

Anthropic的Claude模型正式在Azure Foundry全面可用，基于NVIDIA GB300 NVL72集群（4600+ Blackwell Ultra GPU）。首批上线Opus 4.8和Haiku 4.5，支持提示缓存与扩展思考。微软获得独家企业分销渠道，强化对AWS/谷歌云的竞争地位。

Samsung Electronics 其他 2026-06-29

三星与SK海力士十年4.4万亿投资，AI存储与代工军备竞赛升级

三星电子与SK海力士宣布未来十年超1000万亿韩元（约4.4万亿人民币）投资计划，重点用于HBM4内存扩产、3nm GAA工艺良率提升及新建AI芯片工厂。此举旨在巩固HBM双寡头地位，并缩小与台积电在先进制程代工市场的差距，全球AI基础设施供应链成本结构将受深刻影响。

OpenAI 其他 2026-06-26

OpenAI联手博通9个月流片自研推理芯片Jalapeño，剑指NVIDIA生态

OpenAI与博通联合发布首款自研推理ASIC芯片Jalapeño，采用TSMC 3nm工艺，专为Transformer推理优化，目标推理成本降低50%。从设计到流片仅9个月，计划2026年底部署于千兆瓦级数据中心，标志着OpenAI向全栈AI基础设施提供商转型，直接挑战NVIDIA在推理市场的控制权。

Qualcomm 其他 2026-06-26

Qualcomm 39亿美元收购Modular并开源Mojo，直击NVIDIA CUDA控制权

Qualcomm以39亿美元全股票交易收购AI基础设施初创公司Modular，并宣布开源Mojo编程语言。Mojo结合Python易用性与系统级性能，旨在为AI开发者提供不依赖CUDA的高性能计算路径，强化Qualcomm在AI推理芯片及边缘AI市场的软件生态。

NVIDIA 其他 2026-06-26

NVIDIA Rubin平台强制100%液冷：温水冷却颠覆数据中心散热范式

NVIDIA披露Rubin平台全面液冷细节，采用45°C温水冷却实现100%无风扇、无冷水机组设计，彻底淘汰混合散热。该平台将于2026下半年量产，并要求所有数据中心必须完成液冷转型，标志着AI计算散热进入全液冷时代。

Qualcomm 其他 2026-06-25

高通HBC Gen 1堆叠LPDDR实现133TB/s带宽，颠覆HBM生态

高通发布HBC Gen 1，通过3D堆叠LPDDR内存并集成计算die，实现133 TB/s带宽和6倍能效提升。该技术计划2027年中随AI250加速器出货，意图替代传统HBM，但供应链和物理实现仍存疑。

OpenAI 其他 2026-06-25

Oracle国防生态第三批：离线AI边缘部署成为军事实战新范式

Oracle在布鲁塞尔国防科技峰会上宣布国防生态系统第三批成员，新增10家公司。同时，Whitespace的Saga AI系统已在英国皇家海军HIGHMAST行动中部署在Oracle Roving Edge Devices上，实现完全离线的分类AI工作负载处理，标志着主权边缘AI从概念走向实战。

Google Cloud 其他 2026-06-25

Google Cloud推多代理自主运维，控制点从人类转向AI验证架构

Google Cloud提出“agent-scale data management”，通过多代理验证架构减少人工监督，并与Nokia部署6个Gemini代理实现网络自治。同时Amazon计划商业化Trainium芯片，加剧AI硬件竞争，挑战Google TPU和Nvidia GPU。

NVIDIA 其他 2026-06-25

高通发布Dragonfly数据中心CPU与HBC内存，以推理优先架构挑战NVIDIA霸权

高通在投资者日公布完整数据中心路线图，包括250核Oryon CPU（Dragonfly C1000）、近内存计算HBC（声称133TB/s带宽）、AI300推理加速器（54x带宽提升），以及800G/1.6T互联。与Meta签署多年CPU供应协议，2028年商用，旨在以低功耗高带宽颠覆AI推理市场。

OpenAI 其他 2026-06-25

OpenAI联手Broadcom推出Jalapeno推理芯片，重塑AI硬件生态

OpenAI与Broadcom合作开发了名为Jalapeno的LLM推理加速芯片，采用多芯片模块、HBM3E内存，9个月完成流片。该芯片专为OpenAI模型栈优化，旨在降低推理成本并减少对NVIDIA GPU的依赖，计划2026年底部署。

AMD 其他 2026-06-24

台积电全先进制程涨价5-10%，AI芯片成本压力加剧

台积电通知客户将对7nm及以上所有先进制程涨价5-10%，覆盖其74%的晶圆营收。苹果、英伟达、AMD等厂商面临更高制造成本，可能传导至终端AI基础设施价格。

Cisco 其他 2026-06-24

Cisco Live US & InfoComm 2026 : la collaboration entre dans l’ère agentique

...

NVIDIA 其他 2026-06-24

NVIDIA与AWS联手：cuVS默认化GPU加速向量搜索，G7实例4.6倍推理性能突破

NVIDIA与AWS深度整合，推出EC2 G7实例（基于RTX PRO 4500 Blackwell GPU），性能提升4.6倍；并在OpenSearch Serverless中默认启用cuVS进行GPU加速向量索引，速度提升10倍、成本降低75%。AWS获GB300 Exemplar Cloud认证。

ARM 其他 2026-06-24

中国LineShine超算登顶TOP500：纯CPU架构突破2 ExaFLOPS，ARMv9+HBM成新范式

LineShine超级计算机基于13.79百万个ARMv9核心、20480节点，实现2.198 ExaFLOPS FP64持续性能，成为全球首个突破2 ExaFLOPS的系统。它完全依赖CPU（无GPU加速），每个节点配备双LX2 CPU（304核）和32GB HBM，展示了CPU+HBM架构在HPC领域的潜力。

NVIDIA 其他 2026-06-23

NVIDIA发布45°C高温液冷系统，Rubin芯片承诺减少100%水耗

NVIDIA为Rubin GPU推出高温液冷系统，冷却液温度45°C（高于热水浴缸），利用室外干冷却器实现闭环运行，宣称可减少电耗并消除水蒸发（水耗减少100%）。但系统在炎热气候下仍需冷水机组备用，且电力来源和芯片寿命影响未明确。