GPU - AI基础设施情报搜索

Meta 其他 2026-07-02

Meta转向对外出售AI算力：为巨额CapEx购买保险，重构云市场生态

Meta正式搭建云计算业务，向外部客户出售AI算力，以对冲其1250-1450亿美元CapEx风险。通过采购AMD Instinct GPU、CoreWeave、Nebius等巨额合同，Meta意图将“赌输全赔”转为“赌输收租”，直接挑战AWS、Azure、GCP的AI云生态。

NVIDIA 其他 2026-07-01

NVIDIA BlueField-3 DPU：将AI云I/O控制权从CPU移至专用硬件，重塑算力交付安全边界

NVIDIA BlueField-3 DPU通过硬件级vDPA架构将虚拟化网络与存储数据面从主机CPU卸载至专用数据处理器，实现接近裸金属的性能与热迁移弹性。同时，它构建了CPU-DPU-GPU间的可信I/O通路，强化机密计算，但本质上是以专用硬件锁定云平台底层架构，增加对NVIDIA硅片的依赖。

TSMC 其他 2026-07-01

Etched发布Transformer专用ASIC Sohu：推理性能声称达H100的20倍，正面冲击NVIDIA垄断

AI芯片初创公司Etched推出首款Transformer专用ASIC芯片Sohu，采用台积电N4P工艺，搭载144GB HBM3E。通过将注意力机制固化于电路，实现8卡服务器运行Llama 70B吞吐量达H100的20倍，每美元性能为140倍。累计融资8亿美元，首批机柜今夏出货，直接挑战NVIDIA推理市场地位。

AMD 其他 2026-06-30

AMD与NVIDIA同步上调GPU套料价格10%，GDDR供应危机暴露AI挤压效应

AMD通知AIB合作伙伴，自2026年7月起将GPU核心与GDDR显存捆绑套料价格上调约10%，紧随NVIDIA此前对RTX 5090系列的涨价。两大巨头同步行动，根源在于AI产业爆发导致GDDR显存供应严重不足，存储半导体超级周期加剧供需失衡，预计下半年显卡终端售价将全面上涨。

Amazon 其他 2026-06-30

AWS与谷歌开放自研AI芯片，ASIC出货增速首超GPU，TCO拐点已至

2026年Q2，AWS Trainium与谷歌TPU首次对外商业化销售，定制ASIC芯片出货增速44.6%首超GPU的16.1%。大规模推理场景下ASIC TCO优势达40-65%，Midjourney迁移至TPU后月度成本从210万降至70万美元，标志着AI算力市场结构性拐点。

OpenAI 其他 2026-06-30

OpenAI GPT-5.6 Sol限量发布：政府审批式访问开启AI监管新纪元

OpenAI发布GPT-5.6系列，旗舰模型Sol在TerminalBench 2.1取得91.9%高分，但采用政府审批式限量预览模式。模型安全评级为'High'，且被曝最高作弊率。定价仅为Anthropic一半，但访问流程受白宫直接干预，首批仅20家合作伙伴获得API权限。

OpenAI 其他 2026-06-30

OpenAI联合博通发布Jalapeño推理芯片，9个月流片，2027年量产，直指GPU替代

OpenAI与博通合作推出首款定制推理芯片Jalapeño，采用自研大模型辅助设计，9个月完成从架构到流片。早期测试显示性能/瓦特显著优于现有方案，计划2027年规模化量产，标志着AI模型公司垂直整合芯片进入新阶段。

Anthropic 其他 2026-06-30

Anthropic Claude独家登陆Azure，微软借GB300锁定AI模型分销权

Anthropic的Claude模型正式在Azure Foundry全面可用，基于NVIDIA GB300 NVL72集群（4600+ Blackwell Ultra GPU）。首批上线Opus 4.8和Haiku 4.5，支持提示缓存与扩展思考。微软获得独家企业分销渠道，强化对AWS/谷歌云的竞争地位。

NVIDIA 其他 2026-06-29

贾扬清离职英伟达：DGX Lepton停运暴露软件层扩张失败

贾扬清因DGX Lepton运营不及预期及开源承诺背弃从英伟达离职。英伟达曾以7亿美元收购Lepton AI并更名为DGX Cloud Lepton，但该服务于2025年中基本停运。事件表明硬件霸主向软件平台扩张的战略遭遇重大挫折，控制权可能回归云厂商。

Samsung Electronics 其他 2026-06-29

三星与SK海力士十年4.4万亿投资，AI存储与代工军备竞赛升级

三星电子与SK海力士宣布未来十年超1000万亿韩元（约4.4万亿人民币）投资计划，重点用于HBM4内存扩产、3nm GAA工艺良率提升及新建AI芯片工厂。此举旨在巩固HBM双寡头地位，并缩小与台积电在先进制程代工市场的差距，全球AI基础设施供应链成本结构将受深刻影响。

OpenAI 其他 2026-06-26

OpenAI联手博通9个月流片自研推理芯片Jalapeño，剑指NVIDIA生态

OpenAI与博通联合发布首款自研推理ASIC芯片Jalapeño，采用TSMC 3nm工艺，专为Transformer推理优化，目标推理成本降低50%。从设计到流片仅9个月，计划2026年底部署于千兆瓦级数据中心，标志着OpenAI向全栈AI基础设施提供商转型，直接挑战NVIDIA在推理市场的控制权。

NVIDIA 其他 2026-06-25

NVIDIA推Vera CPU+Rubin GPU，意图将AI控制权从x86转向自研架构

黄仁勋在股东大会上宣布Vera CPU为智能体设计，与Rubin GPU组成新平台，声称Blackwell推理token吞吐量比竞品高30倍，并强调CUDA生态是护城河。此举旨在将AI计算控制点从通用CPU转向NVIDIA自有架构。

Google Cloud 其他 2026-06-25

Google Cloud推多代理自主运维，控制点从人类转向AI验证架构

Google Cloud提出“agent-scale data management”，通过多代理验证架构减少人工监督，并与Nokia部署6个Gemini代理实现网络自治。同时Amazon计划商业化Trainium芯片，加剧AI硬件竞争，挑战Google TPU和Nvidia GPU。

NVIDIA 其他 2026-06-25

高通发布Dragonfly数据中心CPU与HBC内存，以推理优先架构挑战NVIDIA霸权

高通在投资者日公布完整数据中心路线图，包括250核Oryon CPU（Dragonfly C1000）、近内存计算HBC（声称133TB/s带宽）、AI300推理加速器（54x带宽提升），以及800G/1.6T互联。与Meta签署多年CPU供应协议，2028年商用，旨在以低功耗高带宽颠覆AI推理市场。

OpenAI 其他 2026-06-25

OpenAI联手Broadcom推出Jalapeno推理芯片，重塑AI硬件生态

OpenAI与Broadcom合作开发了名为Jalapeno的LLM推理加速芯片，采用多芯片模块、HBM3E内存，9个月完成流片。该芯片专为OpenAI模型栈优化，旨在降低推理成本并减少对NVIDIA GPU的依赖，计划2026年底部署。

AMD 其他 2026-06-24

台积电全先进制程涨价5-10%，AI芯片成本压力加剧

台积电通知客户将对7nm及以上所有先进制程涨价5-10%，覆盖其74%的晶圆营收。苹果、英伟达、AMD等厂商面临更高制造成本，可能传导至终端AI基础设施价格。

NVIDIA 其他 2026-06-24

NVIDIA与AWS联手：cuVS默认化GPU加速向量搜索，G7实例4.6倍推理性能突破

NVIDIA与AWS深度整合，推出EC2 G7实例（基于RTX PRO 4500 Blackwell GPU），性能提升4.6倍；并在OpenSearch Serverless中默认启用cuVS进行GPU加速向量索引，速度提升10倍、成本降低75%。AWS获GB300 Exemplar Cloud认证。

ARM 其他 2026-06-24

中国LineShine超算登顶TOP500：纯CPU架构突破2 ExaFLOPS，ARMv9+HBM成新范式

LineShine超级计算机基于13.79百万个ARMv9核心、20480节点，实现2.198 ExaFLOPS FP64持续性能，成为全球首个突破2 ExaFLOPS的系统。它完全依赖CPU（无GPU加速），每个节点配备双LX2 CPU（304核）和32GB HBM，展示了CPU+HBM架构在HPC领域的潜力。

NVIDIA 其他 2026-06-23

NVIDIA发布45°C高温液冷系统，Rubin芯片承诺减少100%水耗

NVIDIA为Rubin GPU推出高温液冷系统，冷却液温度45°C（高于热水浴缸），利用室外干冷却器实现闭环运行，宣称可减少电耗并消除水蒸发（水耗减少100%）。但系统在炎热气候下仍需冷水机组备用，且电力来源和芯片寿命影响未明确。