Scaling - AI基础设施情报搜索

Anthropic 其他 2026-07-07

Anthropic企业AI采用首超OpenAI 300亿年化收入运行率确认

...

NVIDIA 其他 2026-07-06

NVIDIA Kyber NVL144延迟至2028年：PCB中板制造瓶颈暴露AI规模扩展隐形天花板

半导体研究机构SemiAnalysis披露，NVIDIA下一代机架级AI架构Kyber NVL144因78层正交背板（PCB中板）制造工艺挑战延迟超12个月至2028年。过渡方案NVL72x2因运维负担被取消，4芯片版Rubin Ultra也已取消，NVIDIA在规模扩展域出现产品空白期。

Qualcomm 其他 2026-06-25

高通HBC Gen 1堆叠LPDDR实现133TB/s带宽，颠覆HBM生态

高通发布HBC Gen 1，通过3D堆叠LPDDR内存并集成计算die，实现133 TB/s带宽和6倍能效提升。该技术计划2027年中随AI250加速器出货，意图替代传统HBM，但供应链和物理实现仍存疑。

Huawei 其他 2026-06-25

华为推AI原生网络架构：从字节计费转向Token货币化，UCM缓存突破长上下文瓶颈

华为在MWC上海2026发布AI原生网络架构，集成服务-网络-计算，实现从流量中心到智能中心的转变。核心是Unified Cache Manager（UCM）将KV缓存扩展至PB级外存，在GLM-5.1模型128K序列长度下实现372% token吞吐量提升。同时推出token货币化框架，允许运营商按AI推理容量计费，并引入agentic运营模式。

NVIDIA 其他 2026-06-25

高通发布Dragonfly数据中心CPU与HBC内存，以推理优先架构挑战NVIDIA霸权

高通在投资者日公布完整数据中心路线图，包括250核Oryon CPU（Dragonfly C1000）、近内存计算HBC（声称133TB/s带宽）、AI300推理加速器（54x带宽提升），以及800G/1.6T互联。与Meta签署多年CPU供应协议，2028年商用，旨在以低功耗高带宽颠覆AI推理市场。

AMD 其他 2026-06-24

台积电全先进制程涨价5-10%，AI芯片成本压力加剧

台积电通知客户将对7nm及以上所有先进制程涨价5-10%，覆盖其74%的晶圆营收。苹果、英伟达、AMD等厂商面临更高制造成本，可能传导至终端AI基础设施价格。

NVIDIA 其他 2026-06-24

NVIDIA与AWS联手：cuVS默认化GPU加速向量搜索，G7实例4.6倍推理性能突破

NVIDIA与AWS深度整合，推出EC2 G7实例（基于RTX PRO 4500 Blackwell GPU），性能提升4.6倍；并在OpenSearch Serverless中默认启用cuVS进行GPU加速向量索引，速度提升10倍、成本降低75%。AWS获GB300 Exemplar Cloud认证。

AMD 其他 2026-06-23

AMD MI430X以200+ TFLOPS原生FP64性能，重新定义HPC与AI融合算力基线

AMD在TOP500榜单中驱动4台前十超算，并预览MI430X GPU，承诺超过200 TFLOPS原生FP64性能。此举直接针对AI for Science场景，将双精度计算作为下一代HPC与AI融合基础设施的核心指标，对NVIDIA和Intel形成直接竞争压力。

NVIDIA 其他 2026-06-23

NVIDIA借AI代理与数字孪生重塑电信网络控制平面

NVIDIA在DTW Ignite 2026展示其AI代理平台，集成NeMo合成数据、NemoClaw安全运行时、OpenShell沙箱及RTX PRO 6000加速的数字孪生，旨在实现电信网络自主运营。合作伙伴包括SoftBank、Amdocs、NTT DATA等，共同推动从任务自动化向自主网络转型。

ARM 其他 2026-06-23

Arm服务器收入占比超45%，AI驱动下x86生态面临重构

IDC数据显示，2026年Q1全球服务器市场收入创纪录达1226亿美元，其中Arm架构服务器收入占比超过45%，x86降至52%。加速服务器（GPU/ASIC/FPGA）贡献超70%收入。Nvidia Grace CPU（NVL72）及超大规模厂商自研Arm芯片是主要驱动力，x86在出货量上仍占优但受供应限制。

NVIDIA 其他 2026-06-22

NVIDIA JUPITER超算验证Grace Hopper平台：百亿亿次科学计算进入生产阶段

欧洲首台百亿亿次超算JUPITER基于NVIDIA Grace Hopper Superchips和Quantum-X800 InfiniBand，完成了人类大脑细胞级图谱、1公里分辨率气候模拟、6G AI模型训练和50量子比特量子计算模拟，标志着百亿亿次计算从研究走向生产。

NVIDIA 其他 2026-06-22

NVIDIA Rubin全液冷突破45°C，冷却能耗骤降40%

NVIDIA Rubin代AI服务器实现100%液冷，冷却液温度高达45°C，无风扇、无冷热通道。DSX参考设计采用封闭循环干冷器，零水消耗，冷却能耗降低约40%。该架构使机架密度提升3倍，推动AI工厂冷却范式根本转变。

Google 其他 2026-06-18

Google AI Studio Starter Tier：预配置无服务器堆栈，以生态锁定换取零门槛部署

Google推出AI Studio Starter Tier，提供预配置的Cloud Run、Firestore、Cloud SQL for PostgreSQL和Firebase Authentication堆栈，无需支付方式即可从原型到上线。该层锁定单区域、有限API和共享配额，但支持无缝升级到完整GCP项目，旨在降低AI应用部署门槛并强化生态绑定。

NVIDIA 其他 2026-06-18

NVIDIA借法国AI基建合围欧洲：开放模型Nemotron背后的硬件锁定

NVIDIA联合法国政府、Mistral、Scaleway等部署GB200、Blackwell B300及Vera Rubin NVL72硬件，并通过Nemotron开放模型联盟吸引LINAGORA、H Company等，构建以NVIDIA为中心的AI基础设施生态，表面开放实则强化硬件依赖。

NVIDIA 其他 2026-06-18

Nvidia ENPIRE框架：AI编码代理自主训练机器人安装GPU，实现99%成功率

Nvidia GEAR实验室与CMU、UC Berkeley联合发布ENPIRE框架，利用Codex、Claude Code等AI编码代理自主编写机器人训练代码、测试并迭代，在GPU安装等接触密集型任务上达到99%成功率。系统通过Git共享结果，无需人类干预，但token消耗随规模超线性增长，仿真到现实仍有差距。

Google Cloud 其他 2026-06-17

ASUS联手NVIDIA推出桌面级AI超算，企业AI控制权从云端向本地急剧转移

ASUS发布基于NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip的ExpertCenter Pro ET900N G3桌面系统，提供20 PFLOPS AI算力与748GB一致内存，可运行近万亿参数模型。同时，Coherent在德州扩建磷化铟工厂保障光互联供应，NVIDIA计划发行200-250亿美元债券筹资。

NVIDIA 其他 2026-06-17

NVIDIA联合Coherent扩建6英寸InP晶圆厂，锁定AI光学互连供应链

Coherent在德州扩建全球首座6英寸磷化铟晶圆厂，NVIDIA投资20亿美元并承诺数十亿美元采购。该厂生产激光器、收发器和可插拔光学模块，支撑NVIDIA Vera Rubin Ultra NVL576等576-GPU集群的硅光子互连，标志着AI数据中心从铜缆向光通信的规模化转折。

Huawei 其他 2026-06-17

华为LogicFolding架构：以3D堆叠绕过制程封锁，重塑AI芯片竞争格局

华为提出Tau Scaling Law和LogicFolding架构，通过垂直堆叠逻辑单元实现晶体管密度提升55%、能效提升41%，并宣称2031年可达1.4nm等效。同时Ascend 920/910C芯片已用于训练DeepSeek V4-Pro模型，证明其AI芯片从理论走向实战，威胁Nvidia在华市场。