CUDA - AI基础设施情报搜索

AMD 其他 2026-07-10

Towards Feature Complete Triton Support in JAX-Triton â ROCm Blogs

...

Qualcomm 其他 2026-06-26

Qualcomm 39亿美元收购Modular并开源Mojo，直击NVIDIA CUDA控制权

Qualcomm以39亿美元全股票交易收购AI基础设施初创公司Modular，并宣布开源Mojo编程语言。Mojo结合Python易用性与系统级性能，旨在为AI开发者提供不依赖CUDA的高性能计算路径，强化Qualcomm在AI推理芯片及边缘AI市场的软件生态。

NVIDIA 其他 2026-06-25

NVIDIA推Vera CPU+Rubin GPU，意图将AI控制权从x86转向自研架构

黄仁勋在股东大会上宣布Vera CPU为智能体设计，与Rubin GPU组成新平台，声称Blackwell推理token吞吐量比竞品高30倍，并强调CUDA生态是护城河。此举旨在将AI计算控制点从通用CPU转向NVIDIA自有架构。

NVIDIA 其他 2026-06-22

戴尔XE8812服务器：NVIDIA Vera Rubin NVL4的液冷密度陷阱

戴尔发布PowerEdge XE8812服务器，采用NVIDIA Vera Rubin NVL4架构，每机架支持144颗GPU、300kW+功耗、100%直接液冷。该平台为HPC和AI大模型提供内存和计算密度代际跃升，但深度绑定Dell PowerRack、iDRAC和ORv3标准，形成从芯片到机架的全面锁定。

NVIDIA 其他 2026-06-22

NVIDIA发布Arm CPU颠覆x86：RTX Spark与Vera重塑AI计算控制权

NVIDIA在Computex发布面向PC的RTX Spark超级芯片（20核Arm+6144 CUDA+128GB LPDDR5X）和百万级量产的数据中心CPU Vera，专为AI负载设计，性能是x86的1.8倍。此举标志NVIDIA从GPU巨头正式跨入CPU领域，通过统一Arm+GPU架构争夺AI计算控制权。

MediaTek 其他 2026-06-16

联发科AI ASIC营收目标翻倍至20亿美元，剑指Broadcom数据中心定制芯片霸权

联发科将2026年AI ASIC营收目标从10亿美元翻倍至20亿美元，依托Google超大规模客户及与NVIDIA合作的RTX Spark AI PC芯片（内置联发科设计的N1X Arm CPU）。目标到2027年占据700-800亿美元AI ASIC市场10-15%份额，直接挑战Broadcom的主导地位。

NVIDIA 其他 2026-06-14

NVIDIA与SK海力士深度捆绑：定制内存重塑AI工厂生态，锁定Vera Rubin与Jetson Thor

NVIDIA与SK hynix宣布多年期技术合作，将共同开发面向Vera Rubin AI超级计算机、Vera CPU、RTX Spark PC及Jetson Thor机器人平台的下一代定制内存。SK hynix还将利用NVIDIA CUDA-X库和Omniverse平台加速半导体设计与制造，构建自主晶圆厂数字孪生。

NVIDIA 其他 2026-06-13

NVIDIA推AgentPerf基准测试：Blackwell Ultra每瓦代理数较Hopper提升20倍

NVIDIA与Artificial Analysis联合发布首个Agentic AI基准测试AgentPerf，结果显示GB300 NVL72平台在运行DeepSeek V4 Pro等MoE模型时，每兆瓦可承载的并发代理数较HGX H200提升20倍。该基准模拟真实编码代理轨迹，测量端到端吞吐与响应延迟。

NVIDIA 其他 2026-06-11

NVIDIA发布Halos OS：以安全认证操作系统夺取自动驾驶控制权

NVIDIA推出Halos全栈安全系统，包括ASIL D认证的Halos Core操作系统、标准化传感器抽象层Halos SDK、AI安全护栏Halos Applications，以及云端安全评估框架SEF。该系统基于DRIVE Hyperion平台，旨在为L4级自动驾驶提供内建安全，而非事后补丁。

Microsoft 其他 2026-06-11

微软联合NVIDIA推RTX Spark Arm AI芯片，Windows PC算力跨越1 Petaflop门槛

微软在Computex 2026宣布与NVIDIA、MediaTek合作推出RTX Spark Arm架构AI超级芯片，集成Blackwell RTX GPU和128GB统一内存，支持本地运行120B参数大模型。同时Intel Arc G3、高通Snapdragon X2系列齐发，Windows AI PC生态全面升级。

NVIDIA 其他 2026-06-11

NVIDIA借DiffusionGemma并行生成，将本地AI推理控制权锁定于自家GPU

NVIDIA优化Google DeepMind的DiffusionGemma开源模型，该模型通过并行生成256 tokens（非逐token）实现4倍加速。在H100上达1000 tokens/sec，DGX Spark上150 tokens/sec，完全本地运行，无云成本。此举强化了NVIDIA GPU在计算密集型本地AI推理中的核心地位。

NVIDIA 其他 2026-06-09

NVIDIA NVFP4：原生4位训练实现1.73倍吞吐跃升，锁定Blackwell生态

NVIDIA发布NVFP4格式，利用Blackwell原生硬件支持，在JAX/MaxText中实现4位混合精度预训练。相比FP8基线，Llama 3.1 405B在GB300上获得1.73倍吞吐提升，且精度无损失。该技术通过微块缩放、随机哈达玛变换等创新，显著降低训练成本，但深度绑定NVIDIA硬件生态。

NVIDIA 其他 2026-06-08

NVIDIA 借英国主权AI基金，从芯片商跃升为国家AI基础设施的幕后控制者

NVIDIA 与英国政府合作，通过 Isambard-AI（搭载 5,400 颗 GH200）及 Sovereign AI Fund，扶持本地初创（Cosine, Cursive, Doubleword）。此举表面是技术部署，实则是 NVIDIA 构建主权AI控制平面，将国家算力锁入其生态系统，削弱AWS/Azure等传统云厂商的地位。

Microsoft 其他 2026-06-02

微软Build大会：从芯片到云构建Agent时代统一生态

微软在Build大会上发布一系列Agent时代基础设施：Project Solara芯片到云平台、Microsoft IQ统一知识层、Rayfin后端生成、Azure HorizonDB、GPU加速分析等，旨在将开发者锁定在微软生态内。

ARM 其他 2026-06-02

Arm与NVIDIA联手推出RTX Spark：统一内存架构重塑Agentic PC生态，合围x86阵营

Arm与NVIDIA合作推出基于Arm Grace CPU和Blackwell RTX GPU的RTX Spark平台，采用统一内存架构，专为Windows on Arm生态下的Agentic AI推理设计。该平台提供1 Petaflop算力，显著降低token处理成本，标志着PC从应用驱动向Agent驱动的根本转变，并得到微软的全面支持。

NVIDIA 其他 2026-06-02

NVIDIA DGX Spark更新：一键部署本地AI代理，多节点集群扩展至400B模型

NVIDIA在Computex 2026发布DGX Spark软件更新，包括NemoClaw一键安装本地AI代理、Qwen3.6-35B模型在vLLM上实现2.6倍性能提升、以及Sync集群助手支持2-4节点通过ConnectX-7 200Gbps RoCE高速互联，使本地运行大规模自主代理和多节点分布式推理成为可能。

NVIDIA 其他 2026-06-01

NVIDIA借台湾供应链深化AI工厂生态，Vera Rubin量产捆绑专有软件锁

NVIDIA联合台积电、鸿海等台湾巨头，将cuLitho、Omniverse、Isaac等专有AI软件嵌入芯片制造与服务器组装流程，同时推进Vera Rubin NVL72量产。此举将制造效率提升数据（如cuLitho降低20-50%周期）作为诱饵，实质是构建从设计到生产的全栈生态壁垒。

NVIDIA 其他 2026-06-01

NVIDIA Alpamayo闭环RL后训练：加速自动驾驶策略的模拟-现实融合

NVIDIA Alpamayo平台推出AlpaGym，一个开源、高吞吐量的闭环强化学习后训练框架。该框架将AlpaSim模拟器、Cosmos-RL分布式训练和物理AI数据集整合，使AV模型能从自身动作的模拟后果中学习，大幅缩小训练与部署的误差累积鸿沟。

NVIDIA 其他 2026-06-01

NVIDIA RTX Spark：以SoC形态夺取PC控制权，AI算力革命或锁定生态

NVIDIA发布RTX Spark SoC，集成Blackwell GPU与20核Grace CPU（MediaTek设计），通过NVLink-C2C实现600GB/s互联，最高128GB统一内存，1 petaflop FP4 AI算力，支持本地运行1200亿参数大模型。此举从GPU供应商跃升为整机方案商，直接挑战Apple M系列、Qualcomm及x86阵营。

NVIDIA 其他 2026-05-16

NVIDIA CUDA漏洞暴露GPU云共享隔离架构根本缺陷：从驱动层到硬件层的安全范式必须重构

Pwn2Own Berlin 2026上，NVIDIA CUDA Toolkit NVVM编译器堆溢出漏洞(CVE-2026-12839)被成功利用，实现GPU云跨租户逃逸。攻击链从恶意PTX代码到驱动层再到主机内核，彻底打破当前依赖驱动隔离的GPU共享模型，迫使行业重新评估AI基础设施安全架构。

情报

筛选

Towards Feature Complete Triton Support in JAX-Triton â ROCm Blogs

Qualcomm 39亿美元收购Modular并开源Mojo，直击NVIDIA CUDA控制权

NVIDIA推Vera CPU+Rubin GPU，意图将AI控制权从x86转向自研架构

戴尔XE8812服务器：NVIDIA Vera Rubin NVL4的液冷密度陷阱

NVIDIA发布Arm CPU颠覆x86：RTX Spark与Vera重塑AI计算控制权

联发科AI ASIC营收目标翻倍至20亿美元，剑指Broadcom数据中心定制芯片霸权

NVIDIA与SK海力士深度捆绑：定制内存重塑AI工厂生态，锁定Vera Rubin与Jetson Thor

NVIDIA推AgentPerf基准测试：Blackwell Ultra每瓦代理数较Hopper提升20倍

NVIDIA发布Halos OS：以安全认证操作系统夺取自动驾驶控制权

微软联合NVIDIA推RTX Spark Arm AI芯片，Windows PC算力跨越1 Petaflop门槛

NVIDIA借DiffusionGemma并行生成，将本地AI推理控制权锁定于自家GPU

NVIDIA NVFP4：原生4位训练实现1.73倍吞吐跃升，锁定Blackwell生态

NVIDIA 借英国主权AI基金，从芯片商跃升为国家AI基础设施的幕后控制者

微软Build大会：从芯片到云构建Agent时代统一生态

Arm与NVIDIA联手推出RTX Spark：统一内存架构重塑Agentic PC生态，合围x86阵营

NVIDIA DGX Spark更新：一键部署本地AI代理，多节点集群扩展至400B模型

NVIDIA借台湾供应链深化AI工厂生态，Vera Rubin量产捆绑专有软件锁

NVIDIA Alpamayo闭环RL后训练：加速自动驾驶策略的模拟-现实融合

NVIDIA RTX Spark：以SoC形态夺取PC控制权，AI算力革命或锁定生态

NVIDIA CUDA漏洞暴露GPU云共享隔离架构根本缺陷：从驱动层到硬件层的安全范式必须重构

Towards Feature Complete Triton Support in JAX-Triton â ROCm Blogs