Arm - AI基础设施情报搜索

NVIDIA 其他 2026-07-16

NVIDIA推出Jetson Thor T3000/T2000，以Blackwell架构压降边缘AI推理成本壁垒

NVIDIA发布基于Thor架构的Jetson T3000和T2000模块。T3000集成Blackwell GPU、8核Neoverse CPU，以T5000一半的功耗提供865 FP4 TFLOPS算力，并搭配新的Jetson Agent Skills自动化内存优化工具，旨在推动人形机器人和边缘AI应用的大规模部署。

Google 其他 2026-07-15

Google BigQuery深度集成Gemini Enterprise，重塑AI治理控制权

Google Cloud推出方案，将Gemini Enterprise应用的遥测数据（用户提示、模型响应、活动日志）实时路由到BigQuery。利用BigQuery的AI分析能力（Conversational Analytics、自动Schema生成），实现大规模AI部署的自动化审计、合规治理和业务洞察，强化数据驱动的AI可观测性。

AMD 其他 2026-07-15

AMD确认Zen 6 EPYC Venice：首款2nm服务器CPU，2026年7月登场

AMD确认将于2026年7月22-23日推出基于Zen 6架构的EPYC Venice服务器CPU，这是业界首款采用2nm制程的芯片。该CPU采用三层混合架构，单核性能提升约29%，多核提升约22%，核心数达128-192核，旨在强化AI推理与CPU-GPU协同。

Cisco 其他 2026-07-13

Cisco发布Cloud Control整合管理平台，AgenticOps推动AI运维自动化

Cisco在Live 2026发布Cloud Control，整合Meraki、Catalyst Center等管理平台，并推出AgenticOps AI运维代理，同时裁员471人转向AI优先战略。此举标志着从设备销售向运营订阅模式的根本转变，旨在通过统一控制平面锁定客户。

TSMC 其他 2026-07-13

TSMC CoWoS产能2027年冲击20万片，从GPU专属转向CPU/ASIC三驱动

TSMC规划CoWoS月产能2027年达20万片，供需缺口从20%收敛至10%。客户结构从NVIDIA GPU独大转向GPU+AI服务器CPU+自研ASIC三驱动，MediaTek ARM服务器CPU封装量翻倍。CoPoS面板级封装2027年中试产，为后CoWoS时代铺垫。

AMD 其他 2026-07-10

Towards Feature Complete Triton Support in JAX-Triton â ROCm Blogs

...

NVIDIA 其他 2026-07-08

NVIDIA发布Rigel CPU核心：单线程性能成Agentic AI新控制点

NVIDIA首次披露Rosa CPU架构，采用自研Rigel核心（Arm v9.2），专为Agentic AI工作负载优化单线程性能，配套Feynman GPU（1.6nm，50 PFLOPS）于2028年推出。该战略将CPU从核心数量竞赛转向串行延迟优化，直接威胁AMD EPYC和Intel至强数据中心基本盘。

NVIDIA 其他 2026-07-07

NVIDIA Vera CPU获Perplexity/OpenAI/Anthropic/Oracle采用 AI Agent性能验证1.5-1.9x加速

...

NVIDIA 其他 2026-07-07

NVIDIA发布Vera CPU：以最大单线程性能重构AI Agent生态

NVIDIA推出Vera CPU，专为AI Agent工作负载设计，采用Olympus核心，提供比x86高1.8倍的持续每核心性能。该CPU与NVIDIA GPU和BlueField统一架构，旨在构建AI工厂的统一计算平台，挑战现有x86 CPU生态。

NVIDIA 其他 2026-07-07

AI Innovators Adopt NVIDIA Vera — Why Max Single-Threaded CPU at Scale Matters

...

Qualcomm 其他 2026-06-26

Qualcomm 39亿美元收购Modular并开源Mojo，直击NVIDIA CUDA控制权

Qualcomm以39亿美元全股票交易收购AI基础设施初创公司Modular，并宣布开源Mojo编程语言。Mojo结合Python易用性与系统级性能，旨在为AI开发者提供不依赖CUDA的高性能计算路径，强化Qualcomm在AI推理芯片及边缘AI市场的软件生态。

Huawei 其他 2026-06-25

华为推AI原生网络架构：从字节计费转向Token货币化，UCM缓存突破长上下文瓶颈

华为在MWC上海2026发布AI原生网络架构，集成服务-网络-计算，实现从流量中心到智能中心的转变。核心是Unified Cache Manager（UCM）将KV缓存扩展至PB级外存，在GLM-5.1模型128K序列长度下实现372% token吞吐量提升。同时推出token货币化框架，允许运营商按AI推理容量计费，并引入agentic运营模式。

NVIDIA 其他 2026-06-25

高通发布Dragonfly数据中心CPU与HBC内存，以推理优先架构挑战NVIDIA霸权

高通在投资者日公布完整数据中心路线图，包括250核Oryon CPU（Dragonfly C1000）、近内存计算HBC（声称133TB/s带宽）、AI300推理加速器（54x带宽提升），以及800G/1.6T互联。与Meta签署多年CPU供应协议，2028年商用，旨在以低功耗高带宽颠覆AI推理市场。

ARM 其他 2026-06-24

中国LineShine超算登顶TOP500：纯CPU架构突破2 ExaFLOPS，ARMv9+HBM成新范式

LineShine超级计算机基于13.79百万个ARMv9核心、20480节点，实现2.198 ExaFLOPS FP64持续性能，成为全球首个突破2 ExaFLOPS的系统。它完全依赖CPU（无GPU加速），每个节点配备双LX2 CPU（304核）和32GB HBM，展示了CPU+HBM架构在HPC领域的潜力。

Microsoft 其他 2026-06-23

微软推出Azure Copilot可观测性代理，将运维控制点锁定在自家平台

微软宣布Azure Copilot可观测性代理正式商用，基于Azure Monitor构建，可跨代理、应用、基础设施和服务关联信号，提供统一运维视图。此举旨在将AI驱动的故障诊断与修复工作流深度绑定在Azure生态内。

NVIDIA 其他 2026-06-23

NVIDIA发布45°C高温液冷系统，Rubin芯片承诺减少100%水耗

NVIDIA为Rubin GPU推出高温液冷系统，冷却液温度45°C（高于热水浴缸），利用室外干冷却器实现闭环运行，宣称可减少电耗并消除水蒸发（水耗减少100%）。但系统在炎热气候下仍需冷水机组备用，且电力来源和芯片寿命影响未明确。

NVIDIA 其他 2026-06-23

英伟达Vera Rubin NVL4：以CPU-GPU一体化设计锁定超算架构控制权

英伟达发布Vera Rubin NVL4超级计算平台，集成Rubin GPU与Vera CPU，通过NVLink和InfiniBand实现端到端加速，单系统提供超7 exaflops AI算力。采用ARM架构Vera CPU，标志其数据中心CPU战略深化，预计2026年Q4供货，戴尔、HPE等将推出基于该架构的系统。

ARM 其他 2026-06-23

Arm服务器市占突破45%：NVIDIA捆绑策略重塑AI基础设施架构

IDC数据显示，基于Arm架构的服务器已占据全球服务器市场超45%份额，主要驱动力来自NVIDIA将其Arm架构Vera CPU与NVL72、Rubin等GPU系统捆绑销售。x86阵营份额萎缩至52%，而加速系统贡献了70%以上营收。ODM直销占比50.2%，戴尔营收同比增长244.1%。

NVIDIA 其他 2026-06-23

NVIDIA Vera Rubin NVL4：以自定义ARM CPU和NVLink合围HPC+AI融合市场

NVIDIA发布Vera Rubin计算平台，集成自研Vera CPU（ARM架构）与Rubin GPU，通过NVLink和液冷架构实现单系统超7 exaflops AI算力与5 PF FP64科学计算能力。该平台以144 GPU/机架密度定义HPC+AI融合新标杆，预计2026年Q4供货。

AMD 其他 2026-06-23

AMD MI430X以200+ TFLOPS原生FP64性能，重新定义HPC与AI融合算力基线

AMD在TOP500榜单中驱动4台前十超算，并预览MI430X GPU，承诺超过200 TFLOPS原生FP64性能。此举直接针对AI for Science场景，将双精度计算作为下一代HPC与AI融合基础设施的核心指标，对NVIDIA和Intel形成直接竞争压力。

情报

筛选

NVIDIA推出Jetson Thor T3000/T2000，以Blackwell架构压降边缘AI推理成本壁垒

Google BigQuery深度集成Gemini Enterprise，重塑AI治理控制权

AMD确认Zen 6 EPYC Venice：首款2nm服务器CPU，2026年7月登场

Cisco发布Cloud Control整合管理平台，AgenticOps推动AI运维自动化

TSMC CoWoS产能2027年冲击20万片，从GPU专属转向CPU/ASIC三驱动

Towards Feature Complete Triton Support in JAX-Triton â ROCm Blogs

NVIDIA发布Rigel CPU核心：单线程性能成Agentic AI新控制点

NVIDIA Vera CPU获Perplexity/OpenAI/Anthropic/Oracle采用 AI Agent性能验证1.5-1.9x加速

NVIDIA发布Vera CPU：以最大单线程性能重构AI Agent生态

AI Innovators Adopt NVIDIA Vera — Why Max Single-Threaded CPU at Scale Matters

Qualcomm 39亿美元收购Modular并开源Mojo，直击NVIDIA CUDA控制权

华为推AI原生网络架构：从字节计费转向Token货币化，UCM缓存突破长上下文瓶颈

高通发布Dragonfly数据中心CPU与HBC内存，以推理优先架构挑战NVIDIA霸权

中国LineShine超算登顶TOP500：纯CPU架构突破2 ExaFLOPS，ARMv9+HBM成新范式

微软推出Azure Copilot可观测性代理，将运维控制点锁定在自家平台

NVIDIA发布45°C高温液冷系统，Rubin芯片承诺减少100%水耗

英伟达Vera Rubin NVL4：以CPU-GPU一体化设计锁定超算架构控制权

Arm服务器市占突破45%：NVIDIA捆绑策略重塑AI基础设施架构

NVIDIA Vera Rubin NVL4：以自定义ARM CPU和NVLink合围HPC+AI融合市场

AMD MI430X以200+ TFLOPS原生FP64性能，重新定义HPC与AI融合算力基线

Towards Feature Complete Triton Support in JAX-Triton â ROCm Blogs