情报
AI 生成的结构化厂商动态简报
Arm发布Performix性能分析工具包,瞄准AI Agent时代优化
Arm发布免费性能分析工具包Performix,旨在为AI Agent开发提供跨Arm平台的统一性能洞察与优化。该工具通过Arm MCP Server集成至主流AI开发环境,将硬件运行时数据转化为可操作的优化建议,并已获得微软、MongoDB等生态伙伴支持。
AMD将边缘AI架构扩展至太空,定义轨道计算新范式
AMD CTO提出将地面边缘AI的“性能功耗比”与“任务关键可靠性”核心原则,应用于太空计算场景。公司正通过异构计算、开放软件栈和模块化系统设计,为从卫星在轨智能到未来轨道数据中心提供可重复构建的平台基础。
NVIDIA Rubin GPU生产目标下调,Blackwell 2026年占比升至71%
NVIDIA Rubin GPU生产目标从200万颗下调至150万颗,主要因HBM4内存验证延迟。TrendForce数据显示2026年Blackwell占比从61%升至71%,巩固主导地位。美光退出Rubin HBM4供应链,SK海力士将占70%份额。分析师维持增持评级,认为影响有限。Rubin延迟可能延长SK海力士HBM3E的市场主导期。
Intel Q1财报暴涨24%:数据中心营收51亿美元超预期,CPU重返AI核心
Intel 2026年Q1财报超预期,营收136亿美元同比增7%,Non-GAAP每股收益0.29美元超预期1350%。数据中心与AI部门营收51亿美元同比大涨22%,运营利润率31%。
Intel Q1财报暴涨24%:数据中心营收51亿美元超预期,CPU重返AI核心
Intel 2026年Q1财报超预期,营收136亿美元同比增7%,Non-GAAP每股收益0.29美元超预期1350%。数据中心与AI部门营收51亿美元同比大涨22%,运营利润率31%。Xeon服务器CPU需求强劲,AI PC占比超60%,与Google等签订多年供货协议。财报发布后股价大涨25%。
Google发布Gemini企业级代理平台,定义AI代理时代技术栈
Google在Next '26上发布Gemini企业级代理平台,提供构建、扩展、治理和优化AI代理的端到端解决方案。该平台整合了新的AI基础设施、数据云、安全防御和任务执行能力,旨在将企业流程统一为单一智能工作流。
Google全域算力池化:资源利用率从35%提升至85%
Google发布全域算力池化技术,资源利用率从35%提升至85%+,成本降低40%+,支持跨区域、跨云厂商资源整合。
思科通过新防火墙架构应对AI基础设施的规模化安全挑战
思科发布Secure Firewall 6100系列,通过软件数据平面重构和硬件优化,旨在为AI数据中心、云和电信环境提供高性能、高能效的安全防护。该方案强调在加密流量激增和东西向流量增长背景下,实现安全与性能的平衡,并与Hybrid Mesh Firewall架构集成,提供跨混合环境的一致性策略。
NVIDIA 发布多节点 GPU 互联性能基准测试工具 NVbandwidth
NVIDIA 在其开发者博客上正式发布 NVbandwidth 工具,这是一个基于 CUDA 的基准测试套件,用于测量单节点及多节点 GPU 系统内各种内存拷贝模式的带宽与延迟。该工具支持 NVLINK、PCIe 等多种互联拓扑,并集成 MPI 以支持跨节点集群的性能评估。
英特尔联合诺基亚与戴尔推出面向远边缘的UPF专用设备
英特尔、诺基亚与戴尔在MWC 2026上预展了一款基于英特尔至强6 SoC的远边缘UPF设备。该方案旨在为电信运营商在空间与功耗受限的远边缘环境提供高性能、低功耗的5G核心网用户面处理能力,并集成了AI功能。
英特尔与谷歌深化合作,共同定义异构AI基础设施核心
英特尔与谷歌宣布多年期合作,旨在共同推进下一代AI与云基础设施。核心是强化CPU和定制IPU在异构AI系统中的中心地位,通过多代Xeon处理器优化性能与能效,并扩展基于ASIC的IPU联合开发,以提升超大规模AI环境下的效率与可预测性。
英特尔与谷歌深化合作,共推CPU与IPU异构AI基础设施
英特尔与谷歌宣布多年期合作,旨在通过多代至强处理器和联合开发定制IPU,共同推进下一代AI与云基础设施。此举强化了CPU在AI系统编排与数据处理中的核心作用,以及IPU在卸载网络、存储任务以提升超大规模AI环境效率的关键价值。
英特尔与SambaNova联合发布面向Agentic AI的异构推理架构
英特尔与SambaNova宣布合作,为Agentic AI生产负载设计异构计算蓝图。该方案结合GPU、SambaNova RDU和英特尔至强6处理器,旨在解决性能、效率与软件兼容性挑战,预计2026年下半年推出。
Arm与马来西亚莫纳什大学合作,推进AI时代半导体人才培养
Arm宣布与马来西亚莫纳什大学工程学院合作,捐赠集成电路设计开发板并派遣高管担任客座讲师,旨在为AI时代培养具备Arm架构和现代系统设计实践经验的半导体人才。
NVIDIA优化VC-6解码器架构,提升批量AI视觉管道性能
NVIDIA通过Nsight工具分析,对其VC-6视频解码器进行架构级重构,从单图解码器转向支持批量处理的单一解码器,并优化GPU内核,显著降低批处理场景下的解码延迟,提升AI视觉管道效率。
ARM联合Google优化Gemma 4设备端AI性能
ARM通过Armv9架构的SME2技术加速Google Gemma 4模型在移动设备的运行,实现5.5倍预填充加速和1.6倍解码提速。该合作使开发者无需修改代码即可获得性能优化,推动设备端AI成为移动应用默认架构,降低云端依赖。
AMD发布突破性MLPerf 6.0推理结果,展示多节点扩展与多模态能力
AMD在MLPerf Inference 6.0基准测试中,凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型(Wan-2.2-t2v)的快速启用,以及广泛的合作伙伴生态系统复现结果。
ARM推出自研AGI CPU芯片,扩展AI基础设施布局
ARM首次推出自研AGI CPU芯片,突破传统IP授权模式,提供从定制化芯片到完整平台解决方案的全栈能力。此举将重构AI基础设施供应链控制权,推动企业从硬件层优化AI工作负载部署效率。
英特尔在MLPerf推理测试中展示Xeon 6与Arc Pro GPU的AI性能
英特尔在MLPerf Inference v6.0基准测试中展示了其Xeon 6 CPU和Arc Pro B系列GPU的性能,特别是在处理大型语言模型(LLM)时的表现。测试结果显示,配备四块Arc Pro B70 GPU的系统能够处理120B参数的模型,并在多GPU设置中提供高达1.8倍的推理性能提升。
高通推出集成NPU的可穿戴平台,强化边缘AI与“个人AI生态”
高通发布Snapdragon Wear Elite平台,首次为可穿戴设备集成专用NPU,支持本地运行高达20亿参数模型。该平台旨在将AI计算从智能手机中心转向以个人AI代理为中心的架构,利用可穿戴设备提供持续上下文,实现跨设备智能协同。