情报
AI 生成的结构化厂商动态简报
微软构建端到端智能体栈,从芯片到云重构AI应用生态
微软在Build大会上发布了一系列围绕“智能体时代”的基础设施与平台更新,核心在于构建一个从芯片参考设计(Project Solara)、操作系统安全层(MXC/OpenClaw)、数据智能基础(Microsoft IQ)、专用数据库(Azure HorizonDB)到开发与部署平台(Foundry, Copilot app)的完整、集成化智能体技术栈。此举旨在将智能体应用的全生命周期管理收拢至微软生态内部。
AMD Silo AI 与 Delphyr AI 深度协作,共筑临床医疗 AI 垂直解决方案
AMD Silo AI 与医疗 AI 公司 Delphyr AI 宣布深度合作,旨在将 Delphyr 的 AI 助手平台规模化部署于临床环境。合作核心是双方工程师共同优化基于 AMD Instinct 加速器和 ROCm 软件栈的高性能 embedding pipeline,确保 AI 能力能无缝集成到现有电子健康记录系统和工作流中,满足医疗行业对速度、隐私和可靠性的严苛要求。
AMD联合教育组织发起全国性青少年AI与工程挑战赛
AMD与Hack Club、NASA及GitHub Education合作,启动“Stardance”全国性暑期工程挑战赛。该项目面向13-18岁青少年,鼓励他们利用公开数据集和开发工具,构建从AI应用到游戏、硬件原型在内的实际项目,并计划在AMD Advancing AI大会期间举办线下黑客松。
NVIDIA GTC台北2026:Vera 88核CPU专为智能体设计,1.8倍x86性能,OpenAI/Anthropic首批部署
NVIDIA在GTC台北2026发布首款独立数据中心微处理器Vera,首次以自有CPU直接对标Intel Xeon和AMD EPYC。Vera采用88个定制Olympus Arm核心,单片mesh网络(非chiplet),核心间通信比传统CPU快50%。LPDDR5X带宽1.2TB/s,PCIe Gen6,内外带宽为同类最高性能CPU的2-3倍。智能体沙箱性能1.8倍x86。首批客户:OpenAI、Anthropic、SpaceX。Q3 2026投产,FY CPU收入目标200亿美元。标志着NVIDIA从GPU加速器厂商向全栈数据中心平台厂商的战略跃迁。
NVIDIA RTX Spark发布:AI PC时代的开启
NVIDIA在Computex 2026正式发布RTX Spark——首款面向AI Agent时代的Windows PC超级芯片。该芯片基于TSMC 3nm工艺,整合Blackwell架构GPU(6144 CUDA核心+第五代Tensor Core,FP4精度)与20核Grace CPU,通过NVLink-C2C互联(600GB/s),提供1 petaflop AI算力和最高128GB统一LPDDR5X内存(300GB/s带宽)。笔记本最薄14mm、最轻3磅,支持本地运行1200亿参数大模型。NVIDIA与微软合作推出OpenShell运行时和Windows安全原语,Adobe正在为RTX Spark重新架构Photoshop和Premiere。首批设备秋季上市,来自ASUS、Dell、HP、Lenovo、Microsoft Surface、MSI,Acer和GIGABYTE随后跟进。预计售价$3000-4000。RTX Spark路线图延伸至2030年:2027年升级Vera CPU+Rubin GPU+LPDDR6,2029-2030年Rosa CPU+Feynman GPU。这是继2020年Apple M1之后PC行业最大的架构变革信号。
NVIDIA Vera CPU交付四大AI实验室,Computex前夕N1X+硅光子学三线并发
NVIDIA于5月18日宣布Vera CPU首批交付Anthropic、OpenAI、SpaceX AI和Oracle Cloud Infrastructure,由超大规模计算副总裁Ian Buck亲自送货。Vera是NVIDIA首款专为Agent式AI设计的CPU,88颗自研Olympus核心(Arm v9.2),LPDDR5X带宽1.2TB/s,Phoronix基准测试单核超越AMD EPYC 9575F和Intel Xeon 6980P,Linux内核编译仅20秒。同日NVIDIA+微软+Arm联合发布神秘海报预告N1X笔记本处理器(Blackwell GPU+20核联发科Arm CPU+128GB统一内存),Dell/Lenovo/ASUS已准备设备。此外NVIDIA三个月内向硅光子学投资至少$65亿(Lumentum/Coherent/Marvell各$20亿+Corning $5亿+Ayer Labs E轮$5亿),黄仁勋称硅光产能需求远超全球供给,CPO 2026渗透率0.5%→2030年35%。
AMD发布面积优化型Versal Prime Gen 2自适应SoC,推动边缘计算硬件小型化
AMD宣布扩展其Versal Prime Series Gen 2自适应SoC产品线,新增三款面积优化型器件(2VM3454/3254/3104)。这些器件采用4核Arm Cortex-A78AE应用处理器配置,提供最小23x23mm封装,并在单位面积内提供更高的可编程逻辑密度,旨在为专业音视频、工业物联网等嵌入式应用平衡性能、尺寸与功耗。
AMD 以 EPYC 4005 与紧凑型系统重塑零售边缘基础设施
AMD 通过其 EPYC 4005 系列 CPU,与 Supermicro 等合作伙伴推出专为零售边缘设计的紧凑型服务器平台。这些系统强调在有限空间和功耗下的高性能(DDR5, PCIe Gen5)、远程管理(BMC)与硬件安全(TPM),旨在将数据中心级能力下沉至门店,实现工作负载整合与集中化运维。
NVIDIA发布Vera CPU基准测试,专为智能体AI工厂优化
NVIDIA公布了其专为智能体AI设计的Vera CPU的第三方基准测试结果。该CPU集成了88个定制Olympus核心与第二代LPDDR5X内存子系统,在特定功耗下实现了显著的性能与内存带宽提升,标志着NVIDIA在数据中心CPU市场对x86架构发起实质性挑战。
华为发表韬定律:时间缩微替代几何缩微,逻辑折叠技术突破摩尔定律困局
华为何庭波在ISCAS 2026发表韬定律,以时间缩微替代几何缩微。逻辑折叠技术固定制程下单代密度+55%、能效+41%、主频+13%。6年381款芯片验证,麒麟2026秋季首发,2031年等效1.4nm密度。
Intel CEO:AI推理时代CPU/GPU配比从1:8向1:1演进,Multi-Agent三大刚性需求
Intel CEO指出AI推理时代CPU/GPU配比从1:8向1:1演进,驱动因素为Multi-Agent三大刚性需求:Agent编排与调度、工具调用与API网关、推理卸载与本地执行。Intel三路CPU同时量产(Granite Rapids-D边缘/Aerial嵌入式/Xeon 6主流),非巧合而是系统性应对。Agent编排/工具调用/推理卸载构成CPU新增长极。企业AI基础设施团队需立即重新评估CPU/GPU配比,服务器采购需适配Agent工作负载特征。
AMD EPYC Venice业界首款量产2nm HPC CPU,$100亿封装生态投资
AMD发布EPYC Venice,业界首款量产2nm HPC CPU。同时宣布$100亿封装生态投资,与台积电、三星深度绑定先进封装产能。Venice采用2nm GAA工艺,核心数和性能未正式公布,但GF Securities预测将大幅领先当前Genoa/Bergamo。Venice+Helios(GPU)组合剑指AI推理服务器市场。2nm量产领先Intel一代,封装投资锁定供应链产能,形成工艺+产能双重护城河。
NVIDIA Vera CPU Computex前哨:1.5x x86性能,FY2027出货120万台
NVIDIA将在Computex 2026展示Vera自研x86 CPU。GF Securities预测:1.5倍x86速度、2倍吞吐量、4倍机架密度提升,FY2027出货目标120万台。Vera+Grace双线并行,NVIDIA从GPU独占扩展为GPU+CPU全栈供应商。AI推理时代CPU/GPU配比从1:8向1:1重构,直接冲击Intel/AMD服务器CPU基本盘。关键数据:Vera采用台积电4nm工艺,支持PCIe 6.0和CXL 3.0,定位AI推理与通用计算融合场景。
思科与Qumulo验证统一数据平台架构,瞄准AI与混合负载
思科通过博客与白皮书,验证了其UCS M8机架服务器与Qumulo数据平台的集成方案。该方案旨在为AI、企业应用等混合工作负载提供统一、可扩展的文件与对象存储,并通过Cisco Intersight实现集中管理,以应对数据碎片化挑战。
AMD定义“智能代理计算机”新品类,推动AI推理本地化
AMD提出“智能代理计算机”概念,旨在通过本地化硬件(Ryzen™ AI Max处理器、Radeon™ AI PRO显卡)运行持续AI推理工作负载,以应对云API成本上升。其核心是推动AI从云端按需消费模式向本地固定成本、高吞吐量模式转移。
AMD发布AI Halo开发平台与Max PRO 400系列处理器,瞄准本地AI代理计算
AMD发布Ryzen AI Halo开发者平台和Ryzen AI Max PRO 400系列处理器,旨在为本地AI代理(Agent)应用提供开发与运行环境。新平台支持高达2000亿参数模型本地运行,并提供高达192GB统一内存,推动AI工作负载从云端向边缘设备迁移。
谷歌公共部门展示AI Agent规模化部署蓝图
谷歌公共部门通过美国交通部、FDA和洛杉矶市案例,阐述其推动政府机构从AI试点转向全面Agentic转型的战略。其核心是提供集成化AI堆栈,并强调领导力、规模化与以人为本三大支柱。
AI Agent工作负载推动服务器CPU结构性短缺,Arm需求超200亿美元重塑价值链
AI基础设施瓶颈从GPU向CPU转移。Agentic AI推动CPU-GPU配比从1:8向1:1演进。AMD EPYC交付8-12周份额46.2%,Intel部分Xeon配置交付6个月,Arm 3nm 136核AGI处理器需求超200亿美元。CPU成为新瓶颈资源。
思科借SRv6与MRC协议,强化其在AI基础设施网络层的核心地位
思科通过其博客强调,其主导的SRv6网络架构是支撑OpenAI等巨头发布的MRC协议的关键基础。这标志着AI超算网络正从传统ECMP向基于SRv6的确定性、应用驱动架构演进,思科试图将自身定位为这一变革的核心标准制定者和技术提供方。
微软通过驱动程序质量倡议强化Windows平台控制
微软在WinHEC 2026上推出驱动程序质量倡议,旨在通过四大支柱——架构、信任、生命周期和度量——系统性提升驱动程序的可靠性、安全性和性能。此举标志着微软正加强对Windows硬件生态系统的技术规范与控制,以提升最终用户体验。