情报
AI 生成的结构化厂商动态简报
NVIDIA Vera CPU交付四大AI实验室,Computex前夕N1X+硅光子学三线并发
NVIDIA于5月18日宣布Vera CPU首批交付Anthropic、OpenAI、SpaceX AI和Oracle Cloud Infrastructure,由超大规模计算副总裁Ian Buck亲自送货。Vera是NVIDIA首款专为Agent式AI设计的CPU,88颗自研Olympus核心(Arm v9.2),LPDDR5X带宽1.2TB/s,Phoronix基准测试单核超越AMD EPYC 9575F和Intel Xeon 6980P,Linux内核编译仅20秒。同日NVIDIA+微软+Arm联合发布神秘海报预告N1X笔记本处理器(Blackwell GPU+20核联发科Arm CPU+128GB统一内存),Dell/Lenovo/ASUS已准备设备。此外NVIDIA三个月内向硅光子学投资至少$65亿(Lumentum/Coherent/Marvell各$20亿+Corning $5亿+Ayer Labs E轮$5亿),黄仁勋称硅光产能需求远超全球供给,CPO 2026渗透率0.5%→2030年35%。
思科定义“跨域扩展”网络新范式,以硅光协同应对AI集群地理分散化
思科发布博客,系统阐述其应对AI训练集群地理分散化挑战的“跨域扩展”网络架构。该架构以Cisco Silicon One P200路由系统与800G ZR/ZR+相干可插拔光模块为核心,通过硅与光的协同设计,旨在为跨数十至数百公里数据中心的GPU集群提供确定性、低延迟、无损的连接。
思科将网络数据代理(NDB)深度集成至统一管理平台Nexus Dashboard
思科宣布将其网络数据代理(Nexus Data Broker)产品从独立的Linux主机/虚拟机部署模式,深度集成至其统一数据中心管理平台Cisco Nexus Dashboard 4.2中。此举旨在通过单一平台提供从流量捕获、聚合到分发的统一管理体验,简化部署、生命周期管理和安全策略,以应对AI时代对端到端网络可见性的复杂需求。
Cisco Live 2026议程揭示网络设备向可编程计算平台演进
Cisco在其2026年Cisco Live大会上,系统展示了将企业网络从静态基础设施转变为AI就绪动态平台的五大技术路径。核心动作包括在Catalyst C9350交换机上原生支持应用容器化,推广基于NETCONF/YANG的原子化配置替换(ACR),以及用模型驱动遥测(MDT)全面替代SNMP。
NVIDIA以游戏捆绑订阅深化云游戏市场,凸显AI基础设施复用策略
NVIDIA通过GeForce NOW平台发布新游戏《007 First Light》,并将其与12个月Ultimate会员订阅捆绑销售。此举旨在利用其强大的云端RTX GPU算力(包括RTX 50系列)吸引并锁定用户,同时展示了其底层AI基础设施向消费级云游戏服务的能力复用。
Google 通过加速器项目在 MENA-T 区域系统性培育 AI 原生应用生态
Google 宣布了其 MENA-T 区域创业加速器的新一期 15 家初创公司名单,这些公司均为 AI-First 企业,覆盖医疗、教育、制造、安全等多个垂直领域。该计划提供包括 AI 安全、生成式设计在内的技术指导,并深度整合 Google Cloud 的 AI 基础设施(如 Gemini Enterprise Agent Platform, BigQuery, GKE),旨在将区域创新绑定至 Google 的 AI 技术栈。
思科提出AI威胁下基础设施安全新模型:从周期性加固到持续运行
思科CISO基于内部实践,提出应对AI驱动攻击的新安全模型。该模型将防御从基于CVSS评分的周期性漏洞修补,转变为以实时可见性、持续暴露验证、运行时保护和现代化为支柱的闭环运行体系。核心是构建一个无需停机即可持续向更安全状态演进的敏捷系统。
Cloudflare 披露其统一数据平台与 AI 代理架构,展示云原生数据栈闭环
Cloudflare 详细介绍了其内部统一数据平台 Town Lake 与 AI 数据代理 Skipper 的构建。该平台基于 Apache Trino、R2 (Iceberg)、DataHub 等组件,实现了对分散数据的统一 SQL 访问。Skipper 作为 AI 代理,允许用户通过自然语言查询数据,并深度集成于 Cloudflare 自身的产品生态(Workers AI、R2 等)。
思科资本将技术融资提升为核心战略杠杆,重构客户采购生态
思科通过其金融子公司Cisco Capital,将灵活的融资方案深度整合进技术销售流程。此举旨在将客户从传统的大额资本支出采购模式,转向基于生命周期的运营支出模式,以应对宏观经济压力并加速AI等关键技术的部署。
AMD发布面积优化型Versal Prime Gen 2自适应SoC,推动边缘计算硬件小型化
AMD宣布扩展其Versal Prime Series Gen 2自适应SoC产品线,新增三款面积优化型器件(2VM3454/3254/3104)。这些器件采用4核Arm Cortex-A78AE应用处理器配置,提供最小23x23mm封装,并在单位面积内提供更高的可编程逻辑密度,旨在为专业音视频、工业物联网等嵌入式应用平衡性能、尺寸与功耗。
AMD 以 EPYC 4005 与紧凑型系统重塑零售边缘基础设施
AMD 通过其 EPYC 4005 系列 CPU,与 Supermicro 等合作伙伴推出专为零售边缘设计的紧凑型服务器平台。这些系统强调在有限空间和功耗下的高性能(DDR5, PCIe Gen5)、远程管理(BMC)与硬件安全(TPM),旨在将数据中心级能力下沉至门店,实现工作负载整合与集中化运维。
Google Cloud 系统解构无服务器AI冷启动,定义生产级部署新范式
Google Cloud 发布深度指南,将AI模型在Cloud Run上的冷启动分解为四个技术阶段,并针对每阶段提出具体优化策略,包括模型4-bit量化、镜像流传输、启动CPU Boost、专用网络路径及精细的并发度调优公式。此举旨在将无服务器平台从支持AI升级为为AI深度优化的一级生产环境。
NVIDIA发布Vera CPU基准测试,专为智能体AI工厂优化
NVIDIA公布了其专为智能体AI设计的Vera CPU的第三方基准测试结果。该CPU集成了88个定制Olympus核心与第二代LPDDR5X内存子系统,在特定功耗下实现了显著的性能与内存带宽提升,标志着NVIDIA在数据中心CPU市场对x86架构发起实质性挑战。
Cloudflare Radar数据揭示伊朗网络部分恢复,凸显网络韧性监测价值
Cloudflare Radar通过其全球网络流量与DNS查询数据,监测到伊朗在经历近三个月全国性断网后,于5月26日开始出现部分恢复迹象。数据显示,HTTP流量峰值恢复至年初水平的40%,但IPv6地址空间宣告仍为零,表明网络控制手段的差异。
思科发布全栈后量子密码架构,将量子安全能力嵌入C9000交换机硬件
思科在其官方博客中宣布,为应对‘现在收集,以后解密’的量子威胁,在其C9000智能交换机中实现了全栈后量子密码(PQC)架构。该架构将NIST批准的PQC算法从硬件安全启动(Secure Boot)层延伸至数据传输协议(如SSH、MACsec、IPsec),通过嵌入FPGA的信任锚模块(TAm)和基于格的ML-KEM算法,旨在为园区和分支网络提供端到端的量子抵抗保护。
Check Point报告揭示AI安全执行鸿沟,提出统一AI防御平面与代理编排
Check Point发布2026云安全报告,指出77%企业更新AI安全策略但仅26%能有效执行,存在51%的“执行差距”。报告强调需从基础设施层构建统一、预防优先的安全架构,并推出“AI防御平面”与“代理网络安全编排平台”以应对AI代理、非人类身份等新挑战。
AWS SageMaker 通过 OpenAI 兼容 API 争夺 AI 推理控制权
AWS 宣布其 Amazon SageMaker AI 推理端点现支持 OpenAI 兼容的 API 接口。此举使开发者无需修改代码即可将基于 OpenAI API 构建的 AI 应用迁移至 SageMaker 平台,显著降低了从 OpenAI 向 AWS AI 基础设施迁移的技术与锁定门槛。
思科发布内部RAG平台DRIFT,展示企业AI基础设施蓝图
思科IT部门推出名为DRIFT的文档检索与摄取框架工具包,旨在标准化和规模化企业内部RAG应用开发流程。该平台基于云原生微服务架构,运行在思科自有的AI POD基础设施上,提供从文档预处理到检索重排的端到端流水线,并支持Agentic RAG等演进用例。
思科调整漏洞披露策略,基于AI与风险优先级
思科宣布将调整其基于风险的漏洞披露模型,利用AI能力加速漏洞发现,并优先披露高风险漏洞的详细技术信息。对于内部发现且风险较低的漏洞,将减少独立披露,转而引导客户采用包含安全补丁的软件版本。
Google Cloud展示垂直行业AI Agent架构,强调混合集成能力
Google Cloud通过客户案例Movix,展示了为牙科制造业构建的端到端AI Agent解决方案。该方案基于Google Cloud基础设施,利用定制模型和Gemini Enterprise Agent Platform,并重点设计了连接本地遗留系统的混合架构,以进入保守市场。