情报
AI 生成的结构化厂商动态简报
微软发布集成NVIDIA Blackwell的Surface Laptop Ultra,定位AI与开发创作者
微软发布新款Surface Laptop Ultra,首次在笔记本电脑中集成NVIDIA Blackwell RTX GPU,配备高达128GB统一内存,支持本地运行1200亿参数模型。该产品由微软、Windows和NVIDIA深度合作,从芯片层面优化,专为AI构建者、开发者和内容创作者的高负载工作流设计。
微软与英伟达共推基于Arm架构RTX Spark的Windows平台,瞄准本地AI智能体与工作站
微软与英伟达宣布深度整合,推出基于全新Arm架构RTX Spark芯片的Windows PC与工作站。该平台通过高达128GB统一内存、1 petaflop AI算力及Windows系统层优化,旨在将前沿AI模型与智能体(agent)工作负载从云端迁移至本地设备运行。
NVIDIA开源DSX OS,定义AI工厂全栈运营软件层
NVIDIA发布其DSX平台的软件核心DSX OS,这是一套开源、模块化的软件组件,旨在协调从芯片、系统、软件到设施(电力、冷却)的整个AI工厂堆栈。它通过DSX Exchange(MQTT通信枢纽)、MaxLPS(动态功耗管理)、Infra Controller(裸金属生命周期管理)等组件,实现IT/OT深度融合,目标是提升“每瓦特token产出”并降低token成本。
英特尔以Xeon 6+与E835强化CPU在AI基础设施中的控制平面地位
英特尔发布Xeon 6+处理器与Ethernet E835网络适配器,系统性阐述其AI平台战略。核心是将CPU(Xeon)定位为现代AI基础设施的“控制平面”,负责智能体(Agentic)AI工作负载的编排、并发与数据移动,而网络与加速器则作为高效数据平面。此举旨在通过提升能效与系统级协同,应对规模化AI部署的瓶颈。
NVIDIA RTX Spark发布:AI PC时代的开启
NVIDIA在Computex 2026正式发布RTX Spark——首款面向AI Agent时代的Windows PC超级芯片。该芯片基于TSMC 3nm工艺,整合Blackwell架构GPU(6144 CUDA核心+第五代Tensor Core,FP4精度)与20核Grace CPU,通过NVLink-C2C互联(600GB/s),提供1 petaflop AI算力和最高128GB统一LPDDR5X内存(300GB/s带宽)。笔记本最薄14mm、最轻3磅,支持本地运行1200亿参数大模型。NVIDIA与微软合作推出OpenShell运行时和Windows安全原语,Adobe正在为RTX Spark重新架构Photoshop和Premiere。首批设备秋季上市,来自ASUS、Dell、HP、Lenovo、Microsoft Surface、MSI,Acer和GIGABYTE随后跟进。预计售价$3000-4000。RTX Spark路线图延伸至2030年:2027年升级Vera CPU+Rubin GPU+LPDDR6,2029-2030年Rosa CPU+Feynman GPU。这是继2020年Apple M1之后PC行业最大的架构变革信号。
思科以智能建筑数据平台为枢纽,整合企业网络与楼宇运营
思科在博客中阐述其“智能建筑”战略,核心是将企业网络、协作与楼宇管理系统数据通过Cisco Spaces等平台进行整合,实现基于实时占用数据的能源与空间优化。此举标志着网络基础设施的角色从连接层向企业运营数据控制层扩展。
NVIDIA 发布容器化 AI 模型文档自动生成工具包,集成 RAG 与 NIM 应对监管
NVIDIA 推出 Model Card Generator (MCG) 工具包,一个容器化流水线,可在一分钟内自动从源代码生成符合 Model Card++ 标准的 AI 模型文档。该工具利用 NVIDIA Nemotron RAG 进行高精度信息检索,并由大语言模型(如 GPT-OSS-120B)提取和格式化内容,旨在应对欧盟 AI 法案等法规要求。
诺基亚发布多轨集成光放大系统,瞄准AI集群跨数据中心带宽扩展瓶颈
诺基亚推出1830 GX多轨开放线路系统(Multi-rail OLS),其核心是1RU机架空间内集成支持四个光纤轨道(rail)的放大器模块。该设计旨在解决AI工作负载激增下,跨数据中心互联所需的多轨道部署面临的空间、功耗和运营复杂性挑战,通过硬件集成显著提升光传输基础设施的密度和能效。
Anthropic完成650亿美元H轮融资,估值逼近万亿并锁定海量算力
Anthropic宣布完成650亿美元H轮融资,投后估值达9650亿美元。资金将用于安全研究、扩展算力以满足Claude需求,并深化与亚马逊、谷歌、SpaceX等基础设施伙伴的合作,锁定高达10吉瓦的下一代TPU和GPU产能。
思科定义“跨域扩展”网络新范式,以硅光协同应对AI集群地理分散化
思科发布博客,系统阐述其应对AI训练集群地理分散化挑战的“跨域扩展”网络架构。该架构以Cisco Silicon One P200路由系统与800G ZR/ZR+相干可插拔光模块为核心,通过硅与光的协同设计,旨在为跨数十至数百公里数据中心的GPU集群提供确定性、低延迟、无损的连接。
思科将网络数据代理(NDB)深度集成至统一管理平台Nexus Dashboard
思科宣布将其网络数据代理(Nexus Data Broker)产品从独立的Linux主机/虚拟机部署模式,深度集成至其统一数据中心管理平台Cisco Nexus Dashboard 4.2中。此举旨在通过单一平台提供从流量捕获、聚合到分发的统一管理体验,简化部署、生命周期管理和安全策略,以应对AI时代对端到端网络可见性的复杂需求。
思科通过平台与商业模型推动MSP向成果导向型集成安全服务转型
思科发布战略指南,推动托管服务提供商(MSP)从销售零散安全点产品转向提供基于‘最佳套件’和客户业务成果的集成服务。其核心是通过Security Cloud Control统一管理平台、MSLA消费许可模型及专为MSP设计的商业框架(如Programmatic Discount),帮助合作伙伴构建高利润、差异化的安全服务。
NVIDIA以游戏捆绑订阅深化云游戏市场,凸显AI基础设施复用策略
NVIDIA通过GeForce NOW平台发布新游戏《007 First Light》,并将其与12个月Ultimate会员订阅捆绑销售。此举旨在利用其强大的云端RTX GPU算力(包括RTX 50系列)吸引并锁定用户,同时展示了其底层AI基础设施向消费级云游戏服务的能力复用。
思科提出AI威胁下基础设施安全新模型:从周期性加固到持续运行
思科CISO基于内部实践,提出应对AI驱动攻击的新安全模型。该模型将防御从基于CVSS评分的周期性漏洞修补,转变为以实时可见性、持续暴露验证、运行时保护和现代化为支柱的闭环运行体系。核心是构建一个无需停机即可持续向更安全状态演进的敏捷系统。
Cloudflare 披露其统一数据平台与 AI 代理架构,展示云原生数据栈闭环
Cloudflare 详细介绍了其内部统一数据平台 Town Lake 与 AI 数据代理 Skipper 的构建。该平台基于 Apache Trino、R2 (Iceberg)、DataHub 等组件,实现了对分散数据的统一 SQL 访问。Skipper 作为 AI 代理,允许用户通过自然语言查询数据,并深度集成于 Cloudflare 自身的产品生态(Workers AI、R2 等)。
思科资本将技术融资提升为核心战略杠杆,重构客户采购生态
思科通过其金融子公司Cisco Capital,将灵活的融资方案深度整合进技术销售流程。此举旨在将客户从传统的大额资本支出采购模式,转向基于生命周期的运营支出模式,以应对宏观经济压力并加速AI等关键技术的部署。
AMD发布面积优化型Versal Prime Gen 2自适应SoC,推动边缘计算硬件小型化
AMD宣布扩展其Versal Prime Series Gen 2自适应SoC产品线,新增三款面积优化型器件(2VM3454/3254/3104)。这些器件采用4核Arm Cortex-A78AE应用处理器配置,提供最小23x23mm封装,并在单位面积内提供更高的可编程逻辑密度,旨在为专业音视频、工业物联网等嵌入式应用平衡性能、尺寸与功耗。
思科发布前沿模型多轮对抗评估:所有模型均非免疫
思科发布了对15款前沿闭源大语言模型的多轮对抗攻击评估报告,结果显示所有模型在迭代攻击下都存在非微不足道的漏洞。单轮攻击成功率(ASR)无法预测多轮攻击下的表现,两者差距巨大,部分模型的多轮ASR高达88.30%。这挑战了行业当前依赖单轮基准测试评估模型安全性的做法。
AMD 以 EPYC 4005 与紧凑型系统重塑零售边缘基础设施
AMD 通过其 EPYC 4005 系列 CPU,与 Supermicro 等合作伙伴推出专为零售边缘设计的紧凑型服务器平台。这些系统强调在有限空间和功耗下的高性能(DDR5, PCIe Gen5)、远程管理(BMC)与硬件安全(TPM),旨在将数据中心级能力下沉至门店,实现工作负载整合与集中化运维。
Google Cloud 系统解构无服务器AI冷启动,定义生产级部署新范式
Google Cloud 发布深度指南,将AI模型在Cloud Run上的冷启动分解为四个技术阶段,并针对每阶段提出具体优化策略,包括模型4-bit量化、镜像流传输、启动CPU Boost、专用网络路径及精细的并发度调优公式。此举旨在将无服务器平台从支持AI升级为为AI深度优化的一级生产环境。