情报
AI 生成的结构化厂商动态简报
NVIDIA发布工厂运营蓝图,定义自主工厂管理器代理架构
NVIDIA发布Factory Operations Blueprint (FOX)参考设计,用于构建基于AI的自主工厂管理器代理。该蓝图整合NemoClaw、AI-Q Blueprint及Nemotron开放模型,旨在连接工厂异构系统、自动化AI模型训练并协调各类专业代理,实现工厂级智能决策。
NVIDIA联合台系制造巨头,以AI平台重构制造业运营与控制层
NVIDIA联合台积电、富士康、广达等超过500家生态伙伴,在其Vera Rubin NVL72 AI基础设施生产过程中,深度应用CUDA-X、Omniverse、AI代理及物理AI技术,优化从芯片设计、工厂规划到产线运营的全流程。此举将NVIDIA的技术栈从计算加速延伸至制造运营的核心控制层。
微软发布集成NVIDIA Blackwell的Surface Laptop Ultra,定位AI与开发创作者
微软发布新款Surface Laptop Ultra,首次在笔记本电脑中集成NVIDIA Blackwell RTX GPU,配备高达128GB统一内存,支持本地运行1200亿参数模型。该产品由微软、Windows和NVIDIA深度合作,从芯片层面优化,专为AI构建者、开发者和内容创作者的高负载工作流设计。
微软与英伟达共推基于Arm架构RTX Spark的Windows平台,瞄准本地AI智能体与工作站
微软与英伟达宣布深度整合,推出基于全新Arm架构RTX Spark芯片的Windows PC与工作站。该平台通过高达128GB统一内存、1 petaflop AI算力及Windows系统层优化,旨在将前沿AI模型与智能体(agent)工作负载从云端迁移至本地设备运行。
NVIDIA发布Vera CPU,为AI代理工作负载定义新设计标准
NVIDIA推出基于自研Olympus核心的Vera CPU,针对AI代理和强化学习工作负载中的‘工具调用-执行’循环进行架构优化。该CPU通过高单核性能、高并发及高效LPDDR5X内存子系统,旨在提升AI工厂中CPU关键路径的性能,从而增加整体AI输出吞吐量和能效。
NVIDIA开源DSX OS,定义AI工厂全栈运营软件层
NVIDIA发布其DSX平台的软件核心DSX OS,这是一套开源、模块化的软件组件,旨在协调从芯片、系统、软件到设施(电力、冷却)的整个AI工厂堆栈。它通过DSX Exchange(MQTT通信枢纽)、MaxLPS(动态功耗管理)、Infra Controller(裸金属生命周期管理)等组件,实现IT/OT深度融合,目标是提升“每瓦特token产出”并降低token成本。
英特尔以Xeon 6+与E835强化CPU在AI基础设施中的控制平面地位
英特尔发布Xeon 6+处理器与Ethernet E835网络适配器,系统性阐述其AI平台战略。核心是将CPU(Xeon)定位为现代AI基础设施的“控制平面”,负责智能体(Agentic)AI工作负载的编排、并发与数据移动,而网络与加速器则作为高效数据平面。此举旨在通过提升能效与系统级协同,应对规模化AI部署的瓶颈。
英特尔推出统一硬件-软件堆栈,瞄准物理AI机器人规模化部署
英特尔宣布其Series 3处理器已获得130多个边缘AI与机器人设计项目,并推出开源框架OpenVINO Physical AI。该组合旨在解决机器人从实验模型到规模化生产部署的碎片化挑战,通过统一的硬件-软件堆栈降低总拥有成本。
NVIDIA RTX Spark发布:AI PC时代的开启
NVIDIA在Computex 2026正式发布RTX Spark——首款面向AI Agent时代的Windows PC超级芯片。该芯片基于TSMC 3nm工艺,整合Blackwell架构GPU(6144 CUDA核心+第五代Tensor Core,FP4精度)与20核Grace CPU,通过NVLink-C2C互联(600GB/s),提供1 petaflop AI算力和最高128GB统一LPDDR5X内存(300GB/s带宽)。笔记本最薄14mm、最轻3磅,支持本地运行1200亿参数大模型。NVIDIA与微软合作推出OpenShell运行时和Windows安全原语,Adobe正在为RTX Spark重新架构Photoshop和Premiere。首批设备秋季上市,来自ASUS、Dell、HP、Lenovo、Microsoft Surface、MSI,Acer和GIGABYTE随后跟进。预计售价$3000-4000。RTX Spark路线图延伸至2030年:2027年升级Vera CPU+Rubin GPU+LPDDR6,2029-2030年Rosa CPU+Feynman GPU。这是继2020年Apple M1之后PC行业最大的架构变革信号。
思科将AI深度整合入CCNA/CCIE认证,重塑网络工程师核心技能栈
思科在Cisco Live 2026上宣布,其核心认证体系将全面拥抱AI。CCNA v2.0蓝图更新,CCIE实践考试集成AI工具,并推出大量关于AI网络运维(如LangChain代理、Agentic Operations)的新培训路径。这标志着网络专业人才的能力模型正从传统协议配置转向AI驱动运维。
NVIDIA 发布 DynoSim 仿真框架,将 AI 服务栈优化从硬件试错转向模拟优先
NVIDIA 推出 DynoSim,这是一个基于 Rust 的、全栈离散事件仿真框架,用于对 NVIDIA Dynamo AI 服务栈进行原子级模拟。它通过虚拟时钟和组件化事件队列,将配置搜索和算法研究从昂贵的 GPU 硬件实验转变为快速模拟验证循环,旨在高效探索服务部署的帕累托前沿。
思科以智能建筑数据平台为枢纽,整合企业网络与楼宇运营
思科在博客中阐述其“智能建筑”战略,核心是将企业网络、协作与楼宇管理系统数据通过Cisco Spaces等平台进行整合,实现基于实时占用数据的能源与空间优化。此举标志着网络基础设施的角色从连接层向企业运营数据控制层扩展。
NVIDIA 发布容器化 AI 模型文档自动生成工具包,集成 RAG 与 NIM 应对监管
NVIDIA 推出 Model Card Generator (MCG) 工具包,一个容器化流水线,可在一分钟内自动从源代码生成符合 Model Card++ 标准的 AI 模型文档。该工具利用 NVIDIA Nemotron RAG 进行高精度信息检索,并由大语言模型(如 GPT-OSS-120B)提取和格式化内容,旨在应对欧盟 AI 法案等法规要求。
思科与微软整合企业浏览器与SSE平台,构建零信任应用访问新控制点
思科将其Secure Access(SSE)平台与微软Edge for Business企业浏览器深度集成,旨在通过浏览器原生执行统一的零信任访问、数据防泄漏(DLP)及AI代理安全策略,简化对私有应用的安全访问。
Google推出A2UI开放协议,定义AI Agent原生交互式UI新标准
Google发布A2UI开放协议,允许AI Agent通过JSON描述交互式UI组件,并深度集成至Gemini Enterprise平台。开发者构建的A2A端点Agent可原生渲染日期选择器、地图等丰富控件,无需关心前端框架,由GE或自定义客户端负责安全渲染。
诺基亚发布多轨集成光放大系统,瞄准AI集群跨数据中心带宽扩展瓶颈
诺基亚推出1830 GX多轨开放线路系统(Multi-rail OLS),其核心是1RU机架空间内集成支持四个光纤轨道(rail)的放大器模块。该设计旨在解决AI工作负载激增下,跨数据中心互联所需的多轨道部署面临的空间、功耗和运营复杂性挑战,通过硬件集成显著提升光传输基础设施的密度和能效。
NVIDIA将Step 3.7 Flash多模态模型深度整合至其企业AI全栈
NVIDIA宣布在其加速平台上全面支持StepFun的Step 3.7 Flash模型,这是一个1980亿参数的MoE多模态模型。通过TensorRT-LLM、vLLM进行优化推理,并通过NVIDIA NIM提供生产就绪的容器化微服务部署,同时支持基于NeMo框架的Day 0微调。
思科将安全深度嵌入网络架构,作为AI时代防御核心
思科IT与安全团队阐述其内部安全架构,将安全能力直接内嵌于网络基础设施各层,从园区到数据中心。该策略通过软件定义分段、统一策略和自动化运营,旨在遏制AI驱动的横向移动威胁,并推动网络与安全团队的深度协同。
AWS推出新一代Resilience Hub,集成生成式AI重构SRE弹性管理
AWS宣布其Resilience Hub平台的重大升级,引入基于业务路径的新应用模型、生成式AI驱动的故障模式分析、自动依赖发现以及模块化弹性策略。该平台深度集成AWS Organizations,旨在为企业SRE和开发团队提供从策略定义、评估到合规证明的端到端结构化弹性管理能力。
Anthropic完成650亿美元H轮融资,估值逼近万亿并锁定海量算力
Anthropic宣布完成650亿美元H轮融资,投后估值达9650亿美元。资金将用于安全研究、扩展算力以满足Claude需求,并深化与亚马逊、谷歌、SpaceX等基础设施伙伴的合作,锁定高达10吉瓦的下一代TPU和GPU产能。