情报
AI 生成的结构化厂商动态简报
英特尔以Xeon 6+与E835强化CPU在AI基础设施中的控制平面地位
英特尔发布Xeon 6+处理器与Ethernet E835网络适配器,系统性阐述其AI平台战略。核心是将CPU(Xeon)定位为现代AI基础设施的“控制平面”,负责智能体(Agentic)AI工作负载的编排、并发与数据移动,而网络与加速器则作为高效数据平面。此举旨在通过提升能效与系统级协同,应对规模化AI部署的瓶颈。
思科将AI深度整合入CCNA/CCIE认证,重塑网络工程师核心技能栈
思科在Cisco Live 2026上宣布,其核心认证体系将全面拥抱AI。CCNA v2.0蓝图更新,CCIE实践考试集成AI工具,并推出大量关于AI网络运维(如LangChain代理、Agentic Operations)的新培训路径。这标志着网络专业人才的能力模型正从传统协议配置转向AI驱动运维。
思科与微软整合企业浏览器与SSE平台,构建零信任应用访问新控制点
思科将其Secure Access(SSE)平台与微软Edge for Business企业浏览器深度集成,旨在通过浏览器原生执行统一的零信任访问、数据防泄漏(DLP)及AI代理安全策略,简化对私有应用的安全访问。
NVIDIA将Step 3.7 Flash多模态模型深度整合至其企业AI全栈
NVIDIA宣布在其加速平台上全面支持StepFun的Step 3.7 Flash模型,这是一个1980亿参数的MoE多模态模型。通过TensorRT-LLM、vLLM进行优化推理,并通过NVIDIA NIM提供生产就绪的容器化微服务部署,同时支持基于NeMo框架的Day 0微调。
Google 通过加速器项目在 MENA-T 区域系统性培育 AI 原生应用生态
Google 宣布了其 MENA-T 区域创业加速器的新一期 15 家初创公司名单,这些公司均为 AI-First 企业,覆盖医疗、教育、制造、安全等多个垂直领域。该计划提供包括 AI 安全、生成式设计在内的技术指导,并深度整合 Google Cloud 的 AI 基础设施(如 Gemini Enterprise Agent Platform, BigQuery, GKE),旨在将区域创新绑定至 Google 的 AI 技术栈。
NVIDIA发布Vera CPU基准测试,专为智能体AI工厂优化
NVIDIA公布了其专为智能体AI设计的Vera CPU的第三方基准测试结果。该CPU集成了88个定制Olympus核心与第二代LPDDR5X内存子系统,在特定功耗下实现了显著的性能与内存带宽提升,标志着NVIDIA在数据中心CPU市场对x86架构发起实质性挑战。
Google Cloud展示垂直行业AI Agent架构,强调混合集成能力
Google Cloud通过客户案例Movix,展示了为牙科制造业构建的端到端AI Agent解决方案。该方案基于Google Cloud基础设施,利用定制模型和Gemini Enterprise Agent Platform,并重点设计了连接本地遗留系统的混合架构,以进入保守市场。
Google I/O 2026全面押注Agentic AI:Gemini 3.5 Flash/Omni/Antigravity 2.0/Gemini Spark密集发布
Google I/O 2026发布Gemini 3.5 Flash(4倍输出速度+前沿智能)、Gemini Omni Flash(原生多模态视频生成)、Antigravity 2.0(Agent编排桌面平台+CLI+SDK)、Gemini Spark(24/7个人AI助手)。Gemini MAU从4亿增至9亿;资本开支2026年预计1800-1900亿美元(2022年的6倍)。
NVIDIA 以智能体工具包推动 AI 工作流从模型调用向编排平台演进
NVIDIA 通过其 NeMo Agent Toolkit 开源库,展示了一个用于量化金融信号发现的多智能体系统参考架构。该系统将传统手动、碎片化的研究流程,转变为由配置驱动、具备可观测性的自动化闭环,凸显了智能体编排层在复杂 AI 应用中的核心价值。
NVIDIA在COMPUTEX展示Vera Rubin NVL72等AI基础设施创新
NVIDIA在COMPUTEX 2026上获得多项最佳选择奖,其Vera Rubin NVL72机柜级AI超算、Jetson Thor边缘平台及Alpamayo自动驾驶开放平台获奖,展示了其在AI工厂、边缘推理和物理AI领域的基础设施布局。
思科通过MCP与Agentic Workflows构建AI原生网络控制平面
思科在Cisco Live 2026上系统展示其网络平台产品组合(Meraki、Catalyst Center)如何通过MCP(模型上下文协议)和Agentic Workflows,将AI代理深度集成到网络自动化与运维中,实现从意图到执行的闭环。
思科通过芯片层智能包流重塑AI数据中心网络架构
思科推出基于Silicon One G300芯片的智能包流技术,将网络从高速传输层转变为具备感知、适应和优化能力的智能系统,以应对大规模AI工作负载。该技术通过硬件级遥测、自适应路由和拥塞管理,显著提升AI集群的集体完成时间和GPU利用率。
英特尔以集成SoC架构推动边缘AI机器人计算从独立GPU迁移
英特尔宣布其Core Ultra Series 3处理器正被多家机器人公司采用,以集成CPU、GPU、NPU的SoC架构替代昂贵、高功耗的独立GPU,用于边缘AI推理。这标志着机器人“大脑”向成本效益更高、更易部署的集成化异构计算架构转变。
AMD定义“智能代理计算机”新品类,推动AI推理本地化
AMD提出“智能代理计算机”概念,旨在通过本地化硬件(Ryzen™ AI Max处理器、Radeon™ AI PRO显卡)运行持续AI推理工作负载,以应对云API成本上升。其核心是推动AI从云端按需消费模式向本地固定成本、高吞吐量模式转移。
AMD发布AI Halo开发平台与Max PRO 400系列处理器,瞄准本地AI代理计算
AMD发布Ryzen AI Halo开发者平台和Ryzen AI Max PRO 400系列处理器,旨在为本地AI代理(Agent)应用提供开发与运行环境。新平台支持高达2000亿参数模型本地运行,并提供高达192GB统一内存,推动AI工作负载从云端向边缘设备迁移。
NVIDIA与Google Cloud深化开发者生态融合,推进AI基础设施与应用栈整合
NVIDIA与Google Cloud联合开发者社区规模超10万人,提供从JAX优化、NVIDIA Dynamo推理优化到AI水印(SynthID)的全栈学习路径。此举旨在通过整合双方底层硬件(Blackwell/Rubin GPU)、云平台(GKE, AI Hypercomputer)与软件框架(Nemotron, Gemma),加速企业级AI应用从原型到生产的落地。
谷歌公共部门展示AI Agent规模化部署蓝图
谷歌公共部门通过美国交通部、FDA和洛杉矶市案例,阐述其推动政府机构从AI试点转向全面Agentic转型的战略。其核心是提供集成化AI堆栈,并强调领导力、规模化与以人为本三大支柱。
NVIDIA与戴尔发布全栈AI工厂,加速企业级Agentic AI部署
NVIDIA与戴尔深化合作,推出更新版Dell AI Factory with NVIDIA,旨在为企业提供从工作站到数据中心的端到端Agentic AI推理与部署平台。该平台整合了NVIDIA Vera Rubin GPU、Vera CPU、Confidential Computing及Nemotron模型,强调安全、高性能的本地化AI基础设施,以应对激增的AI推理需求。
AWS深化AI代理与多云连接,强化企业现代化与安全
AWS发布多项更新,重点包括将Claude Platform原生集成至AWS账户,推出更强大的EC2 M3 Ultra Mac实例,并扩展AWS Transform AI代理现代化服务至Kiro、Claude等平台。同时,AWS Security Agent新增全仓库代码扫描,AWS Interconnect新增对Oracle Cloud Infrastructure的多云连接支持。
诺基亚与沃达丰在AWS云上验证核心网功能,推进IoT平台云化
沃达丰与诺基亚成功完成一项试验,将诺基亚的IMS语音核心网和分组数据核心网等关键网络功能部署在AWS云基础设施上,旨在为全球物联网连接平台提供更敏捷的容量扩展能力。