情报
AI 生成的结构化厂商动态简报
英特尔发布E835以太网控制器与适配器,主打200GbE带宽与硬件安全根
英特尔推出Ethernet E835系列控制器与网络适配器,提供高达200GbE带宽及灵活端口配置。产品集成硬件安全根、支持SPDM 1.2认证与FIPS 140-3,并优化RDMA与PCIe 5.0性能,旨在满足AI、数据中心及边缘的高密度与安全需求。
谷歌发布GCS MCP服务器,将非结构化数据无缝接入AI代理工作流
谷歌推出Google Cloud Storage (GCS) MCP服务器,支持远程托管和本地开源两种模式。该服务器基于Model Context Protocol (MCP)标准,旨在将存储在GCS中的非结构化数据(如文档、日志)直接转化为AI代理可用的上下文,并内置IAM、审计日志和Model Armor等企业级安全控制。
英特尔发布Xeon 6+处理器并推动面向智能体AI的机架级基础设施
英特尔在Computex上发布基于18A工艺的Xeon 6+处理器,强调其高能效核心密度。同时,公司联合富士康、SambaNova等合作伙伴,推动为智能体(Agentic)AI推理工作负载优化的新型机架级(Rack-Scale)基础设施,并宣布与Perplexity合作实现混合AI计算。
Cisco Live 2026开幕:AI Defense个性化Agent安全+自适应红队+Policy Studio+AgenticOps网络自动化
Cisco Live 2026拉斯维加斯开幕Keynote以Lead in the Agentic Era为主题,CEO Chuck Robbins和CPO Jeetu Patel阐述Cisco如何构建、保护和运行人与AI Agent并肩工作的企业。核心发布:AI Defense重大升级——自适应红队测试(用户提供自定义攻击目标,AI自动规划执行多阶段攻击)、Policy Studio(自然语言描述防护策略,上传组织政策文档,agent交互式细化边界)、Agent供应链安全(自动发现代码库/云平台/容器中agent及依赖图,CI/CD集成扫描MCP server/工具/技能漏洞)。平台无关:原生集成Amazon Bedrock AgentCore、Google Agent Development Kit、LangChain,支持NVIDIA NeMo guardrails和OpenShell agent harness。Astrix收购保障API密钥/OAuth token/服务账户等Agent身份安全。AgenticOps实现自主检测变更、分类事件、机器速度执行更新,将多周工单流程缩短至分钟级。Common Policy一次定义全局执行。CCNA v2.0加入AI工具,CCIE Automation加入AI驱动运维。
英特尔联合生态伙伴推出机架级AI基础设施,瞄准推理与智能体工作负载
英特尔在Computex宣布推出基于Xeon 6+处理器与SambaNova RDUs的机架级AI基础设施,并与富士康、Vector Core Compute等合作,提供面向推理和智能体工作负载的优化系统及解耦推理云服务。此举标志着英特尔从芯片供应商向AI系统解决方案提供商的战略延伸。
Google Cloud 集成 GKE 多集群推理网关与托管 DRANET,定义 AI 服务网格新范式
Google Cloud 通过博客和代码实验室展示了一项实验:将 TPU v6e、GKE 托管 DRANET(动态资源分配网络)、多集群 GKE Inference Gateway 与 Cloud Storage FUSE 集成,构建跨区域、高可用的 AI 推理服务。该架构利用 Fleet 统一管理集群,并通过声明式策略实现基于硬件指标(如 KV cache 使用率)的智能流量路由与故障转移。
Arm与NVIDIA推出RTX Spark,定义智能体AI PC硬件新标准
Arm联合NVIDIA发布基于Arm Grace CPU与Blackwell RTX GPU的RTX Spark平台,旨在为Windows on Arm生态提供高性能本地AI推理能力。该平台采用统一内存架构,目标直指支持下一代自主AI工作流(如agentic RAG),标志着PC从以应用为中心向以智能体为中心的根本性转变。
Oracle Cloud加入Arm AGI CPU生态,Arm架构加速夺取AI基础设施控制层
Oracle Cloud Infrastructure宣布加入Arm AGI CPU生态系统,将基于Arm架构的优化CPU引入其云平台以支持Agentic AI工作负载。这一动作进一步验证了Arm Neoverse平台在云数据中心,特别是AI基础设施中替代传统x86架构的趋势。
思科AI Defense升级,推出针对AI Agent的个性化上下文安全
思科宣布其AI Defense平台重大更新,核心转向为AI Agent提供深度个性化安全。新功能包括基于自然语言的自适应红队测试与策略制定、自动化的Agent供应链漏洞扫描,以及跨主流云平台和Agent开发框架(如Amazon Bedrock AgentCore、LangChain)的原生集成。
Cisco Live 2026开幕:AI Defense个性化Agent安全+自适应红队+Policy Studio+AgenticOps网络自动化
Cisco Live 2026拉斯维加斯开幕Keynote以Lead in the Agentic Era为主题,CEO Chuck Robbins和CPO Jeetu Patel阐述Cisco如何构建、保护和运行人与AI Agent并肩工作的企业。核心发布:AI Defense重大升级——自适应红队测试(用户提供自定义攻击目标,AI自动规划执行多阶段攻击)、Policy Studio(自然语言描述防护策略,上传组织政策文档,agent交互式细化边界)、Agent供应链安全(自动发现代码库/云平台/容器中agent及依赖图,CI/CD集成扫描MCP server/工具/技能漏洞)。平台无关:原生集成Amazon Bedrock AgentCore、Google Agent Development Kit、LangChain,支持NVIDIA NeMo guardrails和OpenShell agent harness。Astrix收购保障API密钥/OAuth token/服务账户等Agent身份安全。AgenticOps实现自主检测变更、分类事件、机器速度执行更新,将多周工单流程缩短至分钟级。Common Policy一次定义全局执行。CCNA v2.0加入AI工具,CCIE Automation加入AI驱动运维。
Google客户案例揭示:企业从LLM API消费转向自有微调开源模型
Trustpilot与Google合作,通过微调Gemma开源模型,在Dataflow和Gemini Enterprise Agent Platform上构建高吞吐量实时数据处理流水线,替代传统ML方案并实现成本可控。此举标志着企业AI策略从依赖闭源API向拥有模型所有权和优化基础设施的范式转变。
英特尔以Xeon 6+与E835强化CPU在AI基础设施中的控制平面地位
英特尔发布Xeon 6+处理器与Ethernet E835网络适配器,系统性阐述其AI平台战略。核心是将CPU(Xeon)定位为现代AI基础设施的“控制平面”,负责智能体(Agentic)AI工作负载的编排、并发与数据移动,而网络与加速器则作为高效数据平面。此举旨在通过提升能效与系统级协同,应对规模化AI部署的瓶颈。
Google推出A2UI开放协议,定义AI Agent原生交互式UI新标准
Google发布A2UI开放协议,允许AI Agent通过JSON描述交互式UI组件,并深度集成至Gemini Enterprise平台。开发者构建的A2A端点Agent可原生渲染日期选择器、地图等丰富控件,无需关心前端框架,由GE或自定义客户端负责安全渲染。
NVIDIA将Step 3.7 Flash多模态模型深度整合至其企业AI全栈
NVIDIA宣布在其加速平台上全面支持StepFun的Step 3.7 Flash模型,这是一个1980亿参数的MoE多模态模型。通过TensorRT-LLM、vLLM进行优化推理,并通过NVIDIA NIM提供生产就绪的容器化微服务部署,同时支持基于NeMo框架的Day 0微调。
Anthropic完成650亿美元H轮融资,估值逼近万亿并锁定海量算力
Anthropic宣布完成650亿美元H轮融资,投后估值达9650亿美元。资金将用于安全研究、扩展算力以满足Claude需求,并深化与亚马逊、谷歌、SpaceX等基础设施伙伴的合作,锁定高达10吉瓦的下一代TPU和GPU产能。
NVIDIA Vera CPU交付四大AI实验室,Computex前夕N1X+硅光子学三线并发
NVIDIA于5月18日宣布Vera CPU首批交付Anthropic、OpenAI、SpaceX AI和Oracle Cloud Infrastructure,由超大规模计算副总裁Ian Buck亲自送货。Vera是NVIDIA首款专为Agent式AI设计的CPU,88颗自研Olympus核心(Arm v9.2),LPDDR5X带宽1.2TB/s,Phoronix基准测试单核超越AMD EPYC 9575F和Intel Xeon 6980P,Linux内核编译仅20秒。同日NVIDIA+微软+Arm联合发布神秘海报预告N1X笔记本处理器(Blackwell GPU+20核联发科Arm CPU+128GB统一内存),Dell/Lenovo/ASUS已准备设备。此外NVIDIA三个月内向硅光子学投资至少$65亿(Lumentum/Coherent/Marvell各$20亿+Corning $5亿+Ayer Labs E轮$5亿),黄仁勋称硅光产能需求远超全球供给,CPO 2026渗透率0.5%→2030年35%。
Google 通过加速器项目在 MENA-T 区域系统性培育 AI 原生应用生态
Google 宣布了其 MENA-T 区域创业加速器的新一期 15 家初创公司名单,这些公司均为 AI-First 企业,覆盖医疗、教育、制造、安全等多个垂直领域。该计划提供包括 AI 安全、生成式设计在内的技术指导,并深度整合 Google Cloud 的 AI 基础设施(如 Gemini Enterprise Agent Platform, BigQuery, GKE),旨在将区域创新绑定至 Google 的 AI 技术栈。
Cloudflare 披露其统一数据平台与 AI 代理架构,展示云原生数据栈闭环
Cloudflare 详细介绍了其内部统一数据平台 Town Lake 与 AI 数据代理 Skipper 的构建。该平台基于 Apache Trino、R2 (Iceberg)、DataHub 等组件,实现了对分散数据的统一 SQL 访问。Skipper 作为 AI 代理,允许用户通过自然语言查询数据,并深度集成于 Cloudflare 自身的产品生态(Workers AI、R2 等)。
思科发布前沿模型多轮对抗评估:所有模型均非免疫
思科发布了对15款前沿闭源大语言模型的多轮对抗攻击评估报告,结果显示所有模型在迭代攻击下都存在非微不足道的漏洞。单轮攻击成功率(ASR)无法预测多轮攻击下的表现,两者差距巨大,部分模型的多轮ASR高达88.30%。这挑战了行业当前依赖单轮基准测试评估模型安全性的做法。
Google Cloud 系统解构无服务器AI冷启动,定义生产级部署新范式
Google Cloud 发布深度指南,将AI模型在Cloud Run上的冷启动分解为四个技术阶段,并针对每阶段提出具体优化策略,包括模型4-bit量化、镜像流传输、启动CPU Boost、专用网络路径及精细的并发度调优公式。此举旨在将无服务器平台从支持AI升级为为AI深度优化的一级生产环境。