情报
AI 生成的结构化厂商动态简报
NVIDIA将Step 3.7 Flash多模态模型深度整合至其企业AI全栈
NVIDIA宣布在其加速平台上全面支持StepFun的Step 3.7 Flash模型,这是一个1980亿参数的MoE多模态模型。通过TensorRT-LLM、vLLM进行优化推理,并通过NVIDIA NIM提供生产就绪的容器化微服务部署,同时支持基于NeMo框架的Day 0微调。
思科定义“跨域扩展”网络新范式,以硅光协同应对AI集群地理分散化
思科发布博客,系统阐述其应对AI训练集群地理分散化挑战的“跨域扩展”网络架构。该架构以Cisco Silicon One P200路由系统与800G ZR/ZR+相干可插拔光模块为核心,通过硅与光的协同设计,旨在为跨数十至数百公里数据中心的GPU集群提供确定性、低延迟、无损的连接。
思科将网络数据代理(NDB)深度集成至统一管理平台Nexus Dashboard
思科宣布将其网络数据代理(Nexus Data Broker)产品从独立的Linux主机/虚拟机部署模式,深度集成至其统一数据中心管理平台Cisco Nexus Dashboard 4.2中。此举旨在通过单一平台提供从流量捕获、聚合到分发的统一管理体验,简化部署、生命周期管理和安全策略,以应对AI时代对端到端网络可见性的复杂需求。
AWS 通过 AI Hero 计划强化社区主导的 AI 基础设施布道
AWS 在 2026 年 5 月新晋的四位 Hero 中,有三位被授予“人工智能英雄”称号,他们专注于利用 Amazon Bedrock、Nova 等 AI 服务构建工具、组织大型社区活动并参与 AI/ML 认证体系构建。此举标志着 AWS 正系统性地将社区影响力从泛云架构向 AI 基础设施领域深度引导。
Cloudflare 披露其统一数据平台与 AI 代理架构,展示云原生数据栈闭环
Cloudflare 详细介绍了其内部统一数据平台 Town Lake 与 AI 数据代理 Skipper 的构建。该平台基于 Apache Trino、R2 (Iceberg)、DataHub 等组件,实现了对分散数据的统一 SQL 访问。Skipper 作为 AI 代理,允许用户通过自然语言查询数据,并深度集成于 Cloudflare 自身的产品生态(Workers AI、R2 等)。
AMD发布面积优化型Versal Prime Gen 2自适应SoC,推动边缘计算硬件小型化
AMD宣布扩展其Versal Prime Series Gen 2自适应SoC产品线,新增三款面积优化型器件(2VM3454/3254/3104)。这些器件采用4核Arm Cortex-A78AE应用处理器配置,提供最小23x23mm封装,并在单位面积内提供更高的可编程逻辑密度,旨在为专业音视频、工业物联网等嵌入式应用平衡性能、尺寸与功耗。
AMD 以 EPYC 4005 与紧凑型系统重塑零售边缘基础设施
AMD 通过其 EPYC 4005 系列 CPU,与 Supermicro 等合作伙伴推出专为零售边缘设计的紧凑型服务器平台。这些系统强调在有限空间和功耗下的高性能(DDR5, PCIe Gen5)、远程管理(BMC)与硬件安全(TPM),旨在将数据中心级能力下沉至门店,实现工作负载整合与集中化运维。
Google Cloud 系统解构无服务器AI冷启动,定义生产级部署新范式
Google Cloud 发布深度指南,将AI模型在Cloud Run上的冷启动分解为四个技术阶段,并针对每阶段提出具体优化策略,包括模型4-bit量化、镜像流传输、启动CPU Boost、专用网络路径及精细的并发度调优公式。此举旨在将无服务器平台从支持AI升级为为AI深度优化的一级生产环境。
NVIDIA发布RTX PRO 4500 Blackwell加速基因组与蛋白质折叠计算
NVIDIA推出基于Blackwell架构的RTX PRO 4500服务器GPU,通过集成Parabricks、Openfold3等软件,在基因组序列比对、变异检测和蛋白质结构预测等关键生命科学工作负载上实现2倍以上性能提升,显著降低计算时间与能耗。
AWS SageMaker 通过 OpenAI 兼容 API 争夺 AI 推理控制权
AWS 宣布其 Amazon SageMaker AI 推理端点现支持 OpenAI 兼容的 API 接口。此举使开发者无需修改代码即可将基于 OpenAI API 构建的 AI 应用迁移至 SageMaker 平台,显著降低了从 OpenAI 向 AWS AI 基础设施迁移的技术与锁定门槛。
Anthropic联合创始人借教宗通谕呼吁外部力量制衡AI发展
Anthropic联合创始人Chris Olah受邀在梵蒂冈对教宗方济各关于AI的通谕发表评论。他坦承前沿AI实验室面临商业、地缘政治等多重压力,可能导致行为偏离,因此强调需要不受这些利益驱动的外部力量(如宗教、哲学、社会)进行审视、批评和引导。
Apple注册genai.apple.com域名,WWDC 2026将发布Siri独立App与生成式AI战略独立化
Apple在WWDC 2026前注册genai.apple.com域名,暗示生成式AI战略独立化。预计6月8日发布Siri重大升级:个人上下文感知、屏幕理解、深度应用操作,底层由Gemini驱动。iOS 27将带来Siri专属App、文字对话和第三方AI Extensions。
Exploitation of KnowledgeDeliver via ViewState Deserialization Vulnerability | Google Cloud Blog
Threat IntelligenceExploitation of KnowledgeDeliver via ViewState Deserialization VulnerabilityMay 25, 2026Mandiant Google Threat Intelligence Group Mandiant ServicesStop attacks, reduce risk, and adv...
思科与Qumulo验证统一数据平台架构,瞄准AI与混合负载
思科通过博客与白皮书,验证了其UCS M8机架服务器与Qumulo数据平台的集成方案。该方案旨在为AI、企业应用等混合工作负载提供统一、可扩展的文件与对象存储,并通过Cisco Intersight实现集中管理,以应对数据碎片化挑战。
BadHost漏洞(CVE-2026-48710):Starlette单字符绕过认证,全球AI Agent基础设施面临暴露风险
安全机构X41 D-Sec在OSTIF资助的vLLM审计中发现Starlette框架认证绕过漏洞CVE-2026-48710(BadHost)。根因:Starlette用HTTP Host头拼接重建request.url时未验证Host值合法性——注入/、?或#字符可导致request.url.path与ASGI路由的scope[path]产生解析不一致,path-based认证中间件被欺骗放行受保护资源。MCP Server特别高危:MCP规范要求/.well-known/oauth-authorization-server等Discovery端点默认公开,为攻击者提供最可靠的Host头注入路径。X41 D-Sec扫描发现生物制药临床试验数据库、企业邮箱完整访问权、AWS云拓扑、身份验证公司PII、工业设备堡垒机SSH等生产系统暴露。Starlette 1.0.1(5月21日)已修复,但3个月补丁周期(2月发现→5月发布)和间接依赖链导致大量部署仍受影响。X41评级CVSS 7.0(High),Starlette维护者评级6.5(Moderate)——分歧在于path-based auth是否为anti-pattern。
思科通过MCP与Agentic Workflows构建AI原生网络控制平面
思科在Cisco Live 2026上系统展示其网络平台产品组合(Meraki、Catalyst Center)如何通过MCP(模型上下文协议)和Agentic Workflows,将AI代理深度集成到网络自动化与运维中,实现从意图到执行的闭环。
思科全面拥抱SONiC,提供从硬件到软件的全栈开放网络方案
思科宣布在其Cisco 8000和即将推出的N9000系列交换机上全面支持开放网络操作系统SONiC,并提供构建自有发行版和预构建镜像两种消费模式。此举旨在将思科硅芯片性能与SONiC的开放架构相结合,为AI和高性能工作负载提供可编程、可扩展的网络基础设施。
Google将AI Studio与云数据库及Firebase深度集成,降低全栈应用开发门槛
Google宣布AI Studio与Google Cloud的集成更新,支持开发者通过自然语言提示,一键将全栈应用部署至Cloud Run,并自动配置Firestore、Cloud SQL数据库及Firebase Auth身份验证。此举旨在通过零成本启动和AI代理驱动的数据库选择,显著降低应用原型开发与部署的初始摩擦。
英特尔以集成SoC架构推动边缘AI机器人计算从独立GPU迁移
英特尔宣布其Core Ultra Series 3处理器正被多家机器人公司采用,以集成CPU、GPU、NPU的SoC架构替代昂贵、高功耗的独立GPU,用于边缘AI推理。这标志着机器人“大脑”向成本效益更高、更易部署的集成化异构计算架构转变。
AMD定义“智能代理计算机”新品类,推动AI推理本地化
AMD提出“智能代理计算机”概念,旨在通过本地化硬件(Ryzen™ AI Max处理器、Radeon™ AI PRO显卡)运行持续AI推理工作负载,以应对云API成本上升。其核心是推动AI从云端按需消费模式向本地固定成本、高吞吐量模式转移。