情报
AI 生成的结构化厂商动态简报
Cisco 通过 Isovalent 推动云原生服务架构升级
Telefónica旗下acens采用Cisco的Isovalent Enterprise for Cilium解决方案,构建高性能、可观测且安全的Kubernetes平台,满足多云环境下的企业级需求。该方案基于eBPF技术,提供细粒度网络策略和透明加密,增强多租户环境的安全性。
思科开源AI Agent安全治理工具DefenseClaw
思科推出开源工具DefenseClaw,为OpenClaw等AI Agent提供三层安全防护架构:供应链扫描、运行时检测和系统边界控制。该方案整合了NVIDIA的OpenShell沙箱技术,实现从安装到运行的全周期自动化安全治理。
NVIDIA推出物理AI数据工厂蓝图,将计算转化为合成数据
NVIDIA在GTC上发布物理AI数据工厂蓝图,这是一个将计算转化为大规模高质量合成训练数据的开放参考架构。它基于Cosmos世界模型和OSMO操作器,旨在解决真实世界数据难以规模化获取和处理的瓶颈,为下一代自主系统和机器人提供数据引擎。
英伟达组建Nemotron联盟,推动开放前沿模型协作
英伟达在GTC上宣布成立Nemotron联盟,联合Mistral AI等模型构建者和AI实验室,共同开发前沿级开源基础模型。此举旨在通过共享专业知识、数据和算力,推动开放模型生态,并强调未来AI将由开放与专有模型共同构成的系统驱动。
NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区
NVIDIA将其GPU动态资源分配(DRA)驱动捐献给CNCF,使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区,并协同多家云厂商推动标准化。
英伟达推出OpenShell,为自主AI代理建立运行时安全沙盒
英伟达发布开源项目OpenShell,旨在为自主AI代理提供安全运行时环境。其核心是采用‘浏览器标签’模型,在系统层面隔离代理操作与策略执行,防止策略被覆盖或数据泄露。此举与多家安全厂商合作,推动企业级AI代理的统一策略层。
思科扩展零信任安全至AI代理生态
思科在RSA 2026宣布针对AI代理的安全创新,扩展Zero Trust Access至非人类身份,引入agentic IAM在Duo、MCP策略执行于Secure Access SSE,并推出AI Defense: Explorer Edition自助测试工具及DefenseClaw开源框架,以自动化安全部署。
AMD与NAVER Cloud合作推进韩国主权AI基础设施建设
AMD与韩国NAVER Cloud宣布深化战略合作,旨在加速韩国主权AI基础设施建设。NAVER Cloud将扩大部署AMD EPYC“威尼斯”处理器,并获得下一代Instinct MI455X GPU的早期访问权限,双方将共同优化AI服务与软件栈。
AMD与三星深化合作,锁定HBM4供应并探索代工
AMD与三星签署谅解备忘录,将三星作为下一代Instinct MI455X GPU的HBM4主要供应商,并合作优化用于第六代EPYC CPU的DDR5内存。双方还将探讨三星为AMD提供先进制程代工服务的可能性。
NVIDIA将CUDA Tile编程模型扩展至Julia语言
NVIDIA通过cuTile.jl包将其CUDA Tile高级GPU编程模型引入Julia语言生态。此举旨在降低高性能GPU内核开发门槛,通过数据块抽象简化底层线程与内存管理,并保持与Python版本在语法和性能上的高度一致性。
思科定义Agentic AI时代安全架构,扩展AI Defense与SASE能力
思科宣布其AI Defense解决方案的重大更新,新增AI供应链治理和运行时保护功能,以降低Agentic AI被篡改或操纵的风险。同时,思科SASE引入AI流量检测与优化能力,旨在保障Agentic工作流的安全性和可靠性。这些更新反映了思科在AI安全与网络架构融合方向上的战略布局。
NVIDIA 通过 NVFP4 量化与 TeaCache 技术将 FLUX.2 图像生成模型推理速度提升 10 倍
NVIDIA 与 Black Forest Labs 合作,针对 FLUX.2 [dev] 图像生成模型,在 Blackwell 数据中心 GPU 上应用了包括 NVFP4 4-bit 量化、Timestep Embedding Aware Caching (TeaCache)、CUDA Graphs 及多 GPU 支持在内的一系列推理优化技术。这些优化使模型在双 B200 GPU 配置下相比 H200 实现了 10.2 倍的延迟降低,并将内存占用减少超 40%,显著降低了高质量图像生成模型的部署门槛。
NVIDIA发布AI商品目录蓝图,整合多模态模型与NIM部署
NVIDIA发布技术蓝图,演示如何组合其Nemotron LLM/VLM、FLUX图像生成与TRELLIS 3D模型,构建端到端的自动化商品目录增强系统。该系统通过模块化API和容器化部署,旨在将稀疏产品数据转化为本地化的富媒体内容。
英伟达发布IT工单分析AI智能体架构,强调图数据库与LLM结合
英伟达IT团队公开其内部AI智能体‘ITelligence’的架构细节,该系统结合NVIDIA Nemotron开源模型与图数据库,将非结构化工单数据转化为结构化洞察。其核心是批处理ETL、LLM驱动的根因分析、以及基于Grafana的可视化仪表板,而非RAG聊天机器人。
Google Cloud 通过客户案例集展示 Agentic Data Cloud 与 AlloyDB 的架构牵引力
Google Cloud 发布5月客户案例集,重点展示了其 Agentic Data Cloud 和 AlloyDB for PostgreSQL 在支撑企业级应用现代化与AI工作负载中的核心作用。案例覆盖从供应链数字孪生、实时数据平台到机器人AI训练等多个场景,揭示了Google正通过统一的数据与AI平台架构,系统性引导企业客户的技术栈迁移。
Google Cloud推出MCP与Apigee集成及Agentic Platform,推动企业API向AI Agent化演进
Google Cloud宣布Apigee Model Context Protocol (MCP)正式可用,并推出Agentic Platform,旨在将传统企业API转化为可被AI Agent安全、规模化调用的工具。此举结合了API治理、安全层与AI推理基础设施,为企业从API驱动转向Agent驱动架构提供了核心平台能力。