情报
AI 生成的结构化厂商动态简报
Cloudflare将Browser Run迁移至容器平台,提升AI Agent网络交互能力
Cloudflare将其Browser Run服务从共享的Browser Isolation基础设施迁移至自有的Cloudflare Containers平台,实现了性能提升和规模扩展。此举旨在优化AI Agent与网络交互的体验,并展示了其内部产品作为“客户零号”驱动平台演进的战略。
思科与红帽深化AI基础设施集成,推动核心到边缘的智能平台
思科在红帽峰会上展示其与红帽生态的深度集成,涵盖AI POD、统一边缘、网络即代码及安全AI工厂。通过将Ansible、Splunk、Isovalent eBPF能力嵌入OpenShift平台,旨在为企业提供从核心到边缘的、可编程且安全的AI基础设施统一控制平面。
AMD发布Spartan UltraScale+ FPGA,强调成本优化与供应链稳定
AMD推出Spartan UltraScale+系列FPGA,定位成本优化市场,通过与英特尔Agilex 3对比,强调其在性能功耗比、封装尺寸及长期供应保障上的优势。该产品旨在满足工业、机器视觉等边缘应用需求。
HPE整合私有云与数据平台,强化AI数据就绪能力
HPE宣布其GreenLake平台的多项更新,旨在通过统一的私有云、存储和数据保护方案,帮助企业现代化基础设施并加速AI数据就绪。核心动作包括整合Kubernetes管理、统一文件与对象存储,并引入跨存储与数据保护产品的智能代理能力。
NVIDIA与SAP合作,将OpenShell嵌入企业AI平台,为AI Agent提供运行时安全层。
NVIDIA与SAP宣布深化合作,将NVIDIA开源的AI Agent运行时安全框架OpenShell嵌入SAP Business AI Platform,作为所有AI Agent的安全执行层。此举旨在通过基础设施级隔离、策略执行和审计追踪,解决企业部署自主AI Agent时的信任与治理难题。
思科开源Foundry安全规范,定义AI代理安全评估系统架构
思科开源了Foundry Security Spec,这是一个用于构建AI代理安全评估系统的开放规范。它定义了8个核心代理角色、130项功能需求及11项不可违背原则,旨在将前沿LLM从演示工具转变为可审计、可验证的生产级安全评估系统。该规范与CodeGuard项目结合,形成从检测到预防的闭环。
Google Cloud G4 VM助力Imgix实现实时图像处理性能跃升
Google Cloud通过其G4 VM实例,为Imgix的图像处理平台提供了基于NVIDIA Blackwell GPU的AI Hypercomputer基础设施。该迁移使Imgix的中位处理延迟降低50%,单节点吞吐量提升6倍,且无需修改核心应用代码,展示了云上AI推理基础设施对实时媒体处理工作负载的变革性影响。
英伟达发布Fleet Intelligence,强化GPU集群监控与完整性验证
英伟达正式发布Fleet Intelligence托管服务,通过轻量级代理提供GPU集群的实时遥测、健康监控与完整性验证。该服务旨在提升大规模、异构GPU基础设施的运营可见性与投资回报率,并集成了基于硬件信任根的远程证明技术。
微软与红帽深化Azure OpenShift集成,推动企业AI生产化与平台现代化
微软与红帽在红帽峰会上展示了Azure Red Hat OpenShift (ARO)如何作为企业AI生产化的统一平台。通过整合Azure的身份、安全和治理服务,ARO帮助大型机构(如巴西布拉德斯科银行)将超过200个AI试点项目转化为生产系统,并满足严格的监管要求。
AMD联合清华开源项目,展示AI教育多智能体架构的端云协同部署
AMD与清华大学OpenMAIC团队合作,将多智能体交互式AI课堂框架部署在其ROCm软件栈上。该方案利用Instinct GPU进行云端课程内容生成,通过Ryzen AI PC和Lemonade本地服务器处理实时、低延迟的课堂交互,实现基于统一软件栈的端云协同架构。
AMD定义AI网络概念并推出专用AI NIC
AMD发布博客,系统性地定义了“AI网络”概念,强调其为满足分布式AI工作负载同步需求而构建的专用网络解决方案。核心是推出Pensando Pollara 400 AI NIC,通过智能流量控制、低延迟数据移动和可编程结构服务,优化GPU集群间通信。此举旨在将网络提升为与计算同等关键的基础设施层。
微软与BNY展示AI驱动企业组织架构重塑
微软与BNY合作案例揭示了大型金融机构如何通过‘数字员工’与AI平台重构工作流程与组织形态。BNY建立了覆盖从治理、培训到运营的完整AI体系,其‘钻石型’组织模型预示着AI正从工具演变为核心生产力架构。
Fortinet深化与NVIDIA集成,瞄准企业AI基础设施安全
Fortinet宣布深化与NVIDIA的集成,旨在为大规模企业AI基础设施提供独特的安全能力。此举将Fortinet的安全平台与NVIDIA的AI计算堆栈更紧密地结合,标志着安全厂商正将防护边界从传统网络扩展至AI推理和训练基础设施层。
谷歌公共部门阐述AI代理时代基础设施、数据与安全架构
谷歌公共部门提出,从AI试点迈向组织级AI代理转型,需要构建具备弹性、可扩展和安全的基础设施。其架构围绕AI超算、代理数据云和代理防御三大支柱,强调高性能硬件、AI原生数据架构及整合Wiz的云与AI安全平台。
Google揭示AI驱动攻击产业化:从漏洞发现到自主执行
Google威胁情报团队报告,攻击者正将生成式AI大规模应用于对抗性工作流,首次确认AI辅助开发的零日漏洞利用,并观察到AI用于增强恶意软件混淆、自主攻击编排及供应链攻击。这标志着AI在攻击生命周期中的角色从实验性工具转变为工业化引擎。
思科强调边缘AI与零信任网络架构为关键任务基础设施核心
思科在SOF Week活动中,将其网络与安全整合战略聚焦于严苛的战术边缘环境,强调零信任身份网络、边缘AI计算和量子安全通信是支撑未来关键任务系统的基石。
AMD EPYC CPU获AWS RDS for SQL Server支持,提升云数据库性价比
AWS宣布在Amazon RDS for SQL Server中引入基于第五代AMD EPYC处理器的实例选项。此举为关键数据库工作负载提供了新的高性价比计算选择,并可能改变云上关系型数据库服务的成本与性能基准。
谷歌发布Gemini CLI DevOps扩展,意图通过AI代理控制云部署流程
谷歌推出Gemini CLI DevOps扩展,允许开发者使用自然语言指令,通过AI代理(支持Gemini CLI、Claude Code、Antigravity)直接完成从代码分析、安全检查到部署至Google Cloud的全过程。该工具旨在弥合本地开发与生产部署之间的效率鸿沟。
NVIDIA联合Slurm优化GB200 NVL72集群调度,应对机架级AI算力挑战
NVIDIA与Slurm社区合作,针对GB200 NVL72机架级GPU集群引入新的拓扑/块调度插件。该方案将NVLink域视为硬调度边界,通过`--segment`等参数精细控制作业放置,以应对跨域性能骤降问题,标志着AI基础设施调度从网络优化转向算力域感知。
NVIDIA与美能源部深化AI科学合作,推动Genesis使命
NVIDIA与美能源部在SCSP AI+ Expo上共同阐述Genesis使命,旨在将AI应用于科学发现。双方正合作在阿贡国家实验室建设两台AI超算,并利用AI模型加速能源、材料及电网研究。