情报
AI 生成的结构化厂商动态简报
英伟达通过Hermes与Qwen 3.6推动本地AI Agent基础设施
英伟达联合Nous Research推广开源AI Agent框架Hermes,并适配阿里通义千问Qwen 3.6模型,旨在构建一个以RTX PC和DGX Spark为核心的、可靠的本地AI Agent运行环境。此举将高性能AI Agent的部署边界从云端扩展至企业边缘和个人设备。
英伟达发布AI模型部署最佳实践,强调TensorRT与Dynamo-Triton集成
英伟达通过官方博客详细阐述了消除AI模型服务“流水线摩擦”的系统性方法,核心是推广其TensorRT优化工具与Dynamo-Triton服务平台的深度集成,旨在将模型从训练到部署的流程标准化和高效化。
AWS发布基于Graviton的Redshift RG实例,集成数据湖查询引擎
AWS推出由自研Graviton处理器驱动的Amazon Redshift RG实例系列,性能较前代提升最高2.4倍,成本降低30%。新实例集成了数据湖查询引擎,统一了数据仓库与S3数据湖的查询处理,并取消了Spectrum扫描费用。
Cloudflare将Browser Run迁移至容器平台,提升AI Agent网络交互能力
Cloudflare将其Browser Run服务从共享的Browser Isolation基础设施迁移至自有的Cloudflare Containers平台,实现了性能提升和规模扩展。此举旨在优化AI Agent与网络交互的体验,并展示了其内部产品作为“客户零号”驱动平台演进的战略。
思科与红帽深化AI基础设施集成,推动核心到边缘的智能平台
思科在红帽峰会上展示其与红帽生态的深度集成,涵盖AI POD、统一边缘、网络即代码及安全AI工厂。通过将Ansible、Splunk、Isovalent eBPF能力嵌入OpenShift平台,旨在为企业提供从核心到边缘的、可编程且安全的AI基础设施统一控制平面。
AMD发布Spartan UltraScale+ FPGA,强调成本优化与供应链稳定
AMD推出Spartan UltraScale+系列FPGA,定位成本优化市场,通过与英特尔Agilex 3对比,强调其在性能功耗比、封装尺寸及长期供应保障上的优势。该产品旨在满足工业、机器视觉等边缘应用需求。
HPE整合私有云与数据平台,强化AI数据就绪能力
HPE宣布其GreenLake平台的多项更新,旨在通过统一的私有云、存储和数据保护方案,帮助企业现代化基础设施并加速AI数据就绪。核心动作包括整合Kubernetes管理、统一文件与对象存储,并引入跨存储与数据保护产品的智能代理能力。
Google Cloud G4 VM助力Imgix实现实时图像处理性能跃升
Google Cloud通过其G4 VM实例,为Imgix的图像处理平台提供了基于NVIDIA Blackwell GPU的AI Hypercomputer基础设施。该迁移使Imgix的中位处理延迟降低50%,单节点吞吐量提升6倍,且无需修改核心应用代码,展示了云上AI推理基础设施对实时媒体处理工作负载的变革性影响。
英伟达发布Fleet Intelligence,强化GPU集群监控与完整性验证
英伟达正式发布Fleet Intelligence托管服务,通过轻量级代理提供GPU集群的实时遥测、健康监控与完整性验证。该服务旨在提升大规模、异构GPU基础设施的运营可见性与投资回报率,并集成了基于硬件信任根的远程证明技术。
AMD联合清华开源项目,展示AI教育多智能体架构的端云协同部署
AMD与清华大学OpenMAIC团队合作,将多智能体交互式AI课堂框架部署在其ROCm软件栈上。该方案利用Instinct GPU进行云端课程内容生成,通过Ryzen AI PC和Lemonade本地服务器处理实时、低延迟的课堂交互,实现基于统一软件栈的端云协同架构。
AMD定义AI网络概念并推出专用AI NIC
AMD发布博客,系统性地定义了“AI网络”概念,强调其为满足分布式AI工作负载同步需求而构建的专用网络解决方案。核心是推出Pensando Pollara 400 AI NIC,通过智能流量控制、低延迟数据移动和可编程结构服务,优化GPU集群间通信。此举旨在将网络提升为与计算同等关键的基础设施层。
AWS发布AgentCore支付与Agent Toolkit,推进AI代理自主运营
AWS推出AgentCore支付功能预览,使AI代理能自主调用并支付API、MCP服务器等服务。同时发布Agent Toolkit for AWS,为AI编码代理提供生产级工具套件和安全控制,并正式推出AWS MCP Server。
Cloudflare修复QUIC协议CUBIC拥塞控制算法死循环漏洞
Cloudflare发现并修复了其开源QUIC实现quiche中一个关键漏洞,该漏洞源于Linux内核CUBIC拥塞控制算法的优化移植缺陷,导致在特定高丢包场景下连接带宽永久锁定在最低值。
谷歌公共部门阐述AI代理时代基础设施、数据与安全架构
谷歌公共部门提出,从AI试点迈向组织级AI代理转型,需要构建具备弹性、可扩展和安全的基础设施。其架构围绕AI超算、代理数据云和代理防御三大支柱,强调高性能硬件、AI原生数据架构及整合Wiz的云与AI安全平台。
Google揭示AI驱动攻击产业化:从漏洞发现到自主执行
Google威胁情报团队报告,攻击者正将生成式AI大规模应用于对抗性工作流,首次确认AI辅助开发的零日漏洞利用,并观察到AI用于增强恶意软件混淆、自主攻击编排及供应链攻击。这标志着AI在攻击生命周期中的角色从实验性工具转变为工业化引擎。
思科强调边缘AI与零信任网络架构为关键任务基础设施核心
思科在SOF Week活动中,将其网络与安全整合战略聚焦于严苛的战术边缘环境,强调零信任身份网络、边缘AI计算和量子安全通信是支撑未来关键任务系统的基石。
AMD EPYC CPU获AWS RDS for SQL Server支持,提升云数据库性价比
AWS宣布在Amazon RDS for SQL Server中引入基于第五代AMD EPYC处理器的实例选项。此举为关键数据库工作负载提供了新的高性价比计算选择,并可能改变云上关系型数据库服务的成本与性能基准。
NVIDIA联合Slurm优化GB200 NVL72集群调度,应对机架级AI算力挑战
NVIDIA与Slurm社区合作,针对GB200 NVL72机架级GPU集群引入新的拓扑/块调度插件。该方案将NVLink域视为硬调度边界,通过`--segment`等参数精细控制作业放置,以应对跨域性能骤降问题,标志着AI基础设施调度从网络优化转向算力域感知。
NVIDIA与美能源部深化AI科学合作,推动Genesis使命
NVIDIA与美能源部在SCSP AI+ Expo上共同阐述Genesis使命,旨在将AI应用于科学发现。双方正合作在阿贡国家实验室建设两台AI超算,并利用AI模型加速能源、材料及电网研究。
NVIDIA为NCCL引入Prometheus实时监控,强化AI训练可观测性
NVIDIA在NCCL 2.30中推出Prometheus模式,将GPU间通信性能指标转化为时间序列数据。这使AI训练团队能够通过Grafana仪表板实时监控和调试分布式训练性能问题,尤其是网络与NVLink混合通信场景下的瓶颈。