情报
AI 生成的结构化厂商动态简报
英伟达发布Vera Rubin平台,通过软硬件协同设计解决智能体AI规模化难题
英伟达发布Vera Rubin平台,通过Vera Rubin NVL72 GPU与Groq 3 LPX LPU的异构协同,结合Dynamo编排器,旨在解决智能体AI推理在长上下文、万亿参数MoE模型下的规模化、低延迟与高吞吐挑战。
思科推动服务商将边缘基础设施转型为AI服务平台
思科通过其博客阐述了服务提供商在AI需求驱动下面临的边缘计算新机遇,即利用其大规模分布式网络基础设施,提供包含AI推理、本地数据处理在内的企业服务。思科统一边缘平台旨在解决跨数千个站点的规模化、自动化部署与管理挑战。
NVIDIA通过cuPyNumeric与GDS加速科学计算工作流
NVIDIA展示了其XANI工作流,利用cuPyNumeric分布式计算库与GPUDirect Storage,将量子材料X射线分析的计算时间从9个月缩短至4小时。这标志着GPU加速正从训练/推理向科学计算与实时数据处理的端到端工作流渗透。
英伟达发布AI模型部署最佳实践,强调TensorRT与Dynamo-Triton集成
英伟达通过官方博客详细阐述了消除AI模型服务“流水线摩擦”的系统性方法,核心是推广其TensorRT优化工具与Dynamo-Triton服务平台的深度集成,旨在将模型从训练到部署的流程标准化和高效化。
微软与SAP深化AI融合,推出“微软IQ”智能层与跨系统Agent协作
微软与SAP宣布深化合作,推出“微软IQ”作为企业级AI共享智能层,并实现微软Copilot与SAP Joule之间的Agent-to-Agent集成。此举旨在将AI深度嵌入核心业务流程,并构建统一的数据基础,标志着企业AI正从应用层向核心运营架构层迁移。
Cloudflare将Browser Run迁移至容器平台,提升AI Agent网络交互能力
Cloudflare将其Browser Run服务从共享的Browser Isolation基础设施迁移至自有的Cloudflare Containers平台,实现了性能提升和规模扩展。此举旨在优化AI Agent与网络交互的体验,并展示了其内部产品作为“客户零号”驱动平台演进的战略。
AMD发布Spartan UltraScale+ FPGA,强调成本优化与供应链稳定
AMD推出Spartan UltraScale+系列FPGA,定位成本优化市场,通过与英特尔Agilex 3对比,强调其在性能功耗比、封装尺寸及长期供应保障上的优势。该产品旨在满足工业、机器视觉等边缘应用需求。
HPE整合私有云与数据平台,强化AI数据就绪能力
HPE宣布其GreenLake平台的多项更新,旨在通过统一的私有云、存储和数据保护方案,帮助企业现代化基础设施并加速AI数据就绪。核心动作包括整合Kubernetes管理、统一文件与对象存储,并引入跨存储与数据保护产品的智能代理能力。
Google Cloud G4 VM助力Imgix实现实时图像处理性能跃升
Google Cloud通过其G4 VM实例,为Imgix的图像处理平台提供了基于NVIDIA Blackwell GPU的AI Hypercomputer基础设施。该迁移使Imgix的中位处理延迟降低50%,单节点吞吐量提升6倍,且无需修改核心应用代码,展示了云上AI推理基础设施对实时媒体处理工作负载的变革性影响。
思科将AI安全分类体系全面转向AI驱动的“宪法”定义模型
思科宣布其AI安全产品组合将全面采用基于详细自然语言“宪法”定义的单源真相模型,利用LLM替代人工标注者进行一致性分类与评估,并计划将此模型扩展至AI供应链安全等领域。
AMD联合清华开源项目,展示AI教育多智能体架构的端云协同部署
AMD与清华大学OpenMAIC团队合作,将多智能体交互式AI课堂框架部署在其ROCm软件栈上。该方案利用Instinct GPU进行云端课程内容生成,通过Ryzen AI PC和Lemonade本地服务器处理实时、低延迟的课堂交互,实现基于统一软件栈的端云协同架构。
微软Copilot Studio更新:强化AI Agent治理与智能工作流
微软在Copilot Studio中推出多项更新,重点强化AI Agent的集中治理、成本可见性及智能工作流能力。通过Agent 365控制平面、工作流内嵌Agent节点及业务应用集成,旨在将孤立的自动化转变为可信、可扩展的智能系统。
谷歌公共部门阐述AI代理时代基础设施、数据与安全架构
谷歌公共部门提出,从AI试点迈向组织级AI代理转型,需要构建具备弹性、可扩展和安全的基础设施。其架构围绕AI超算、代理数据云和代理防御三大支柱,强调高性能硬件、AI原生数据架构及整合Wiz的云与AI安全平台。
AMD EPYC CPU获AWS RDS for SQL Server支持,提升云数据库性价比
AWS宣布在Amazon RDS for SQL Server中引入基于第五代AMD EPYC处理器的实例选项。此举为关键数据库工作负载提供了新的高性价比计算选择,并可能改变云上关系型数据库服务的成本与性能基准。
思科提出临床数据编织架构,将网络定位为AI代理时代核心基础设施
思科在医疗行业AI应用讨论中,提出“临床数据编织”概念,强调网络正从IT工具演变为支持自主AI代理决策的关键基础设施。核心策略是“将AI带到数据旁”,通过本地化计算和端到端可观测性,确保低延迟与安全,以支撑生产级AI代理的规模化部署。
思科联合AMD发布AI网络性能基准,验证以太网承载大规模AI训练能力
思科与AMD合作,通过发布基于N9000交换机与Pensando Pollara 400 NIC的详细性能基准测试,验证了以太网架构在承载大规模AI训练(如128个GPU集群)时的确定性性能。测试覆盖了多种拓扑和极端拥塞场景,旨在将网络从瓶颈转变为高性能AI基础设施的核心引擎。
AMD提出Agentic AI驱动数据中心CPU与GPU架构分离
AMD高级副总裁Dan McNamara在官方博客中指出,Agentic AI(智能体AI)正从根本上改变数据中心基础设施架构。它不再仅是增加GPU服务器中的CPU数量,而是需要构建一个独立的、专门用于编排与工具执行的CPU计算层,与GPU密集计算层形成分布式系统。
微软通过Hackathon模式将AI洞察转化为垂直行业SaaS解决方案
微软车库项目RushReady展示了其通过与Ecolab合作,利用餐厅运营数据和AI模型为快餐店经理提供实时决策指导的SaaS产品。该项目证明了微软从内部创新到行业解决方案的商业化路径,并强调了针对特定场景、可自适应学习的数据模型的重要性。
AMD与OpenAI将MRC网络协议贡献给OCP,推进AI网络规模化
AMD与OpenAI、微软等合作,将专为大规模AI训练设计的网络协议MRC(多路径可靠连接)贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者,其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证,旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。
英伟达通过OCP开放MRC协议,推动AI以太网架构标准化
英伟达宣布将其在Spectrum-X以太网硬件上验证的MRC(多路径可靠连接)RDMA传输协议通过开放计算项目(OCP)开放。该协议旨在通过多路径负载均衡和硬件级故障绕过,提升大规模AI训练集群的网络吞吐量、弹性和GPU利用率。