情报
AI 生成的结构化厂商动态简报
Cloudflare发布动态工作流,将无服务器架构延伸至多租户AI代理
Cloudflare推出Dynamic Workflows,将动态部署能力引入其持久化执行引擎Workflows。该技术允许平台方(如SaaS、CI/CD、AI代理平台)在运行时动态加载并执行不同租户的代码,实现了计算、存储、持久化执行的全栈动态化。
NVIDIA通过AI Agent技能库实现GPU内核跨语言自动化迁移
NVIDIA发布TileGym项目,通过构建包含17条关键规则、API映射和验证脚本的AI Agent技能库,实现了cuTile Python GPU内核向Julia(cuTile.jl)的自动化、可重复转换。此举旨在降低高性能计算生态间的迁移成本。
思科发布液冷网络交换机,将液冷架构扩展至AI基础设施核心
思科正式发布采用直接芯片液冷设计的N9000与8000系统,将液冷技术从GPU服务器扩展至网络交换机。该产品将带宽密度提升一倍,能耗降低近70%,旨在解决AI集群高功率密度带来的散热挑战。此举标志着数据中心冷却架构正从部件级优化转向系统性重构。
思科开源AI模型血缘工具包,瞄准AI供应链安全治理层
思科发布开源工具Model Provenance Kit,通过分析模型元数据、分词器及权重信号,生成唯一指纹并比对,以技术手段验证AI模型的血缘关系与完整性,旨在应对模型供应链中存在的篡改、伪造及合规风险。
AMD提出AI基础设施网络架构新范式:从无损网络转向智能端点
AMD发布博客,提出构建大规模AI基础设施的七个关键问题,核心观点是传统无损以太网或InfiniBand架构存在成本与复杂性瓶颈。其主张将网络智能和可靠性功能从昂贵的专用交换机转移到智能网卡(NIC)上,在标准(可能有损)以太网上实现可靠传输,以降低总拥有成本并简化运营。
思科发布量子安全架构,将防御纵深扩展至硬件信任根
思科发布了其量子安全战略的架构细节,提出“安全通信”与“安全产品”两大支柱。其核心在于将后量子密码技术从网络协议层延伸至设备硬件信任链,通过集成信任锚模块和量子安全启动流程,旨在保护平台完整性,而不仅仅是数据在途安全。
英特尔与ChatPPT合作推出混合AI PC版,推动AI工作负载本地化
英特尔与AI应用ChatPPT合作,利用其AI Super Builder技术推出混合AI PC版。该版本将部分AI工作负载(如格式调整)从云端卸载至本地PC处理,降低了50%的云成本并提升了32%的用户使用时长,同时增强了数据隐私。
微软定义“智能体计算时代”,将AI基础设施与智能体平台作为核心战略
微软CEO在财报后明确将“从终端用户驱动的工作负载转向由终端用户和智能体共同驱动的工作负载”视为改变整个技术栈的平台迁移。公司战略聚焦于建设领先的AI基础设施与智能体平台,并已将其AI业务年化收入推升至370亿美元。
英伟达发布企业级AI工厂参考架构,推动本地AI基础设施标准化
英伟达发布企业级AI工厂参考架构,为本地部署提供从RTX PRO到NVL72的三种标准化配置。该架构整合了计算、网络、存储及软件,旨在将AI基础设施从实验性部署转变为可预测、可扩展的工业化运营平台。
Cloudflare推动后量子IPsec标准落地,与思科、飞塔实现互操作
Cloudflare宣布其IPsec服务全面支持基于IETF草案的混合ML-KEM后量子加密,并与思科、飞塔的硬件设备实现互操作。此举旨在应对“先窃取后解密”攻击,并推动IPsec社区从依赖专用硬件的QKD方案,转向基于软件、可大规模互操作的后量子密码学标准。
AMD与Liquid AI探讨从芯片到系统的高效AI架构
AMD CTO与Liquid AI CEO探讨AI架构演进,强调效率是AI从云端向边缘和终端设备扩展的关键。双方认为,通过从芯片到系统的协同设计,可实现低功耗、高响应性的AI推理,支持持续运行的智能体与多模型协同。
英伟达发布Nemotron 3 Nano Omni统一多模态模型,瞄准AI Agent感知层
英伟达发布开源多模态模型Nemotron 3 Nano Omni,采用30B-A3B混合MoE架构,将视觉、音频与语言处理统一于单一模型,旨在作为AI Agent的“眼睛和耳朵”。该模型声称能消除多模型协作的延迟与上下文碎片化问题,在保持交互性的同时实现高达9倍的吞吐量提升,降低AI Agent的部署与推理成本。
谷歌财报揭示企业AI堆栈战略,推动代理与推理基础设施增长
谷歌Q1财报显示其全栈AI战略成效显著,云业务因AI产品需求激增,收入增长63%。关键信号包括:推出Gemini Enterprise Agent Platform,代理数据处理量激增(330个客户年处理超万亿tokens),并计划将TPU硬件直接部署至客户数据中心。
思科借硬件更新周期推动AI就绪数据中心架构
思科通过博客指出,企业AI战略受阻的核心在于数据中心基础设施。其主张将AI就绪性融入常规硬件更新周期,强调通过统一运营、网络内嵌安全、端到端可观测性及高性能网络来构建AI基础设施。
英伟达以OpenUSD和Omniverse为核心,推动制造业进入“仿真优先”时代
英伟达通过SimReady标准、Omniverse物理仿真库及Metropolis蓝图,构建了完整的物理AI技术栈,旨在将制造业传统的“设计-制造-测试”循环转变为基于高保真仿真的“仿真优先”范式。该架构使AI模型训练和系统验证在虚拟环境中完成,大幅缩短产品周期并降低成本。
Arm发布Performix性能分析工具包,瞄准AI Agent时代优化
Arm发布免费性能分析工具包Performix,旨在为AI Agent开发提供跨Arm平台的统一性能洞察与优化。该工具通过Arm MCP Server集成至主流AI开发环境,将硬件运行时数据转化为可操作的优化建议,并已获得微软、MongoDB等生态伙伴支持。
微软发布Azure Local大规模扩展,支持主权私有云部署数千节点
微软宣布Azure Local平台现可支持在单一主权边界内部署数千台服务器,为大规模主权私有云提供基础设施。该平台支持在连接、间歇连接或完全断开的环境下运行,并集成了英特尔Xeon 6处理器等硬件,旨在满足国家基础设施、受监管工作负载和本地AI推理对规模、控制与合规性的综合需求。
AMD将边缘AI架构扩展至太空,定义轨道计算新范式
AMD CTO提出将地面边缘AI的“性能功耗比”与“任务关键可靠性”核心原则,应用于太空计算场景。公司正通过异构计算、开放软件栈和模块化系统设计,为从卫星在轨智能到未来轨道数据中心提供可重复构建的平台基础。
AMD发布IDC白皮书,强调AI PC是企业部署Agentic AI的关键基础设施
AMD发布IDC白皮书,指出超过80%的企业正在规划、试点或部署AI PC,以支持Agentic AI的规模化应用。报告强调,高性能NPU和端侧AI处理对于实现实时、安全的工作流至关重要,标志着企业AI基础设施正从云端向端侧扩展。
Apple与Google达成多年期合作,Gemini将成Siri新大脑
Apple与Google达成多年期合作,Google Cloud成为Apple首选云服务商。Google正为Apple构建1.2万亿参数的定制Gemini模型,是当前Apple云端模型的8倍。Siri将在2026年获得Gemini能力,随iOS 27在秋季发布。隐私架构保持不变——Gemini模型运行在Apple自有服务器,Google不得使用Apple数据训练。设备兼容性限制意味着数亿老款iPhone用户被排除在外。