情报
AI 生成的结构化厂商动态简报
谷歌通过Agent Platform展示AI原生应用架构范式
谷歌云客户案例展示了基于Gemini Enterprise Agent Platform构建的“流式意识转任务”应用。该架构利用原生音频流、主动工具调用和会话恢复等API,实现了从语音到结构化任务的无缝、低延迟转换,并设计了面向未来语音功能的提供商无关抽象层。
AMD联合OpenAI发布下一代AI训练网络传输协议MRC
AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection(MRC)协议规范,旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制,提升网络带宽利用率和训练任务弹性。
NVIDIA推出车载AI Box架构,将高级LLM推理作为独立ECU模块
NVIDIA发布车载AI Box架构,基于DRIVE AGX平台提供模块化AI计算单元,可将高级LLM/VLM推理能力作为独立ECU添加至现有座舱系统。该方案旨在解决车载AI对实时性、隐私和算力的严苛要求,并支持与云端AI的混合编排。
谷歌通过线下工作坊推动企业AI Agent基础设施实践
谷歌在北美启动针对平台/安全工程师和数据从业者的系列线下工作坊,聚焦于在GKE和BigQuery上安全构建、部署和治理AI Agent。工作坊强调动手实践,涵盖硬件隔离、自然语言集群运维和知识图谱驱动Agent等具体技术栈。
AMD联合戴尔展示企业AI异构计算战略
AMD在戴尔技术世界大会上强调其异构计算产品组合,旨在为不同企业AI负载匹配合适的算力,并突出硬件安全与可管理性。此举标志着AI基础设施正从通用方案转向针对具体场景的精细化部署。
英伟达通过NemoClaw与OpenClaw合作,推动企业级自主AI代理安全部署
英伟达通过NemoClaw参考实现,整合OpenShell安全运行时与Nemotron开源模型,为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战,将AI基础设施控制点向本地、安全、可审计的架构迁移。
Cloudflare发布动态工作流,将无服务器架构延伸至多租户AI代理
Cloudflare推出Dynamic Workflows,将动态部署能力引入其持久化执行引擎Workflows。该技术允许平台方(如SaaS、CI/CD、AI代理平台)在运行时动态加载并执行不同租户的代码,实现了计算、存储、持久化执行的全栈动态化。
思科发布液冷网络交换机,将液冷架构扩展至AI基础设施核心
思科正式发布采用直接芯片液冷设计的N9000与8000系统,将液冷技术从GPU服务器扩展至网络交换机。该产品将带宽密度提升一倍,能耗降低近70%,旨在解决AI集群高功率密度带来的散热挑战。此举标志着数据中心冷却架构正从部件级优化转向系统性重构。
AMD提出AI基础设施网络架构新范式:从无损网络转向智能端点
AMD发布博客,提出构建大规模AI基础设施的七个关键问题,核心观点是传统无损以太网或InfiniBand架构存在成本与复杂性瓶颈。其主张将网络智能和可靠性功能从昂贵的专用交换机转移到智能网卡(NIC)上,在标准(可能有损)以太网上实现可靠传输,以降低总拥有成本并简化运营。
英伟达发布企业级AI工厂参考架构,推动本地AI基础设施标准化
英伟达发布企业级AI工厂参考架构,为本地部署提供从RTX PRO到NVL72的三种标准化配置。该架构整合了计算、网络、存储及软件,旨在将AI基础设施从实验性部署转变为可预测、可扩展的工业化运营平台。
Cloudflare与Stripe合作推出AI代理自动部署协议
Cloudflare与Stripe合作推出新协议,使AI代理能自动为用户创建Cloudflare账户、购买域名并部署应用。该协议标准化了服务发现、授权和支付流程,旨在将AI代理作为云服务的一等公民,并计划向更多平台开放。
AMD与Liquid AI探讨从芯片到系统的高效AI架构
AMD CTO与Liquid AI CEO探讨AI架构演进,强调效率是AI从云端向边缘和终端设备扩展的关键。双方认为,通过从芯片到系统的协同设计,可实现低功耗、高响应性的AI推理,支持持续运行的智能体与多模型协同。
思科通过Vision Portal将AI与网络融合,强化物理安全事件响应
思科在其Meraki Vision门户中推出新软件功能,利用AI和跨摄像头追踪技术,将智能摄像头深度集成到企业网络管理平面。此举旨在通过统一的云管理界面,将物理安全事件响应从被动监控转变为主动、快速的调查。
Arm发布Performix性能分析工具包,瞄准AI Agent时代优化
Arm发布免费性能分析工具包Performix,旨在为AI Agent开发提供跨Arm平台的统一性能洞察与优化。该工具通过Arm MCP Server集成至主流AI开发环境,将硬件运行时数据转化为可操作的优化建议,并已获得微软、MongoDB等生态伙伴支持。
微软发布Azure Local大规模扩展,支持主权私有云部署数千节点
微软宣布Azure Local平台现可支持在单一主权边界内部署数千台服务器,为大规模主权私有云提供基础设施。该平台支持在连接、间歇连接或完全断开的环境下运行,并集成了英特尔Xeon 6处理器等硬件,旨在满足国家基础设施、受监管工作负载和本地AI推理对规模、控制与合规性的综合需求。
AMD将边缘AI架构扩展至太空,定义轨道计算新范式
AMD CTO提出将地面边缘AI的“性能功耗比”与“任务关键可靠性”核心原则,应用于太空计算场景。公司正通过异构计算、开放软件栈和模块化系统设计,为从卫星在轨智能到未来轨道数据中心提供可重复构建的平台基础。
AMD发布IDC白皮书,强调AI PC是企业部署Agentic AI的关键基础设施
AMD发布IDC白皮书,指出超过80%的企业正在规划、试点或部署AI PC,以支持Agentic AI的规模化应用。报告强调,高性能NPU和端侧AI处理对于实现实时、安全的工作流至关重要,标志着企业AI基础设施正从云端向端侧扩展。
思科通过产品冲刺优化开发者门户,聚焦AI代理工作流数据
思科DevNet团队分享了其通过产品冲刺方法优化开发者门户和内容的具体实践,核心是建立可衡量的产品-市场匹配指标。值得注意的是,其新增的分析事件专门追踪开发者内容如何被AI编码助手或代理使用,例如复制Markdown、下载OpenAPI/SDK/MCP文档等行为。
NVIDIA 集成 Blackwell MIG 与 vGPU 20,重塑企业虚拟化数据中心 GPU 控制层
NVIDIA 发布技术指南,展示如何将 RTX PRO 4500 Blackwell Server Edition GPU 的 Multi-Instance GPU (MIG) 硬件分区能力与 vGPU 20 软件栈深度集成于 VMware vSphere 环境。该组合使单物理 GPU 可被安全划分为多个具备 QoS 保证的虚拟 GPU 实例,旨在高效加速从知识工作到轻量级 AI 开发的混合企业负载。
思科AI安全扩展至谷歌云,构建多云AI运行时防护
思科将其AI Defense安全平台扩展至谷歌云,提供针对AI模型、代理工作流和RAG管道的运行时防护。此举使其完成了对AWS、Azure、谷歌三大公有云的覆盖,旨在为企业提供统一的多云AI安全框架。