Reports
AI-generated structured vendor updates
思科联合AMD发布AI网络性能基准,验证以太网承载大规模AI训练能力
思科与AMD合作,通过发布基于N9000交换机与Pensando Pollara 400 NIC的详细性能基准测试,验证了以太网架构在承载大规模AI训练(如128个GPU集群)时的确定性性能。测试覆盖了多种拓扑和极端拥塞场景,旨在将网络从瓶颈转变为高性能AI基础设施的核心引擎。
AMD提出Agentic AI驱动数据中心CPU与GPU架构分离
AMD高级副总裁Dan McNamara在官方博客中指出,Agentic AI(智能体AI)正从根本上改变数据中心基础设施架构。它不再仅是增加GPU服务器中的CPU数量,而是需要构建一个独立的、专门用于编排与工具执行的CPU计算层,与GPU密集计算层形成分布式系统。
AMD支持SPEC CPU 2026基准测试,强调开放可信性能评估
AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试,强调在AI时代,开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件,并加强了对裸金属云环境和并行计算的支持。
Cloudflare利用eBPF-LSM实现零日漏洞运行时缓解
Cloudflare披露其应对Linux内核“Copy Fail”零日漏洞的响应流程。核心在于,其未依赖传统补丁,而是通过eBPF-LSM安全模块实施细粒度运行时阻断,同时利用eBPF进行全栈行为检测与依赖关系测绘,实现了无服务中断的快速缓解。
AWS发布托管MCP服务器,为AI代理提供安全AWS API接入
AWS宣布其托管Model Context Protocol(MCP)服务器正式可用,为Claude Code、Kiro等AI编码代理提供经过认证的、安全的AWS服务访问。该服务器通过固定工具集调用AWS API、检索实时文档,并引入沙箱脚本执行和技能指导,旨在解决AI代理使用过时信息、生成不安全IAM策略等生产环境难题。
HPE发布全自主网络能力,宣称实现无需人工干预的实时问题检测与修复
HPE宣布推出新的“自驾驶网络”能力,通过微服务、自主代理和高级代理网格架构,实现网络问题的实时检测、诊断和修复,无需人工干预。该能力集成于HPE Mist和Aruba Central平台,标志着从洞察驱动运营向真正自主运营的转变。
谷歌发布Gemma 4开源模型,推动AI代理本地化部署
谷歌发布Gemma 4开源模型系列,采用Apache 2.0许可,并首次引入MoE架构,旨在将高性能AI代理能力直接部署于移动设备和边缘硬件。此举显著降低了复杂AI工作流对云端集群的依赖,为本地化、私有化AI应用开辟新路径。
思科研究揭示VLM双重失效模式,暴露AI安全表征层脆弱性
思科AI安全团队研究发现,通过对图像进行微小、有界的像素扰动,可绕过视觉语言模型的安全对齐,揭示出‘可读性恢复’与‘拒绝抑制’两种共存的失效模式。这表明攻击可在不依赖目标模型内部信息的情况下,利用多模态嵌入距离作为攻击指标,暴露了当前基于像素域或OCR过滤的防御机制的局限性。
AMD与OpenAI将MRC网络协议贡献给OCP,推进AI网络规模化
AMD与OpenAI、微软等合作,将专为大规模AI训练设计的网络协议MRC(多路径可靠连接)贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者,其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证,旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。
谷歌通过Agent Platform展示AI原生应用架构范式
谷歌云客户案例展示了基于Gemini Enterprise Agent Platform构建的“流式意识转任务”应用。该架构利用原生音频流、主动工具调用和会话恢复等API,实现了从语音到结构化任务的无缝、低延迟转换,并设计了面向未来语音功能的提供商无关抽象层。
AMD联合OpenAI发布下一代AI训练网络传输协议MRC
AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection(MRC)协议规范,旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制,提升网络带宽利用率和训练任务弹性。
NVIDIA推出车载AI Box架构,将高级LLM推理作为独立ECU模块
NVIDIA发布车载AI Box架构,基于DRIVE AGX平台提供模块化AI计算单元,可将高级LLM/VLM推理能力作为独立ECU添加至现有座舱系统。该方案旨在解决车载AI对实时性、隐私和算力的严苛要求,并支持与云端AI的混合编排。
谷歌通过线下工作坊推动企业AI Agent基础设施实践
谷歌在北美启动针对平台/安全工程师和数据从业者的系列线下工作坊,聚焦于在GKE和BigQuery上安全构建、部署和治理AI Agent。工作坊强调动手实践,涵盖硬件隔离、自然语言集群运维和知识图谱驱动Agent等具体技术栈。
AMD联合戴尔展示企业AI异构计算战略
AMD在戴尔技术世界大会上强调其异构计算产品组合,旨在为不同企业AI负载匹配合适的算力,并突出硬件安全与可管理性。此举标志着AI基础设施正从通用方案转向针对具体场景的精细化部署。
英伟达通过NemoClaw与OpenClaw合作,推动企业级自主AI代理安全部署
英伟达通过NemoClaw参考实现,整合OpenShell安全运行时与Nemotron开源模型,为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战,将AI基础设施控制点向本地、安全、可审计的架构迁移。
Cloudflare发布动态工作流,将无服务器架构延伸至多租户AI代理
Cloudflare推出Dynamic Workflows,将动态部署能力引入其持久化执行引擎Workflows。该技术允许平台方(如SaaS、CI/CD、AI代理平台)在运行时动态加载并执行不同租户的代码,实现了计算、存储、持久化执行的全栈动态化。
思科发布液冷网络交换机,将液冷架构扩展至AI基础设施核心
思科正式发布采用直接芯片液冷设计的N9000与8000系统,将液冷技术从GPU服务器扩展至网络交换机。该产品将带宽密度提升一倍,能耗降低近70%,旨在解决AI集群高功率密度带来的散热挑战。此举标志着数据中心冷却架构正从部件级优化转向系统性重构。
AMD提出AI基础设施网络架构新范式:从无损网络转向智能端点
AMD发布博客,提出构建大规模AI基础设施的七个关键问题,核心观点是传统无损以太网或InfiniBand架构存在成本与复杂性瓶颈。其主张将网络智能和可靠性功能从昂贵的专用交换机转移到智能网卡(NIC)上,在标准(可能有损)以太网上实现可靠传输,以降低总拥有成本并简化运营。
英伟达发布企业级AI工厂参考架构,推动本地AI基础设施标准化
英伟达发布企业级AI工厂参考架构,为本地部署提供从RTX PRO到NVL72的三种标准化配置。该架构整合了计算、网络、存储及软件,旨在将AI基础设施从实验性部署转变为可预测、可扩展的工业化运营平台。
Cloudflare与Stripe合作推出AI代理自动部署协议
Cloudflare与Stripe合作推出新协议,使AI代理能自动为用户创建Cloudflare账户、购买域名并部署应用。该协议标准化了服务发现、授权和支付流程,旨在将AI代理作为云服务的一等公民,并计划向更多平台开放。