情报
AI 生成的结构化厂商动态简报
AMD与OpenAI将MRC网络协议贡献给OCP,推进AI网络规模化
AMD与OpenAI、微软等合作,将专为大规模AI训练设计的网络协议MRC(多路径可靠连接)贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者,其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证,旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。
谷歌通过Agent Platform展示AI原生应用架构范式
谷歌云客户案例展示了基于Gemini Enterprise Agent Platform构建的“流式意识转任务”应用。该架构利用原生音频流、主动工具调用和会话恢复等API,实现了从语音到结构化任务的无缝、低延迟转换,并设计了面向未来语音功能的提供商无关抽象层。
AMD联合OpenAI发布下一代AI训练网络传输协议MRC
AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection(MRC)协议规范,旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制,提升网络带宽利用率和训练任务弹性。
Anthropic与SpaceX达成算力协议,大幅提升Claude服务容量
Anthropic宣布与SpaceX达成协议,将使用其Colossus 1数据中心全部算力,获得超过300兆瓦新容量。此举旨在直接提升Claude Pro和Max订阅者的服务能力,并已立即提高Claude Code和API的使用限制。
NVIDIA极端协同设计:用Vera Rubin平台锁定代理AI推理的TCO拐点
NVIDIA发布针对代理系统(Agentic Systems)的极端协同设计架构,包括Vera Rubin NVL72、NVLink 6、ConnectX-9、BlueField-4及Spectrum-X。通过推理解耦、KV缓存管理和低延迟网络,试图解决代理工作负载的高token消耗、长上下文和低延迟矛盾,降低每token成本。
微软与美英政府AI安全机构合作,推动前沿模型评估标准
微软宣布与美国人工智能标准与创新中心及英国人工智能安全研究所达成新协议,将合作测试其前沿模型、评估安全措施,并共同研究对抗性评估、高风险能力评测等AI评估科学。此举旨在通过政府与产业的协作,应对AI带来的国家安全与公共安全风险。
思科发布Nexus Dashboard 4.2,强化AI工作负载的网络监控与安全
思科发布数据中心管理平台Nexus Dashboard 4.2,核心升级包括集成Slurm进行AI/HPC作业监控、通过LLDP与NVIDIA网卡联动实现自适应路由,以及推出基于eBPF的零停机漏洞防护功能Live Protect。该版本旨在为混合云和AI基础设施提供统一、智能且安全的运营平面。
思科推出Galaxy Mode,展示AI Assistant与AgenticOps现有能力
思科在其AI Assistant中推出限时“银河模式”,重点展示了AgenticOps理念下的多项现有及Beta功能,包括图像识别故障排查、低代码工作流创建和深度推理模式,旨在将网络运维从被动响应转向主动编排。
思科收购Astrix Security,强化非人身份与AI代理安全控制层
思科宣布计划收购非人身份安全公司Astrix Security,旨在将AI代理与API密钥、服务账户等非人身份的安全管理,深度整合至其身份智能平台与零信任访问方案中。此举标志着安全控制点正从传统人机交互向自动化AI代理工作负载迁移,以应对由AI代理滥用凭证引发的全新攻击面。
谷歌发布企业级AI代理平台与第八代TPU,押注“代理时代”
谷歌在Cloud Next '26上推出Gemini企业级代理平台,用于构建和管理自主AI代理工作流,并发布专为代理AI设计的第八代TPU芯片。同时,谷歌还发布了Gemma 4开源模型和Deep Research Max等高级分析工具。
微软发布AI时代网络安全责任框架,强调公私协作与漏洞管理现代化
微软发布了一份关于利用下一代AI加强全球数字生态安全的框架性文件,核心观点是AI加速漏洞发现的同时,必须同步强化响应与修复能力。文件提出了五项具体建议,强调公私协作、负责任的AI能力发布以及现代化漏洞管理流程。
英伟达通过NemoClaw与OpenClaw合作,推动企业级自主AI代理安全部署
英伟达通过NemoClaw参考实现,整合OpenShell安全运行时与Nemotron开源模型,为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战,将AI基础设施控制点向本地、安全、可审计的架构迁移。
Cloudflare Dynamic Workflows:动态路由控制多租户持久执行,锁定平台生态
Cloudflare发布Dynamic Workflows库,基于Dynamic Workers原语,实现运行时动态加载每个租户的工作流代码。Worker Loader路由请求,Workflows引擎持久执行,隔离、零空闲成本。为多租户SaaS、AI agent和CI/CD提供新范式,但隐性锁定平台运行时。
思科发布液冷网络交换机,将液冷架构扩展至AI基础设施核心
思科正式发布采用直接芯片液冷设计的N9000与8000系统,将液冷技术从GPU服务器扩展至网络交换机。该产品将带宽密度提升一倍,能耗降低近70%,旨在解决AI集群高功率密度带来的散热挑战。此举标志着数据中心冷却架构正从部件级优化转向系统性重构。
思科发布AI模型溯源宪法,定义权重级衍生关系标准
思科发布《模型溯源宪法》,为AI模型供应链安全提供规范性定义。该标准严格基于模型权重的可验证衍生历史,明确区分了直接衍生、蒸馏等五种关联关系与独立复现等八种非关联模式,旨在解决当前行业在模型溯源定义上的不一致问题。
思科开源AI模型血缘工具包,瞄准AI供应链安全治理层
思科发布开源工具Model Provenance Kit,通过分析模型元数据、分词器及权重信号,生成唯一指纹并比对,以技术手段验证AI模型的血缘关系与完整性,旨在应对模型供应链中存在的篡改、伪造及合规风险。
AMD提出AI基础设施网络架构新范式:从无损网络转向智能端点
AMD发布博客,提出构建大规模AI基础设施的七个关键问题,核心观点是传统无损以太网或InfiniBand架构存在成本与复杂性瓶颈。其主张将网络智能和可靠性功能从昂贵的专用交换机转移到智能网卡(NIC)上,在标准(可能有损)以太网上实现可靠传输,以降低总拥有成本并简化运营。
思科发布量子安全架构,将防御纵深扩展至硬件信任根
思科发布了其量子安全战略的架构细节,提出“安全通信”与“安全产品”两大支柱。其核心在于将后量子密码技术从网络协议层延伸至设备硬件信任链,通过集成信任锚模块和量子安全启动流程,旨在保护平台完整性,而不仅仅是数据在途安全。
英特尔与ChatPPT合作推出混合AI PC版,推动AI工作负载本地化
英特尔与AI应用ChatPPT合作,利用其AI Super Builder技术推出混合AI PC版。该版本将部分AI工作负载(如格式调整)从云端卸载至本地PC处理,降低了50%的云成本并提升了32%的用户使用时长,同时增强了数据隐私。
Cloudflare与Stripe联手:AI代理自动开户、支付、部署,控制权从人转向协议
Cloudflare宣布与Stripe合作推出新协议,允许AI代理自动创建Cloudflare账户、获取API令牌、购买域名并部署应用,无需人工操作。通过Stripe Projects CLI和OAuth扩展,代理可发现服务、授权身份、使用支付令牌,实现从零到生产的全自动流程。