情报
AI 生成的结构化厂商动态简报
AMD与Rackspace共建30MW受管AI算力:从硅层到结果的生态重构
AMD与Rackspace签署协议,分阶段部署30MW基于AMD Instinct GPU(MI355X等)和EPYC CPU的AI计算,构建面向受监管企业的“受管AI堆栈”,提供从裸金属到推理的单一责任方服务,旨在替代传统多厂商集成模式。
Cisco安全组合全面迁入AWS Marketplace:生态绑定加速,多云中立性存疑
Cisco宣布将其全套SaaS安全产品(Duo、Secure Access、Identity Intelligence、Hybrid Mesh Firewall等)通过AWS Marketplace提供,并与Amazon Bedrock、SageMaker深度集成,强化AI安全与零信任代理管理。此举旨在简化采购、加速部署,但显著加深对AWS生态的依赖,可能牺牲多云灵活性。
Cloudflare Announces Scheduled Maintenance and Global Infrastructure Expansion
...
Cisco G300芯片:AI网络控制平面争夺的封闭锁链
Cisco发布Silicon One G300可编程AI网络芯片,针对AI数据中心和ML集群。该芯片是Cisco统一路由、交换和AI加速架构的延伸,但实质是通过专有控制平面和软件栈锁定用户,对抗Broadcom、Nvidia等开放生态。
AMD收购MEXT:用AI预测让Flash逼近DRAM,降低AI内存TCO
AMD宣布收购AI内存优化初创公司MEXT,其核心技术利用AI预测模型使NAND Flash在延迟和吞吐量上逼近DRAM,旨在扩展AI服务器的有效内存容量,降低总拥有成本(TCO)。该技术将被整合进AMD数据中心全线产品,包括EPYC CPU和Instinct GPU,以应对大模型对内存的饥渴。
AMD通过Vultr开源AI软件组件,向NVIDIA CUDA生态发起生态重构挑战
AMD通过Vultr Marketplace发布开源、模块化的企业AI软件组件,包括AMD Inference Microservices (AIMs)、AI Workbench、Resource Manager和Solution Blueprints。该组合旨在提供生产级AI基础设施,避免单一厂商锁定,直接挑战NVIDIA的CUDA生态。
Z.ai GLM-5.2推可用1M Token上下文,无基准测试下挑战长文本推理极限
Z.ai发布GLM-5.2,宣称支持可用的1M token上下文窗口,并引入两种思考努力级别(Thinking-Effort Levels)。但未提供任何标准基准测试结果,引发对其实际性能与可用性的质疑。该模型旨在直接替代传统RAG分块检索流程,实现端到端长文本推理。
NVIDIA推AgentPerf基准测试:Blackwell Ultra每瓦代理数较Hopper提升20倍
NVIDIA与Artificial Analysis联合发布首个Agentic AI基准测试AgentPerf,结果显示GB300 NVL72平台在运行DeepSeek V4 Pro等MoE模型时,每兆瓦可承载的并发代理数较HGX H200提升20倍。该基准模拟真实编码代理轨迹,测量端到端吞吐与响应延迟。
AMD携手戴尔与剑桥大学,以开放ROCm生态撬动英国主权AI算力基建
AMD联合戴尔和剑桥大学宣布建立英国主权AI创新实验室(SAIL),部署基于第五代EPYC和Instinct MI355X GPU的Zenith超级计算机,以及用于聚变能源研究的Sunrise系统。该实验室旨在推动开放、可互操作的AI基础设施,以ROCm软件栈为核心,对抗NVIDIA的CUDA生态锁定,为英国政府和研究机构提供长期技术选择。
Graviton5 与 Nitro 形式化验证:AWS 用 ARM 和数学锁定 AI 时代 CPU 控制权
AWS 推出第五代自研 ARM 处理器 Graviton5,搭载于 M9g/M9gd 实例,性能提升 25%,支持 PCIe Gen6 和 DDR5-8800,首次引入形式化验证的 Nitro Isolation Engine。Meta 已部署数千万核支撑 agentic AI 推理,ARM 在云 CPU 赛道上完成关键突破。
AMD EPYC以机架级密度宣战:Agentic AI的CPU控制权之争
AMD发布博客,宣称其EPYC处理器在机架级性能上领先NVIDIA Vera和Intel Xeon,专为Agentic AI的CPU密集型服务(如编排、缓存、数据库)设计。通过100kW机架模型,EPYC 9965(Turin)实现2.37倍于Vera的吞吐量,下一代“Venice”将扩展至3.30倍。强调现有x86平台即可部署,无需等待未来架构。
Cloudflare 将安全栈延伸至私有源站:DNS 路由开启应用层控制新范式
Cloudflare 发布 Application Services for Private Origins,允许企业客户通过 DNS 记录启用私有路由,将 WAF、Bot 管理、速率限制等安全服务应用于私有 IP 上的应用,无需公网暴露或 connector 软件。该功能基于 Cloudflare 已有的私有网络连接(IPsec/GRE/CNI/Mesh)实现,并支持 Spectrum 和 Workers VPC 绑定,构建统一的私有流量控制平面。
GKE Inference Gateway前缀缓存:AI推理延迟降低92%,但锁定风险暗藏
Google Cloud推出GKE Inference Gateway,通过前缀缓存和模型感知路由,在Llama 3.1 8B模型上实现92.8%更短首令牌延迟和15.7%更高吞吐量。Snap实测缓存命中率达75-80%。但该技术深度绑定GKE Gateway API和Google生态,企业需警惕架构弹性损失。
思科推出AI原生分支架构:AgenticOps与后量子加密重塑WAN控制平面
思科在Cisco Live 2026上完成Secure Router 8000系列更新,推出Unified Branch架构,集成AgenticOps自动化、后量子密码学(PQC)和混合网状防火墙,将控制平面从本地迁移至Cisco Cloud Control,为AI时代分支网络提供统一平台。
NVIDIA联手斗山集团:以全栈物理AI平台重构工业自动化生态
NVIDIA与斗山集团扩大合作,将Isaac Sim、Cosmos、Jetson Thor等物理AI栈整合进斗山机器人Agentic Robot OS,并探索AI工厂电力(SMR、氢燃料电池)及MGX生态PCB材料。此举旨在将NVIDIA从GPU供应商转型为物理AI和AI工厂基础设施的中央平台,深度锁定工业自动化生态。
思科Silicon One扩展至校园:以芯片内嵌控制锁定Agentic AI网络
思科宣布将Silicon One芯片用于校园网络,推出C9550/C9350系列智能交换机,配合Cloud Control平台,实现分布式可见性、持续高性能和自适应可编程。通过深度片上缓冲、身份感知转发和亚秒级策略更新,意图将控制平面从外围设备转移至芯片和云原生编排,以应对AI代理带来的持续流量和安全挑战。
思科将OT安全控制点嵌入交换机ASIC:从可见性到执行的闭环锁定
思科在Cisco Live 2026发布Cyber Vision新功能,将安全策略自动推荐、模拟与执行直接集成到IE3500/IE9300工业交换机的自有ASIC中,并嵌入零信任远程访问。此举将OT安全从独立设备转移到网络基础设施内部,实现从可见性到预防的闭环,但旨在深度锁定用户于Cisco全栈。
思科借Isovalent与VXLAN ESG,将AI网络控制点从K8s移向统一光纤
思科通过整合Isovalent的eBPF技术至Nexus One,实现从Pod到光纤的端到端可视化,并推出基于VXLAN ESG的AI作业分段,将安全与租户隔离策略直接嵌入底层网络。此举旨在解决Kubernetes‘黑箱’导致的AI推理网络瓶颈与故障定位难题。
NVIDIA DGX Spark更新:一键部署本地AI代理,多节点集群扩展至400B模型
NVIDIA在Computex 2026发布DGX Spark软件更新,包括NemoClaw一键安装本地AI代理、Qwen3.6-35B模型在vLLM上实现2.6倍性能提升、以及Sync集群助手支持2-4节点通过ConnectX-7 200Gbps RoCE高速互联,使本地运行大规模自主代理和多节点分布式推理成为可能。
思科AI Defense升级:以Agent供应链安全为名,行平台锁定之实
思科发布AI Defense重大更新,聚焦AI Agent安全,引入自适应红队测试、策略工作室(Policy Studio)和自动Agent依赖图扫描。新功能旨在实现跨平台(AWS Bedrock、Google ADK、LangChain)的上下文感知保护,但深度绑定Cisco Secure AI Factory与NVIDIA生态,隐藏了性能开销和迁移成本。