情报
AI 生成的结构化厂商动态简报
NVIDIA借DiffusionGemma并行生成,将本地AI推理控制权锁定于自家GPU
NVIDIA优化Google DeepMind的DiffusionGemma开源模型,该模型通过并行生成256 tokens(非逐token)实现4倍加速。在H100上达1000 tokens/sec,DGX Spark上150 tokens/sec,完全本地运行,无云成本。此举强化了NVIDIA GPU在计算密集型本地AI推理中的核心地位。
AMD携手戴尔与剑桥大学,以开放ROCm生态撬动英国主权AI算力基建
AMD联合戴尔和剑桥大学宣布建立英国主权AI创新实验室(SAIL),部署基于第五代EPYC和Instinct MI355X GPU的Zenith超级计算机,以及用于聚变能源研究的Sunrise系统。该实验室旨在推动开放、可互操作的AI基础设施,以ROCm软件栈为核心,对抗NVIDIA的CUDA生态锁定,为英国政府和研究机构提供长期技术选择。
NVIDIA将BESS嵌入AI工厂电力架构:电力控制层从电网转向智能储能系统
NVIDIA通过DSX平台将电池储能系统(BESS)作为AI工厂电力架构的系统级组件,而非独立附加。BESS结合逆变器、实时遥测和动态控制,实现负载平滑、扰动穿越、加速互联,并定义自认证指南,推动电力基础设施从被动备用转向主动控制。
ARM以Neural Dawn演示移动神经图形:专用加速器将改写移动GPU架构
Arm联合Sumo Digital发布Neural Dawn,首款移动端支持Unreal Engine MegaLights的游戏。通过下一代Mali GPU内置神经加速器,实现桌面级实时光线追踪和动态照明,同时维持移动功耗预算。这标志着移动图形从传统渲染向AI原生管线的转折点。
Google发布Lightning Engine:4.9x性能提升背后的生态锁定与架构隐忧
Google Cloud宣布Lightning Engine全面可用,基于开源Gluten和Velox实现向量化原生执行,声称性能提升4.9倍,价格性能比领先2倍。深度优化Cloud Storage和BigQuery连接器,但通过专有集成和premium tier强化生态锁定。
Delivering Lifecycle Control for AI Infrastructure at Scale with NVIDIA DGX Spark Enterprise Manageability
Delivering Lifecycle Control for AI Infrastructure at Scale with NVIDIA DGX Spark Enterprise Manageability2026-06-09T19:00:00+00:00As AI infrastructure scales, enterprise expectations for operational ...
AMD EPYC以机架级密度宣战:Agentic AI的CPU控制权之争
AMD发布博客,宣称其EPYC处理器在机架级性能上领先NVIDIA Vera和Intel Xeon,专为Agentic AI的CPU密集型服务(如编排、缓存、数据库)设计。通过100kW机架模型,EPYC 9965(Turin)实现2.37倍于Vera的吞吐量,下一代“Venice”将扩展至3.30倍。强调现有x86平台即可部署,无需等待未来架构。
Cloudflare 将安全栈延伸至私有源站:DNS 路由开启应用层控制新范式
Cloudflare 发布 Application Services for Private Origins,允许企业客户通过 DNS 记录启用私有路由,将 WAF、Bot 管理、速率限制等安全服务应用于私有 IP 上的应用,无需公网暴露或 connector 软件。该功能基于 Cloudflare 已有的私有网络连接(IPsec/GRE/CNI/Mesh)实现,并支持 Spectrum 和 Workers VPC 绑定,构建统一的私有流量控制平面。
GKE Inference Gateway前缀缓存:AI推理延迟降低92%,但锁定风险暗藏
Google Cloud推出GKE Inference Gateway,通过前缀缓存和模型感知路由,在Llama 3.1 8B模型上实现92.8%更短首令牌延迟和15.7%更高吞吐量。Snap实测缓存命中率达75-80%。但该技术深度绑定GKE Gateway API和Google生态,企业需警惕架构弹性损失。
思科推出AI原生分支架构:AgenticOps与后量子加密重塑WAN控制平面
思科在Cisco Live 2026上完成Secure Router 8000系列更新,推出Unified Branch架构,集成AgenticOps自动化、后量子密码学(PQC)和混合网状防火墙,将控制平面从本地迁移至Cisco Cloud Control,为AI时代分支网络提供统一平台。
NVIDIA 借英国主权AI基金,从芯片商跃升为国家AI基础设施的幕后控制者
NVIDIA 与英国政府合作,通过 Isambard-AI(搭载 5,400 颗 GH200)及 Sovereign AI Fund,扶持本地初创(Cosine, Cursive, Doubleword)。此举表面是技术部署,实则是 NVIDIA 构建主权AI控制平面,将国家算力锁入其生态系统,削弱AWS/Azure等传统云厂商的地位。
NVIDIA与LG共建AI工厂:以DSX平台锁定物理AI全栈生态
NVIDIA与LG集团联合建设AI工厂,基于NVIDIA DSX平台整合Isaac Sim/Lab、Cosmos、GR00T等框架,覆盖机器人、自动驾驶、数据中心及主权AI。LG各子公司分工明确,从冷却组件到机器人平台均深度绑定NVIDIA架构,形成排他性生态。
NVIDIA联手斗山集团:以全栈物理AI平台重构工业自动化生态
NVIDIA与斗山集团扩大合作,将Isaac Sim、Cosmos、Jetson Thor等物理AI栈整合进斗山机器人Agentic Robot OS,并探索AI工厂电力(SMR、氢燃料电池)及MGX生态PCB材料。此举旨在将NVIDIA从GPU供应商转型为物理AI和AI工厂基础设施的中央平台,深度锁定工业自动化生态。
Cloudflare 将实时威胁情报嵌入 WAF,控制点从人工转向自动化引擎
Cloudflare 发布新集成,允许用户基于 Cloudforce One 的实时威胁情报(IP、攻击者、目标行业等)直接编写 WAF 规则。采用 always-on 检测框架,以 O(1) 常数时间查找实现微秒级延迟,目前仅支持 IP 匹配,未来将扩展至 JA3 指纹和域名。
Cloudflare收购VoidZero:以Vite整合控制开发者部署管道
Cloudflare收购开源JavaScript工具链公司VoidZero,将Vite、Rolldown、Oxc等Rust原生工具整合进Workers平台,实现从本地代码到全球边缘网络的一键部署。此举旨在统一开发全生命周期,并推动意图驱动的基础设施自动预配。
思科Silicon One扩展至校园:以芯片内嵌控制锁定Agentic AI网络
思科宣布将Silicon One芯片用于校园网络,推出C9550/C9350系列智能交换机,配合Cloud Control平台,实现分布式可见性、持续高性能和自适应可编程。通过深度片上缓冲、身份感知转发和亚秒级策略更新,意图将控制平面从外围设备转移至芯片和云原生编排,以应对AI代理带来的持续流量和安全挑战。
思科将OT安全控制点嵌入交换机ASIC:从可见性到执行的闭环锁定
思科在Cisco Live 2026发布Cyber Vision新功能,将安全策略自动推荐、模拟与执行直接集成到IE3500/IE9300工业交换机的自有ASIC中,并嵌入零信任远程访问。此举将OT安全从独立设备转移到网络基础设施内部,实现从可见性到预防的闭环,但旨在深度锁定用户于Cisco全栈。
思科Agent Gateway:零信任从访问控制升级为AI代理行动控制
思科发布Secure Access Agent Gateway,将零信任策略从传统的用户/设备访问控制扩展到AI代理的细粒度行动控制。通过Duo识别代理身份,在LLM、MCP工具、SaaS API等交互点实施策略,实现行动级审计和凭证注入,旨在解决代理自主行动带来的新安全风险。
微软Build大会:从芯片到云构建Agent时代统一生态
微软在Build大会上发布一系列Agent时代基础设施:Project Solara芯片到云平台、Microsoft IQ统一知识层、Rayfin后端生成、Azure HorizonDB、GPU加速分析等,旨在将开发者锁定在微软生态内。
思科借Isovalent与VXLAN ESG,将AI网络控制点从K8s移向统一光纤
思科通过整合Isovalent的eBPF技术至Nexus One,实现从Pod到光纤的端到端可视化,并推出基于VXLAN ESG的AI作业分段,将安全与租户隔离策略直接嵌入底层网络。此举旨在解决Kubernetes‘黑箱’导致的AI推理网络瓶颈与故障定位难题。