Scaling - AI基础设施情报搜索

NVIDIA 其他 2026-06-02

NVIDIA 推交易基础模型：金融 AI 控制点从碎片模型转向统一 GPU 堆栈

NVIDIA 发布 Build Your Own Transaction Foundation Model 开发者示例，联合 Revolut、Mastercard 等金融机构，推动基于 Transformer 的交易基础模型替代碎片化任务模型。该方案依托 Hopper GPU、cuDF 和 Nemotron 框架，将金融数据处理从特征工程转向统一嵌入，实质是控制层向 NVIDIA 硬件生态转移。

NVIDIA 其他 2026-06-02

NVIDIA DGX Spark更新：一键部署本地AI代理，多节点集群扩展至400B模型

NVIDIA在Computex 2026发布DGX Spark软件更新，包括NemoClaw一键安装本地AI代理、Qwen3.6-35B模型在vLLM上实现2.6倍性能提升、以及Sync集群助手支持2-4节点通过ConnectX-7 200Gbps RoCE高速互联，使本地运行大规模自主代理和多节点分布式推理成为可能。

Amazon 其他 2026-06-02

AWS托管OpenAI GPT-5.5/Codex：控制层从模型转向云平台

AWS在Bedrock上推出OpenAI GPT-5.5、GPT-5.4和Codex编码代理，通过Responses API统一调用。此举将OpenAI前沿模型纳入AWS基础设施，实现数据驻留与容量管理，但用户被锁定在Bedrock生态中。

Google 其他 2026-06-01

AlloyDB Remote MCP Server GA：Google Cloud以开放协议重塑AI代理数据访问生态

Google Cloud宣布AlloyDB Remote MCP Server正式GA，允许AI代理通过HTTP端点安全访问操作型数据。该服务基于开放MCP协议，提供IAM细粒度授权、Model Armor防护和审计日志，并集成AlloyDB的ScaNN向量索引（10亿+向量，6倍速度）与AI函数，旨在成为企业AI代理的单一数据源。

HPE 其他 2026-06-01

HPE推NVIDIA Vera CPU服务器，重构Agentic AI硬件生态

HPE发布ProLiant DL394 Gen12，搭载NVIDIA Vera CPU，专为Agentic AI与强化学习设计。强调极致单核性能与高内存带宽，集成iLO安全与Compute Ops Management，并联合Redpanda与NYSE探索金融场景应用。

NVIDIA 其他 2026-06-01

NVIDIA Vera CPU：自研Olympus核心与LPDDR5X，专为Agentic AI工厂重塑CPU设计点

NVIDIA发布Vera CPU，集成88核自研Olympus核心、1.2TB/s LPDDR5X带宽与SCF一致性网络，针对Agentic AI和强化学习中的CPU执行瓶颈，宣称比x86架构性能提升1.8倍，并将内存功耗降至30W以下，推动AI工厂从“每核心成本”向“每Token成本”转变。

NVIDIA 其他 2026-06-01

NVIDIA DSX OS：以开源软件夺取AI工厂控制平面，锁定生态

NVIDIA发布DSX OS，一套开源模块化软件，用于运营AI工厂。包含DSX Exchange、MaxLPS、NICo、NVSentinel等组件，统一IT/OT通信、电源优化、生命周期管理。声称可在固定功率下多运行40% GPU，但核心依赖NVIDIA专有硬件，旨在锁定用户至其生态。

Intel 其他 2026-06-01

Intel以Xeon 6+与E835重塑AI控制平面：CPU重新成为agentic AI的编排核心

Intel发布基于Intel 18A的Xeon 6+处理器（288个E-core）、E835 200GbE控制器及Crescent Island GPU。核心战略是让CPU重回AI基础设施中心，作为agentic AI工作负载的编排与数据移动控制平面，并试图通过E835以太网组合锁定AI数据中心网络标准。

NVIDIA 其他 2026-05-31

NVIDIA DSX OS Delivers Open, Modular Software for Operating AI Factories at Scale

...

Nokia 其他 2026-05-29

诺基亚1830 GX多轨OLS：以密度和功耗优势重塑AI集群跨站点光互联经济性

诺基亚发布1830 GX多轨开放线路系统（OLS），在1RU内支持4个光纤轨，实现40RU机架部署160轨，功耗每轨降低超60%。该方案专为AI集群跨数据中心互联（Scale-Across）设计，通过集成C+L波段EDFA、DGE、OCM和OTDR，解决传统ILA站点空间与功耗瓶颈，实现9.6THz频谱容量。

NVIDIA 其他 2026-05-29

DynoSim: Simulating the Pareto Frontier

...

Cisco 其他 2026-05-28

Cisco Scale-Across架构：硅光融合定义AI跨数据中心网络新标准

Cisco发布Scale-Across方案，基于Silicon One P200路由系统（51.2Tbps）和400G/800G ZR/ZR+相干光模块，结合开放线路系统，旨在解决AI训练因功率限制需跨数据中心分布时的网络性能问题，实现类似单机房的低延迟无损连接。

Huawei 其他 2026-05-25

华为韬定律：逻辑折叠绕开光刻限制，固定制程密度跃升55%

华为何庭波在ISCAS 2026提出韬定律，以特征时间常数tau为统一优化目标，替代传统几何缩放。核心技术逻辑折叠通过垂直堆叠有源层缩短关键路径，在固定制程（如N+2）下实现晶体管密度+55%、能效+41%的实测收益。麒麟2026首次突破3GHz，昇腾系列将引入逻辑折叠。该路线图预计到2031年等效1.4nm制程密度，从根本上挑战摩尔定律的物理极限。

AMD 其他 2026-05-20

AMD Ryzen AI Halo与Max PRO 400系列：本地运行300B参数模型，但隐性锁定与工程短板并存

AMD发布Ryzen AI Halo开发者平台（128GB统一内存，支持200B参数模型）及Ryzen AI Max PRO 400系列处理器（首款x86客户端运行300B参数模型）。通过统一内存架构、ROCm优化和OEM合作，推动代理AI从云端走向本地，但实际性能受限于共享内存带宽与散热设计。

Google 其他 2026-05-19

Google I/O 2026：TPU 8t/8i跨数据中心训练与Gemini 3.5 Flash速度革命

Google发布第八代TPU：TPU 8t（训练）和TPU 8i（推理），原始计算力提升3倍，性能功耗比提升2倍。通过JAX/Pathways实现跨100万+TPU的分布式训练。同时推出Gemini 3.5 Flash，输出速度是其他前沿模型的4倍，并在GDPVal等基准上领先。SynthID被OpenAI、Nvidia等采用。

Cloudflare 其他 2026-05-19

Anthropic与Cloudflare联手解耦AI代理：推理与执行分离成新范式

Anthropic与Cloudflare推出集成，允许Claude Managed Agents在Cloudflare沙箱中执行代码，实现推理与执行分离。用户获得对沙箱、安全、可观测性的完全控制，支持微VM或轻量级V8 isolate环境，并内置浏览器、电子邮件等工具。

Google 其他 2026-05-18

Google Cloud推MCP托管服务：将AI数据层控制点从SQL转向标准化协议

Google Cloud发布Managed MCP Tools，通过Model Context Protocol标准化AI与BigQuery等数据源的交互。文章提出五个演进场景，从静态API到MCP代理，强调MCP作为开放标准可解耦推理层与数据层，但托管实现深度绑定BigQuery生态。

Cisco 其他 2026-05-14

思科Unified Edge平台：服务商边缘AI服务的新生态捆绑

思科推出Cisco Unified Edge平台，整合计算、网络、存储和安全，通过Intersight集中管理，面向服务提供商在数千个边缘站点部署AI推理等低延迟服务。Verizon作为早期用户，计划将边缘能力捆绑进企业连接服务。

Cisco 其他 2026-05-12

思科用LLM宪法定义取代人工标注，锁定AI安全分类控制权

思科发布Single-Source Safety Definitions，用300+行宪法文档和LLM作为核心评估器，实现AI安全分类一致性。该方法将人工标注压缩为AI驱动，引入意图/内容双轴评估，减少LLM分歧达57倍，并作为Cisco AI Defense产品组合的默认安全分类法。

Cisco 其他 2026-05-07

思科与AMD联合基准测试：将AI网络控制点从GPU移至智能网卡与交换机

思科与AMD联合发布基于N9000 800G交换机、Pensando Pollara 400智能网卡和MI300X GPU的AI组网基准测试。通过IBPerf和MLPerf测试，展示在incast拥塞下P01/P99带宽均接近400Gbps线速，证明其架构能消除GPU空转，实现确定性性能。

情报

筛选