情报
AI 生成的结构化厂商动态简报
Google 开源 gcs-analytics-core 库,以并行 I/O 和预取优化 Iceberg/Spark 性能
Google Cloud 推出 gcs-analytics-core 开源 Java 库,集成于 Iceberg 1.11.0+ 的 GCSFileIO,通过 Vectored I/O 和 Smart Parquet prefetching 减少扫描延迟。TPC-DS 测试显示扫描时间提升 18%-71%,但执行时间提升有限(大数据集仅 1.58%)。
英特尔 Computex 2026:以 18A 和机架级系统重塑 AI 推理控制权
英特尔发布基于 18A 的 Core Ultra Series 3 和 Xeon 6+(288 e-cores),与 Perplexity 合作推出混合本地推理编排,与 Foxconn 共建机架级 AI 基础设施,与 SambaNova 提供解耦推理云。重点强调 CPU 在 agentic AI 中的编排角色,意图将控制平面从 GPU 转移至 x86。
Intel联合SambaNova推机架级AI推理,CPU重掌数据中心控制权
Intel在Computex 2026发布基于Xeon 6+与SambaNova SN-50 RDUs的机架级AI基础设施,并展示由Vector Core Compute运营的完全解耦推理云(预填充用NVIDIA Blackwell,解码用RDU)。此举旨在将CPU重新置于AI推理核心,改变训练时代的GPU主导格局。
NVIDIA 推交易基础模型:金融 AI 控制点从碎片模型转向统一 GPU 堆栈
NVIDIA 发布 Build Your Own Transaction Foundation Model 开发者示例,联合 Revolut、Mastercard 等金融机构,推动基于 Transformer 的交易基础模型替代碎片化任务模型。该方案依托 Hopper GPU、cuDF 和 Nemotron 框架,将金融数据处理从特征工程转向统一嵌入,实质是控制层向 NVIDIA 硬件生态转移。
TrendForce预警:HBM利润率被DDR5反超,2027年合约价或将翻倍暴涨
TrendForce最新报告指出,HBM每晶圆收入在1Q26已被DDR5 64GB RDIMM反超,导致HBM利润率低于传统DRAM。供应商将据此调整产能分配,预计2027年HBM4合约价将大幅上涨。NVIDIA Rubin Ultra与AI ASIC需求将进一步加剧HBM供应紧张。
Arm与NVIDIA联手推出RTX Spark:Agentic AI PC架构从x86转向Arm+GPU紧耦合
Arm与NVIDIA合作推出的RTX Spark采用Arm Grace CPU与Blackwell RTX GPU通过统一内存紧密耦合,专为Agentic AI时代设计,提供超低延迟本地推理能力。该平台标志着Windows on Arm生态的重大突破,旨在满足开发者、创作者和游戏玩家的高性能AI计算需求。
思科AI Defense升级:以Agent供应链安全为名,行平台锁定之实
思科发布AI Defense重大更新,聚焦AI Agent安全,引入自适应红队测试、策略工作室(Policy Studio)和自动Agent依赖图扫描。新功能旨在实现跨平台(AWS Bedrock、Google ADK、LangChain)的上下文感知保护,但深度绑定Cisco Secure AI Factory与NVIDIA生态,隐藏了性能开销和迁移成本。
AlloyDB Remote MCP Server GA:Google Cloud以开放协议重塑AI代理数据访问生态
Google Cloud宣布AlloyDB Remote MCP Server正式GA,允许AI代理通过HTTP端点安全访问操作型数据。该服务基于开放MCP协议,提供IAM细粒度授权、Model Armor防护和审计日志,并集成AlloyDB的ScaNN向量索引(10亿+向量,6倍速度)与AI函数,旨在成为企业AI代理的单一数据源。
NVIDIA FOX蓝图:工厂控制层从PLC转向AI代理,锁定DGX硬件
NVIDIA发布Factory Operations Blueprint (FOX),基于NemoClaw和DGX Station (GB300 Grace Blackwell Ultra Desktop Superchip)构建自主工厂管理代理,整合机器信号、质量系统与机器人车队,实现全厂智能决策。富士康、和硕、研华、纬创已部署,预计根因分析效率提升80%,劳动生产力提升15%。
NVIDIA借台湾供应链深化AI工厂生态,Vera Rubin量产捆绑专有软件锁
NVIDIA联合台积电、鸿海等台湾巨头,将cuLitho、Omniverse、Isaac等专有AI软件嵌入芯片制造与服务器组装流程,同时推进Vera Rubin NVL72量产。此举将制造效率提升数据(如cuLitho降低20-50%周期)作为诱饵,实质是构建从设计到生产的全栈生态壁垒。
HPE推NVIDIA Vera CPU服务器,重构Agentic AI硬件生态
HPE发布ProLiant DL394 Gen12,搭载NVIDIA Vera CPU,专为Agentic AI与强化学习设计。强调极致单核性能与高内存带宽,集成iLO安全与Compute Ops Management,并联合Redpanda与NYSE探索金融场景应用。
NVIDIA Cosmos 3开源统一物理AI模型,以MoT架构合围GPU生态
NVIDIA发布Cosmos 3,基于Mixture-of-Transformers双塔架构统一物理推理、世界生成与动作生成。开源模型权重、训练脚本和六个合成数据集,但部署优化深度绑定NVIDIA NIM微服务与GPU,意图将物理AI开发生态锁定在其硬件和软件栈上。
NVIDIA BlueField DPU硬件隔离安全:将AI工厂控制点从软件转向硅片
NVIDIA发布基于BlueField-4 DPU的DOCA安全堆栈(Argus、Vault、Flow),通过硬件隔离执行域实现运行时内存分析、零信任文件访问和800Gb/s网络策略执行。该架构将安全控制从主机操作系统转移到DPU硅片,在不影响AI性能前提下提供分布式全栈保护,但深度绑定Vera Rubin平台,形成生态锁定。
NVIDIA Vera CPU:自研Olympus核心与LPDDR5X,专为Agentic AI工厂重塑CPU设计点
NVIDIA发布Vera CPU,集成88核自研Olympus核心、1.2TB/s LPDDR5X带宽与SCF一致性网络,针对Agentic AI和强化学习中的CPU执行瓶颈,宣称比x86架构性能提升1.8倍,并将内存功耗降至30W以下,推动AI工厂从“每核心成本”向“每Token成本”转变。
NVIDIA DSX OS:以开源软件夺取AI工厂控制平面,锁定生态
NVIDIA发布DSX OS,一套开源模块化软件,用于运营AI工厂。包含DSX Exchange、MaxLPS、NICo、NVSentinel等组件,统一IT/OT通信、电源优化、生命周期管理。声称可在固定功率下多运行40% GPU,但核心依赖NVIDIA专有硬件,旨在锁定用户至其生态。
Intel以Xeon 6+与E835重塑AI控制平面:CPU重新成为agentic AI的编排核心
Intel发布基于Intel 18A的Xeon 6+处理器(288个E-core)、E835 200GbE控制器及Crescent Island GPU。核心战略是让CPU重回AI基础设施中心,作为agentic AI工作负载的编排与数据移动控制平面,并试图通过E835以太网组合锁定AI数据中心网络标准。
Cisco与微软合围:浏览器成为零信任新控制平面,SSE集成Edge定标
Cisco Secure Access与Microsoft Edge for Business深度集成,将零信任访问、DLP、AI威胁防护直接嵌入浏览器。通过统一策略引擎,浏览器取代VPN/客户端成为私有应用访问主入口,同时将Copilot等AI代理纳入安全管控,标志着安全控制点从网络层向浏览器层转移。
诺基亚1830 GX多轨OLS:以密度和功耗优势重塑AI集群跨站点光互联经济性
诺基亚发布1830 GX多轨开放线路系统(OLS),在1RU内支持4个光纤轨,实现40RU机架部署160轨,功耗每轨降低超60%。该方案专为AI集群跨数据中心互联(Scale-Across)设计,通过集成C+L波段EDFA、DGE、OCM和OTDR,解决传统ILA站点空间与功耗瓶颈,实现9.6THz频谱容量。
NVIDIA三线并发:Vera CPU交付、N1X笔记本芯片与硅光子学投资,重构AI基础设施控制层
NVIDIA交付首款Agent专用Vera CPU(88核Arm v9.2, 1.2TB/s内存带宽),预告消费级N1X笔记本处理器,并累计投资65亿美元于硅光子学。此举将AI编排控制点从x86转向NVIDIA Arm生态,同时通过CPO技术解决内存墙问题,但量产挑战持续至2028年后。
Cisco Scale-Across架构:硅光融合定义AI跨数据中心网络新标准
Cisco发布Scale-Across方案,基于Silicon One P200路由系统(51.2Tbps)和400G/800G ZR/ZR+相干光模块,结合开放线路系统,旨在解决AI训练因功率限制需跨数据中心分布时的网络性能问题,实现类似单机房的低延迟无损连接。