情报
AI 生成的结构化厂商动态简报
NVIDIA联合工业软件巨头推出NemoClaw,构建安全自主的AI工程师
NVIDIA联合Cadence、Dassault Systèmes、西门子等十多家工业软件厂商,发布开放蓝图NemoClaw。该框架旨在构建安全、长期运行的专业AI代理,以端到端自动化CAE/EDA等复杂工程工作流,将数周仿真时间压缩至数小时。
微软构建端到端智能体栈,从芯片到云重构AI应用生态
微软在Build大会上发布了一系列围绕“智能体时代”的基础设施与平台更新,核心在于构建一个从芯片参考设计(Project Solara)、操作系统安全层(MXC/OpenClaw)、数据智能基础(Microsoft IQ)、专用数据库(Azure HorizonDB)到开发与部署平台(Foundry, Copilot app)的完整、集成化智能体技术栈。此举旨在将智能体应用的全生命周期管理收拢至微软生态内部。
思科发布端到端AI网络战略,整合eBPF与VXLAN ESG应对推理时代
思科发布端到端AI网络战略,通过将Isovalent的eBPF技术整合至Nexus One,实现Kubernetes容器与物理网络的无缝可视性与策略同步。同时,思科推出基于VXLAN端点安全组(ESG)的AI作业细粒度隔离,并扩展其AI Canvas和Live Protect能力,以应对规模化AI推理与前沿AI模型带来的安全挑战。
英特尔发布Xeon 6+处理器并推动面向智能体AI的机架级基础设施
英特尔在Computex上发布基于18A工艺的Xeon 6+处理器,强调其高能效核心密度。同时,公司联合富士康、SambaNova等合作伙伴,推动为智能体(Agentic)AI推理工作负载优化的新型机架级(Rack-Scale)基础设施,并宣布与Perplexity合作实现混合AI计算。
GTC台北2026:Vera 88核CPU专为智能体设计,1.8倍x86性能
NVIDIA在GTC台北2026发布首款独立数据中心微处理器Vera,首次以自有CPU直接对标Intel Xeon和AMD EPYC。Vera采用88个定制Olympus Arm核心,单片mesh网络(非chiplet),核心间通信比传统CPU快50%。LPDDR5X带宽1.2TB/s,PCIe Gen6,内外带宽为同类最高性能CPU的2-3倍。智能体沙箱性能1.8倍x86。首批客户:OpenAI、Anthropic、SpaceX。Q3 2026投产,FY CPU收入目标200亿美元。标志着NVIDIA从GPU加速器厂商向全栈数据中心平台厂商的战略跃迁。
AMD Silo AI 与 Delphyr AI 深度协作,共筑临床医疗 AI 垂直解决方案
AMD Silo AI 与医疗 AI 公司 Delphyr AI 宣布深度合作,旨在将 Delphyr 的 AI 助手平台规模化部署于临床环境。合作核心是双方工程师共同优化基于 AMD Instinct 加速器和 ROCm 软件栈的高性能 embedding pipeline,确保 AI 能力能无缝集成到现有电子健康记录系统和工作流中,满足医疗行业对速度、隐私和可靠性的严苛要求。
英特尔联合生态伙伴推出机架级AI基础设施,瞄准推理与智能体工作负载
英特尔在Computex宣布推出基于Xeon 6+处理器与SambaNova RDUs的机架级AI基础设施,并与富士康、Vector Core Compute等合作,提供面向推理和智能体工作负载的优化系统及解耦推理云服务。此举标志着英特尔从芯片供应商向AI系统解决方案提供商的战略延伸。
Google Cloud 集成 GKE 多集群推理网关与托管 DRANET,定义 AI 服务网格新范式
Google Cloud 通过博客和代码实验室展示了一项实验:将 TPU v6e、GKE 托管 DRANET(动态资源分配网络)、多集群 GKE Inference Gateway 与 Cloud Storage FUSE 集成,构建跨区域、高可用的 AI 推理服务。该架构利用 Fleet 统一管理集群,并通过声明式策略实现基于硬件指标(如 KV cache 使用率)的智能流量路由与故障转移。
NVIDIA联合金融巨头推动交易基础模型,重构AI架构范式
NVIDIA联合Revolut、Mastercard、Stripe等金融机构,基于其全栈AI平台(Hopper GPU, Nemotron, NeMo)推出“构建您自己的交易基础模型”开发者示例。该模型旨在通过单一Transformer架构统一处理海量交易数据,替代传统针对单一业务(如欺诈、信用评分)的孤立模型,并已通过AWS、Nebius等云平台及多家服务商进行生态化部署。
Arm与NVIDIA推出RTX Spark,定义智能体AI PC硬件新标准
Arm联合NVIDIA发布基于Arm Grace CPU与Blackwell RTX GPU的RTX Spark平台,旨在为Windows on Arm生态提供高性能本地AI推理能力。该平台采用统一内存架构,目标直指支持下一代自主AI工作流(如agentic RAG),标志着PC从以应用为中心向以智能体为中心的根本性转变。
Oracle Cloud加入Arm AGI CPU生态,Arm架构加速夺取AI基础设施控制层
Oracle Cloud Infrastructure宣布加入Arm AGI CPU生态系统,将基于Arm架构的优化CPU引入其云平台以支持Agentic AI工作负载。这一动作进一步验证了Arm Neoverse平台在云数据中心,特别是AI基础设施中替代传统x86架构的趋势。
NVIDIA通过JetPack 7.2与NemoClaw将Agentic AI控制力延伸至物理边缘
NVIDIA发布JetPack 7.2边缘AI软件栈并集成NemoClaw框架,构建了从底层Yocto OS、中间层Agent Skills到上层Agentic AI框架的三层栈。此举旨在将数据中心成熟的AI代理开发范式与编排能力系统性地下沉至Jetson边缘平台,加速物理AI代理在机器人、工业自动化等领域的规模化生产部署。
AMD联合教育组织发起全国性青少年AI与工程挑战赛
AMD与Hack Club、NASA及GitHub Education合作,启动“Stardance”全国性暑期工程挑战赛。该项目面向13-18岁青少年,鼓励他们利用公开数据集和开发工具,构建从AI应用到游戏、硬件原型在内的实际项目,并计划在AMD Advancing AI大会期间举办线下黑客松。
NVIDIA GTC台北2026:DSX开源数据中心平台,同等电力多部署40%加速芯片
NVIDIA在GTC台北2026推出开源数据中心软件平台DSX,以开源模式向基础设施运营商提供规划、部署和监控完整工具套件,用户可按需选取组件。关键优势:同等电力预算下可额外部署最多40%加速芯片——对受供电容量限制的大型数据中心尤为显著。黄仁勋表示借助DSX可在不花一分钱的情况下对整个工厂进行模拟,安装任何机架之前验证性能。同时发布DGX Station for Windows高端工作站,748GB统一内存、20 petaflops FP4算力,运行万亿参数模型和数百个智能体,Q4 2026上市。
Qualcomm Computex 2026:Dragonfly飞龙数据中心品牌发布,完成从可穿戴到数据中心全域覆盖
高通CEO安蒙在Computex 2026开幕keynote定义2026为智能体之年,提出计算连续体(Compute Continuum)概念——云端和边缘将融合为统一系统,不再分开讨论。发布数据中心业务品牌Dragonfly(飞龙),6月底投资者日披露细节,标志着高通完成从毫瓦级可穿戴到数据中心的全域覆盖。Snapdragon C平台瞄准$700以下入门笔记本市场,与Apple MacBook Neo竞争。安蒙强调智能体时代需要全新设备设计——现有设备都是为用户发起操作设计,而非为agent自主运行设计。
Google客户案例揭示:企业从LLM API消费转向自有微调开源模型
Trustpilot与Google合作,通过微调Gemma开源模型,在Dataflow和Gemini Enterprise Agent Platform上构建高吞吐量实时数据处理流水线,替代传统ML方案并实现成本可控。此举标志着企业AI策略从依赖闭源API向拥有模型所有权和优化基础设施的范式转变。
NVIDIA GTC台北2026:Vera 88核CPU专为智能体设计,1.8倍x86性能,OpenAI/Anthropic首批部署
NVIDIA在GTC台北2026发布首款独立数据中心微处理器Vera,首次以自有CPU直接对标Intel Xeon和AMD EPYC。Vera采用88个定制Olympus Arm核心,单片mesh网络(非chiplet),核心间通信比传统CPU快50%。LPDDR5X带宽1.2TB/s,PCIe Gen6,内外带宽为同类最高性能CPU的2-3倍。智能体沙箱性能1.8倍x86。首批客户:OpenAI、Anthropic、SpaceX。Q3 2026投产,FY CPU收入目标200亿美元。标志着NVIDIA从GPU加速器厂商向全栈数据中心平台厂商的战略跃迁。
NVIDIA借DSX平台与全球伙伴构建全栈AI云生态,定义AI工厂经济性
NVIDIA正通过其DSX平台与全球云伙伴(如CoreWeave、Firmus、Nebius)深度合作,共同构建由NVIDIA全栈技术定义的‘AI Cloud’生态系统。该生态旨在将‘AI工厂’基础设施贴近数据与用户,并引入‘每Token成本’作为核心经济性指标,以优化从训练、推理到智能体(agentic AI)的全周期工作负载。
NVIDIA发布工厂运营蓝图,定义自主工厂管理器代理架构
NVIDIA发布Factory Operations Blueprint (FOX)参考设计,用于构建基于AI的自主工厂管理器代理。该蓝图整合NemoClaw、AI-Q Blueprint及Nemotron开放模型,旨在连接工厂异构系统、自动化AI模型训练并协调各类专业代理,实现工厂级智能决策。
NVIDIA联合台系制造巨头,以AI平台重构制造业运营与控制层
NVIDIA联合台积电、富士康、广达等超过500家生态伙伴,在其Vera Rubin NVL72 AI基础设施生产过程中,深度应用CUDA-X、Omniverse、AI代理及物理AI技术,优化从芯片设计、工厂规划到产线运营的全流程。此举将NVIDIA的技术栈从计算加速延伸至制造运营的核心控制层。