情报
AI 生成的结构化厂商动态简报
ARM推出AGI CPU:AI Agent时代的硅基础
ARM宣布推出Arm AGI CPU,这是其首款自有硅产品,基于Neoverse平台,专为agentic AI时代设计。该CPU优化大规模并行工作负载,在1OU配置中支持272核心/刀片,全机架达8160核心,性能比x86系统提高两倍以上,提升AI基础设施效率。
ARM推出AGI CPU芯片,进军AI基础设施市场
ARM于2026年3月推出首款自研AGI CPU生产级芯片,标志着从IP授权模式向完整硅解决方案提供商的战略转型。该芯片专为下一代AI基础设施设计,可能重塑数据中心处理器生态格局。
ARM Neoverse重塑AI基础设施控制层
ARM推出Neoverse系列基础设施CPU核心,专为云计算、AI和高性能计算优化,被NVIDIA、AWS、Microsoft和Google等厂商采用于其AI平台,实现性能提升和能效改进。该架构推动AI工作负载在云和边缘的高密度部署,强化安全多租户支持。
英伟达推出OpenShell,为自主AI代理建立运行时安全沙盒
英伟达发布开源项目OpenShell,旨在为自主AI代理提供安全运行时环境。其核心是采用‘浏览器标签’模型,在系统层面隔离代理操作与策略执行,防止策略被覆盖或数据泄露。此举与多家安全厂商合作,推动企业级AI代理的统一策略层。
英伟达CEO阐述加速计算范式,预示AI基础设施架构演进
英伟达CEO黄仁勋接受专访,系统阐述加速计算作为计算机架构根本性转变的理念。他强调数据中心正从通用CPU转向由GPU主导的专用加速平台,并认为未来的计算堆栈将围绕加速计算进行重构。
NVIDIA将RTX AI能力延伸至本地Agentic AI,加速Gemma 4推理
NVIDIA在GTC 2026上宣布,正将其RTX平台的能力扩展至本地Agentic AI领域,旨在加速Gemma 4等开放模型在终端设备上的推理性能。此举旨在利用本地实时上下文提升AI Agent的价值,推动云端之外的AI创新。
Meta将AI支持助手与内容审核系统整合,减少对外部供应商依赖
Meta发布AI支持助手,并部署更先进的AI内容审核系统,旨在提升用户体验和平台安全。此举标志着其从依赖外部供应商转向强化内部AI系统,并计划将AI深度融入核心运营流程。
NVIDIA推动AI机器人从模拟到生产的技术突破
NVIDIA在物理AI领域展示机器人开发新范式,通过统一仿真与生产环境加速产业自动化进程。该方案整合AI训练框架与边缘计算架构,为制造业、农业等领域提供端到端机器人开发平台。
NVIDIA RTX工作站直连苹果Vision Pro推动企业XR应用
NVIDIA通过CloudXR SDK 6.0实现RTX加速工作站与Apple Vision Pro原生直连,消除传统串流服务器需求。该技术整合Omniverse平台,支持OpenUSD工作流,显著降低企业级XR部署复杂度。
NVIDIA将CUDA Tile编程模型扩展至Julia语言
NVIDIA通过cuTile.jl包将其CUDA Tile高级GPU编程模型引入Julia语言生态。此举旨在降低高性能GPU内核开发门槛,通过数据块抽象简化底层线程与内存管理,并保持与Python版本在语法和性能上的高度一致性。
Trend Micro发布AI安全报告,揭示AI供应链风险与模型攻击面
Trend Micro发布《AI生态系统断层线》报告,系统性地分析了AI供应链中的安全风险,包括模型训练数据污染、第三方插件漏洞以及模型窃取攻击。报告指出,企业AI应用的安全边界已从传统IT基础设施扩展至模型层和数据管道。
OpenAI与PNNL合作推出政府合规AI编码基准
OpenAI与太平洋西北国家实验室合作推出DraftNEPABench基准测试,专门评估AI编码代理在联邦环境许可文件起草中的效能。该基准针对《国家环境政策法》合规文档,初步显示可缩短15%起草时间。
OpenAI 发布实时编码模型 GPT-5.3-Codex-Spark
OpenAI 推出首个实时编码模型 GPT-5.3-Codex-Spark,生成速度提升 15 倍,支持 128k 上下文,目前处于 ChatGPT Pro 用户的研究预览阶段。
OpenAI推出Codex原生AI代理,强化长期技术任务支持
OpenAI发布基于Codex的AI代理GPT-5.3-Codex,将前沿编码能力与通用推理相结合,旨在支持长期现实世界技术工作。这标志着OpenAI在专业领域AI代理方向的重要推进。
OpenAI 发布 GPT-5.3-Codex,强调其作为“最强大智能体编码模型”的定位
OpenAI 发布了 GPT-5.3-Codex,这是一个专为编码设计的智能体模型。它结合了前代模型的顶尖编码性能与通用模型的推理及专业知识能力,旨在提升 AI 在复杂、多步任务中的自主执行能力。
OpenAI 推出 macOS 版 Codex 应用支持多智能体并行工作流
OpenAI 发布 macOS 版 Codex 应用,该应用作为 AI 编码命令中心,支持多智能体并行工作流和长时间运行任务。
OpenAI 发布 GPT-5.2-Codex 增强代码生成与安全能力
OpenAI 推出 GPT-5.2-Codex,该模型具备长期推理能力、大规模代码转换和增强的网络安全功能,旨在提升开发效率和代码安全性。
NVIDIA发布交互式AI Agent:用Nemotron Nano-9B和CUDA-X实现GPU加速数据科学
NVIDIA发布了一款基于Nemotron Nano-9B-v2 LLM和CUDA-X数据科学库的交互式AI Agent,通过自然语言接口编排数据科学工作流,实现从数据加载到模型训练的端到端GPU加速,性能提升3-43倍。
Apple 通过开发者故事与教程,持续强化其端侧AI与空间计算开发生态
Apple 发布 Swift Student Challenge 获奖者故事,展示开发者如何利用 SwiftUI、Core ML(设备端机器学习框架)和空间计算技术构建应用。同时,Apple 宣布为 2026 年挑战赛提供新的开发教程,重点涵盖 SwiftUI、空间计算和机器学习。这体现了 Apple 对设备端 AI、沉浸式体验及开发者工具链的持续投入。
微软推出Phi-4系列小语言模型,强化边缘AI与多模态推理能力
微软发布Phi-4系列小型语言模型(SLM),包括5.6B参数的Phi-4-multimodal模型,支持语音、视觉和文本的多模态处理。该系列已部署至Azure AI Foundry、HuggingFace和NVIDIA API Catalog,重点优化边缘设备上的AI推理能力。