情报
AI 生成的结构化厂商动态简报
NVIDIA CUDA 13.3 通过 Tile C++、编译器自动调优与 Python 生态巩固软件栈控制权
NVIDIA 发布 CUDA 13.3,核心动作包括将高级 CUDA Tile 编程模型扩展至 C++、正式发布稳定的 CUDA Python 1.0 并引入进程检查点等功能,以及推出 CompileIQ 编译器自动调优框架。此举旨在通过更高层级的抽象和自动化工具,进一步降低 GPU 编程门槛并提升性能。
AWS SageMaker 通过 OpenAI 兼容 API 争夺 AI 推理控制权
AWS 宣布其 Amazon SageMaker AI 推理端点现支持 OpenAI 兼容的 API 接口。此举使开发者无需修改代码即可将基于 OpenAI API 构建的 AI 应用迁移至 SageMaker 平台,显著降低了从 OpenAI 向 AWS AI 基础设施迁移的技术与锁定门槛。
思科发布内部RAG平台DRIFT,展示企业AI基础设施蓝图
思科IT部门推出名为DRIFT的文档检索与摄取框架工具包,旨在标准化和规模化企业内部RAG应用开发流程。该平台基于云原生微服务架构,运行在思科自有的AI POD基础设施上,提供从文档预处理到检索重排的端到端流水线,并支持Agentic RAG等演进用例。
思科调整漏洞披露策略,基于AI与风险优先级
思科宣布将调整其基于风险的漏洞披露模型,利用AI能力加速漏洞发现,并优先披露高风险漏洞的详细技术信息。对于内部发现且风险较低的漏洞,将减少独立披露,转而引导客户采用包含安全补丁的软件版本。
NVIDIA 开源医学图像生成框架,推动 3D 医疗 AI 数据瓶颈突破
NVIDIA 发布并开源了基于 MAISI-v2 (Latent Rectified Flow) 架构的 NV-Generate-CTMR 框架及其新模型 NV-Generate-MR-Brain。该框架旨在规模化生成高质量的 3D CT 和 MRI 合成数据,并配套发布了大规模开源多模态 MRI 数据集 MR-RATE,以解决医疗 AI 开发中的数据稀缺和隐私限制问题。
Google Cloud展示垂直行业AI Agent架构,强调混合集成能力
Google Cloud通过客户案例Movix,展示了为牙科制造业构建的端到端AI Agent解决方案。该方案基于Google Cloud基础设施,利用定制模型和Gemini Enterprise Agent Platform,并重点设计了连接本地遗留系统的混合架构,以进入保守市场。
NVIDIA 以智能体工具包推动 AI 工作流从模型调用向编排平台演进
NVIDIA 通过其 NeMo Agent Toolkit 开源库,展示了一个用于量化金融信号发现的多智能体系统参考架构。该系统将传统手动、碎片化的研究流程,转变为由配置驱动、具备可观测性的自动化闭环,凸显了智能体编排层在复杂 AI 应用中的核心价值。
思科全面拥抱SONiC,提供从硬件到软件的全栈开放网络方案
思科宣布在其Cisco 8000和即将推出的N9000系列交换机上全面支持开放网络操作系统SONiC,并提供构建自有发行版和预构建镜像两种消费模式。此举旨在将思科硅芯片性能与SONiC的开放架构相结合,为AI和高性能工作负载提供可编程、可扩展的网络基础设施。
思科Talos IR分享AI生成报告一致性控制方法
思科Talos事件响应团队发布研究,识别AI生成技术报告中的四类不一致问题,并通过提示工程方法进行控制。该研究基于桌面演练报告案例,旨在提升AI辅助内容生成的可靠性与效率。
思科阐述其AI就绪安全网络架构战略
思科在Gartner魔力象限报告中重申其网络战略,核心是将有线与无线网络统一为平台,并深度集成AI驱动的运营(AgenticOps)与安全。该战略旨在构建一个能够感知、推理、行动并验证的端到端网络架构,以应对AI工作负载带来的新流量模式与安全挑战。
思科通过芯片层智能包流重塑AI数据中心网络架构
思科推出基于Silicon One G300芯片的智能包流技术,将网络从高速传输层转变为具备感知、适应和优化能力的智能系统,以应对大规模AI工作负载。该技术通过硬件级遥测、自适应路由和拥塞管理,显著提升AI集群的集体完成时间和GPU利用率。
英特尔以集成SoC架构推动边缘AI机器人计算从独立GPU迁移
英特尔宣布其Core Ultra Series 3处理器正被多家机器人公司采用,以集成CPU、GPU、NPU的SoC架构替代昂贵、高功耗的独立GPU,用于边缘AI推理。这标志着机器人“大脑”向成本效益更高、更易部署的集成化异构计算架构转变。
AMD定义“智能代理计算机”新品类,推动AI推理本地化
AMD提出“智能代理计算机”概念,旨在通过本地化硬件(Ryzen™ AI Max处理器、Radeon™ AI PRO显卡)运行持续AI推理工作负载,以应对云API成本上升。其核心是推动AI从云端按需消费模式向本地固定成本、高吞吐量模式转移。
AMD发布AI Halo开发平台与Max PRO 400系列处理器,瞄准本地AI代理计算
AMD发布Ryzen AI Halo开发者平台和Ryzen AI Max PRO 400系列处理器,旨在为本地AI代理(Agent)应用提供开发与运行环境。新平台支持高达2000亿参数模型本地运行,并提供高达192GB统一内存,推动AI工作负载从云端向边缘设备迁移。
英伟达强调AI智能体评估,推动生产系统标准
英伟达发布技术博客,系统阐述AI智能体与基础模型评估的根本差异,提出以任务成功率、轨迹效率和工具调用准确性为核心的动态评估框架。此举旨在将AI智能体从模型能力测试转向生产系统行为验证,并推广其NeMo Agent Toolkit作为评估工具。
谷歌推出代理优先平台Antigravity,重塑AI原生应用架构
谷歌在I/O 2026上推出代理优先开发平台Google Antigravity,并以此为基础发布Gemini 3.5 Flash模型。该平台深度集成至搜索与Gemini应用,支持创建信息代理、生成实时交互UI及构建自定义迷你应用,标志着AI开发重心从模型调用转向持续运行的代理系统。
微软发布新一代Surface商用设备,强化端侧AI与安全集成
微软发布新一代Surface Pro和Surface Laptop商用版,搭载英特尔酷睿Ultra Series 3及后续骁龙X2处理器,强调端侧AI推理、安全设计和全栈管理。设备作为Windows AI API和Foundry平台参考硬件,旨在成为企业混合AI战略的硬件基础。
谷歌发布统一AI Agent开发工具包,整合本地与云端部署
谷歌在I/O大会上发布统一AI Agent开发工具包,包含Antigravity 2.0和Managed Agents API,旨在通过共享的A2A协议层,为开发者提供从本地快速原型到安全合规云部署的完整路径。该举措将Gemini Enterprise Agent Platform能力延伸至本地开发工具,提供从低代码到完全代码控制的多层次选择。
NVIDIA与戴尔发布全栈AI工厂,加速企业级Agentic AI部署
NVIDIA与戴尔深化合作,推出更新版Dell AI Factory with NVIDIA,旨在为企业提供从工作站到数据中心的端到端Agentic AI推理与部署平台。该平台整合了NVIDIA Vera Rubin GPU、Vera CPU、Confidential Computing及Nemotron模型,强调安全、高性能的本地化AI基础设施,以应对激增的AI推理需求。
Google 通过 TPU 8 与分布式训练架构强化全栈 AI 控制力
Google 在 I/O 2026 上披露其 AI 基础设施战略核心:发布专为训练和推理优化的 TPU 8t 与 8i 芯片,并实现基于 JAX 和 Pathways 的跨数据中心分布式训练。同时,其年度资本支出预计达 1800-1900 亿美元,以支撑激增的 AI 算力需求。