情报
AI 生成的结构化厂商动态简报
微软构建端到端智能体栈,从芯片到云重构AI应用生态
微软在Build大会上发布了一系列围绕“智能体时代”的基础设施与平台更新,核心在于构建一个从芯片参考设计(Project Solara)、操作系统安全层(MXC/OpenClaw)、数据智能基础(Microsoft IQ)、专用数据库(Azure HorizonDB)到开发与部署平台(Foundry, Copilot app)的完整、集成化智能体技术栈。此举旨在将智能体应用的全生命周期管理收拢至微软生态内部。
英特尔发布Xeon 6+处理器并推动面向智能体AI的机架级基础设施
英特尔在Computex上发布基于18A工艺的Xeon 6+处理器,强调其高能效核心密度。同时,公司联合富士康、SambaNova等合作伙伴,推动为智能体(Agentic)AI推理工作负载优化的新型机架级(Rack-Scale)基础设施,并宣布与Perplexity合作实现混合AI计算。
AMD Silo AI 与 Delphyr AI 深度协作,共筑临床医疗 AI 垂直解决方案
AMD Silo AI 与医疗 AI 公司 Delphyr AI 宣布深度合作,旨在将 Delphyr 的 AI 助手平台规模化部署于临床环境。合作核心是双方工程师共同优化基于 AMD Instinct 加速器和 ROCm 软件栈的高性能 embedding pipeline,确保 AI 能力能无缝集成到现有电子健康记录系统和工作流中,满足医疗行业对速度、隐私和可靠性的严苛要求。
Arm与NVIDIA推出RTX Spark,定义智能体AI PC硬件新标准
Arm联合NVIDIA发布基于Arm Grace CPU与Blackwell RTX GPU的RTX Spark平台,旨在为Windows on Arm生态提供高性能本地AI推理能力。该平台采用统一内存架构,目标直指支持下一代自主AI工作流(如agentic RAG),标志着PC从以应用为中心向以智能体为中心的根本性转变。
AMD联合教育组织发起全国性青少年AI与工程挑战赛
AMD与Hack Club、NASA及GitHub Education合作,启动“Stardance”全国性暑期工程挑战赛。该项目面向13-18岁青少年,鼓励他们利用公开数据集和开发工具,构建从AI应用到游戏、硬件原型在内的实际项目,并计划在AMD Advancing AI大会期间举办线下黑客松。
HPE财报揭示网络业务爆发式增长,验证Juniper并购整合战略
HPE发布2026财年Q2财报,整体营收同比增长40%。其中Networking部门营收达27亿美元,同比飙升148%,数据中心网络、安全及路由业务均呈现数倍增长。这标志着收购Juniper Networks后,HPE在网络基础设施市场的整合战略取得显著成效。
NVIDIA发布工厂运营蓝图,定义自主工厂管理器代理架构
NVIDIA发布Factory Operations Blueprint (FOX)参考设计,用于构建基于AI的自主工厂管理器代理。该蓝图整合NemoClaw、AI-Q Blueprint及Nemotron开放模型,旨在连接工厂异构系统、自动化AI模型训练并协调各类专业代理,实现工厂级智能决策。
NVIDIA联合台系制造巨头,以AI平台重构制造业运营与控制层
NVIDIA联合台积电、富士康、广达等超过500家生态伙伴,在其Vera Rubin NVL72 AI基础设施生产过程中,深度应用CUDA-X、Omniverse、AI代理及物理AI技术,优化从芯片设计、工厂规划到产线运营的全流程。此举将NVIDIA的技术栈从计算加速延伸至制造运营的核心控制层。
NVIDIA 发布容器化 AI 模型文档自动生成工具包,集成 RAG 与 NIM 应对监管
NVIDIA 推出 Model Card Generator (MCG) 工具包,一个容器化流水线,可在一分钟内自动从源代码生成符合 Model Card++ 标准的 AI 模型文档。该工具利用 NVIDIA Nemotron RAG 进行高精度信息检索,并由大语言模型(如 GPT-OSS-120B)提取和格式化内容,旨在应对欧盟 AI 法案等法规要求。
NVIDIA将Step 3.7 Flash多模态模型深度整合至其企业AI全栈
NVIDIA宣布在其加速平台上全面支持StepFun的Step 3.7 Flash模型,这是一个1980亿参数的MoE多模态模型。通过TensorRT-LLM、vLLM进行优化推理,并通过NVIDIA NIM提供生产就绪的容器化微服务部署,同时支持基于NeMo框架的Day 0微调。
微软响应《Take It Down Act》,跨消费者服务部署NCII哈希检测与统一举报流程
微软宣布强化对非自愿亲密图像(NCII,含AI生成内容)的治理。核心动作包括:优化全球举报流程表单,统一处理真实与合成图像;并将在Teams Free、OneDrive、Xbox等消费者服务中,扩展使用来自StopNCII.org的已验证图像哈希进行主动检测与移除。此举直接响应美国《Take It Down Act》生效,旨在提升处理速度与跨平台协同。
AMD发布面积优化型Versal Prime Gen 2自适应SoC,推动边缘计算硬件小型化
AMD宣布扩展其Versal Prime Series Gen 2自适应SoC产品线,新增三款面积优化型器件(2VM3454/3254/3104)。这些器件采用4核Arm Cortex-A78AE应用处理器配置,提供最小23x23mm封装,并在单位面积内提供更高的可编程逻辑密度,旨在为专业音视频、工业物联网等嵌入式应用平衡性能、尺寸与功耗。
AMD 以 EPYC 4005 与紧凑型系统重塑零售边缘基础设施
AMD 通过其 EPYC 4005 系列 CPU,与 Supermicro 等合作伙伴推出专为零售边缘设计的紧凑型服务器平台。这些系统强调在有限空间和功耗下的高性能(DDR5, PCIe Gen5)、远程管理(BMC)与硬件安全(TPM),旨在将数据中心级能力下沉至门店,实现工作负载整合与集中化运维。
NVIDIA 开源医学图像生成框架,推动 3D 医疗 AI 数据瓶颈突破
NVIDIA 发布并开源了基于 MAISI-v2 (Latent Rectified Flow) 架构的 NV-Generate-CTMR 框架及其新模型 NV-Generate-MR-Brain。该框架旨在规模化生成高质量的 3D CT 和 MRI 合成数据,并配套发布了大规模开源多模态 MRI 数据集 MR-RATE,以解决医疗 AI 开发中的数据稀缺和隐私限制问题。
思科Talos IR分享AI生成报告一致性控制方法
思科Talos事件响应团队发布研究,识别AI生成技术报告中的四类不一致问题,并通过提示工程方法进行控制。该研究基于桌面演练报告案例,旨在提升AI辅助内容生成的可靠性与效率。
谷歌发布Antigravity 2.0,定义AI Agent本地开发控制平面
谷歌在I/O 2026上推出Antigravity 2.0,这是一个独立的桌面应用,旨在成为构建、测试和编排复杂AI工作流的“Agent-First”本地控制平面。它通过CLI/SDK、动态子代理和与企业云安全环境的直接集成,将AI Agent的开发与部署流程从云端延伸至本地环境,试图统一AI应用生命周期管理。
英特尔以集成SoC架构推动边缘AI机器人计算从独立GPU迁移
英特尔宣布其Core Ultra Series 3处理器正被多家机器人公司采用,以集成CPU、GPU、NPU的SoC架构替代昂贵、高功耗的独立GPU,用于边缘AI推理。这标志着机器人“大脑”向成本效益更高、更易部署的集成化异构计算架构转变。
AMD定义“智能代理计算机”新品类,推动AI推理本地化
AMD提出“智能代理计算机”概念,旨在通过本地化硬件(Ryzen™ AI Max处理器、Radeon™ AI PRO显卡)运行持续AI推理工作负载,以应对云API成本上升。其核心是推动AI从云端按需消费模式向本地固定成本、高吞吐量模式转移。
AMD发布AI Halo开发平台与Max PRO 400系列处理器,瞄准本地AI代理计算
AMD发布Ryzen AI Halo开发者平台和Ryzen AI Max PRO 400系列处理器,旨在为本地AI代理(Agent)应用提供开发与运行环境。新平台支持高达2000亿参数模型本地运行,并提供高达192GB统一内存,推动AI工作负载从云端向边缘设备迁移。
谷歌推出代理优先平台Antigravity,重塑AI原生应用架构
谷歌在I/O 2026上推出代理优先开发平台Google Antigravity,并以此为基础发布Gemini 3.5 Flash模型。该平台深度集成至搜索与Gemini应用,支持创建信息代理、生成实时交互UI及构建自定义迷你应用,标志着AI开发重心从模型调用转向持续运行的代理系统。