情报
AI 生成的结构化厂商动态简报
NVIDIA联合工业软件巨头推出NemoClaw,构建安全自主的AI工程师
NVIDIA联合Cadence、Dassault Systèmes、西门子等十多家工业软件厂商,发布开放蓝图NemoClaw。该框架旨在构建安全、长期运行的专业AI代理,以端到端自动化CAE/EDA等复杂工程工作流,将数周仿真时间压缩至数小时。
AMD Silo AI 与 Delphyr AI 深度协作,共筑临床医疗 AI 垂直解决方案
AMD Silo AI 与医疗 AI 公司 Delphyr AI 宣布深度合作,旨在将 Delphyr 的 AI 助手平台规模化部署于临床环境。合作核心是双方工程师共同优化基于 AMD Instinct 加速器和 ROCm 软件栈的高性能 embedding pipeline,确保 AI 能力能无缝集成到现有电子健康记录系统和工作流中,满足医疗行业对速度、隐私和可靠性的严苛要求。
Google Cloud 集成 GKE 多集群推理网关与托管 DRANET,定义 AI 服务网格新范式
Google Cloud 通过博客和代码实验室展示了一项实验:将 TPU v6e、GKE 托管 DRANET(动态资源分配网络)、多集群 GKE Inference Gateway 与 Cloud Storage FUSE 集成,构建跨区域、高可用的 AI 推理服务。该架构利用 Fleet 统一管理集群,并通过声明式策略实现基于硬件指标(如 KV cache 使用率)的智能流量路由与故障转移。
NVIDIA通过JetPack 7.2与NemoClaw将Agentic AI控制力延伸至物理边缘
NVIDIA发布JetPack 7.2边缘AI软件栈并集成NemoClaw框架,构建了从底层Yocto OS、中间层Agent Skills到上层Agentic AI框架的三层栈。此举旨在将数据中心成熟的AI代理开发范式与编排能力系统性地下沉至Jetson边缘平台,加速物理AI代理在机器人、工业自动化等领域的规模化生产部署。
思科AI Defense升级,推出针对AI Agent的个性化上下文安全
思科宣布其AI Defense平台重大更新,核心转向为AI Agent提供深度个性化安全。新功能包括基于自然语言的自适应红队测试与策略制定、自动化的Agent供应链漏洞扫描,以及跨主流云平台和Agent开发框架(如Amazon Bedrock AgentCore、LangChain)的原生集成。
AMD联合教育组织发起全国性青少年AI与工程挑战赛
AMD与Hack Club、NASA及GitHub Education合作,启动“Stardance”全国性暑期工程挑战赛。该项目面向13-18岁青少年,鼓励他们利用公开数据集和开发工具,构建从AI应用到游戏、硬件原型在内的实际项目,并计划在AMD Advancing AI大会期间举办线下黑客松。
NVIDIA借DSX平台与全球伙伴构建全栈AI云生态,定义AI工厂经济性
NVIDIA正通过其DSX平台与全球云伙伴(如CoreWeave、Firmus、Nebius)深度合作,共同构建由NVIDIA全栈技术定义的‘AI Cloud’生态系统。该生态旨在将‘AI工厂’基础设施贴近数据与用户,并引入‘每Token成本’作为核心经济性指标,以优化从训练、推理到智能体(agentic AI)的全周期工作负载。
NVIDIA开源DSX OS,定义AI工厂全栈运营软件层
NVIDIA发布其DSX平台的软件核心DSX OS,这是一套开源、模块化的软件组件,旨在协调从芯片、系统、软件到设施(电力、冷却)的整个AI工厂堆栈。它通过DSX Exchange(MQTT通信枢纽)、MaxLPS(动态功耗管理)、Infra Controller(裸金属生命周期管理)等组件,实现IT/OT深度融合,目标是提升“每瓦特token产出”并降低token成本。
NVIDIA 发布容器化 AI 模型文档自动生成工具包,集成 RAG 与 NIM 应对监管
NVIDIA 推出 Model Card Generator (MCG) 工具包,一个容器化流水线,可在一分钟内自动从源代码生成符合 Model Card++ 标准的 AI 模型文档。该工具利用 NVIDIA Nemotron RAG 进行高精度信息检索,并由大语言模型(如 GPT-OSS-120B)提取和格式化内容,旨在应对欧盟 AI 法案等法规要求。
NVIDIA将Step 3.7 Flash多模态模型深度整合至其企业AI全栈
NVIDIA宣布在其加速平台上全面支持StepFun的Step 3.7 Flash模型,这是一个1980亿参数的MoE多模态模型。通过TensorRT-LLM、vLLM进行优化推理,并通过NVIDIA NIM提供生产就绪的容器化微服务部署,同时支持基于NeMo框架的Day 0微调。
AMD发布面积优化型Versal Prime Gen 2自适应SoC,推动边缘计算硬件小型化
AMD宣布扩展其Versal Prime Series Gen 2自适应SoC产品线,新增三款面积优化型器件(2VM3454/3254/3104)。这些器件采用4核Arm Cortex-A78AE应用处理器配置,提供最小23x23mm封装,并在单位面积内提供更高的可编程逻辑密度,旨在为专业音视频、工业物联网等嵌入式应用平衡性能、尺寸与功耗。
AMD 以 EPYC 4005 与紧凑型系统重塑零售边缘基础设施
AMD 通过其 EPYC 4005 系列 CPU,与 Supermicro 等合作伙伴推出专为零售边缘设计的紧凑型服务器平台。这些系统强调在有限空间和功耗下的高性能(DDR5, PCIe Gen5)、远程管理(BMC)与硬件安全(TPM),旨在将数据中心级能力下沉至门店,实现工作负载整合与集中化运维。
NVIDIA 开源医学图像生成框架,推动 3D 医疗 AI 数据瓶颈突破
NVIDIA 发布并开源了基于 MAISI-v2 (Latent Rectified Flow) 架构的 NV-Generate-CTMR 框架及其新模型 NV-Generate-MR-Brain。该框架旨在规模化生成高质量的 3D CT 和 MRI 合成数据,并配套发布了大规模开源多模态 MRI 数据集 MR-RATE,以解决医疗 AI 开发中的数据稀缺和隐私限制问题。
NVIDIA开源GPU Usage Monitor,简化Kubernetes集群GPU监控
NVIDIA发布开源项目GPU Usage Monitor,通过一个预集成的Helm Chart,将DCGM Exporter、kube-state-metrics、Prometheus和Grafana打包部署,为Kubernetes集群中的GPU资源提供开箱即用的实时监控能力。此举旨在解决AI工作负载在K8s环境中GPU利用率不透明、资源调度盲点等运营难题。
NVIDIA在COMPUTEX展示Vera Rubin NVL72等AI基础设施创新
NVIDIA在COMPUTEX 2026上获得多项最佳选择奖,其Vera Rubin NVL72机柜级AI超算、Jetson Thor边缘平台及Alpamayo自动驾驶开放平台获奖,展示了其在AI工厂、边缘推理和物理AI领域的基础设施布局。
BadHost漏洞(CVE-2026-48710):Starlette单字符绕过认证,全球AI Agent基础设施面临暴露风险
安全机构X41 D-Sec在OSTIF资助的vLLM审计中发现Starlette框架认证绕过漏洞CVE-2026-48710(BadHost)。根因:Starlette用HTTP Host头拼接重建request.url时未验证Host值合法性——注入/、?或#字符可导致request.url.path与ASGI路由的scope[path]产生解析不一致,path-based认证中间件被欺骗放行受保护资源。MCP Server特别高危:MCP规范要求/.well-known/oauth-authorization-server等Discovery端点默认公开,为攻击者提供最可靠的Host头注入路径。X41 D-Sec扫描发现生物制药临床试验数据库、企业邮箱完整访问权、AWS云拓扑、身份验证公司PII、工业设备堡垒机SSH等生产系统暴露。Starlette 1.0.1(5月21日)已修复,但3个月补丁周期(2月发现→5月发布)和间接依赖链导致大量部署仍受影响。X41评级CVSS 7.0(High),Starlette维护者评级6.5(Moderate)——分歧在于path-based auth是否为anti-pattern。
微软开源AI Agent安全开发工具RAMPART与Clarity
微软开源RAMPART与Clarity两款工具,旨在将安全实践嵌入AI Agent的开发工作流。此举标志着AI安全正从应用层防护向开发流程左移,试图在AI Agent规模化部署前建立安全基线。
AMD定义“智能代理计算机”新品类,推动AI推理本地化
AMD提出“智能代理计算机”概念,旨在通过本地化硬件(Ryzen™ AI Max处理器、Radeon™ AI PRO显卡)运行持续AI推理工作负载,以应对云API成本上升。其核心是推动AI从云端按需消费模式向本地固定成本、高吞吐量模式转移。
AMD发布AI Halo开发平台与Max PRO 400系列处理器,瞄准本地AI代理计算
AMD发布Ryzen AI Halo开发者平台和Ryzen AI Max PRO 400系列处理器,旨在为本地AI代理(Agent)应用提供开发与运行环境。新平台支持高达2000亿参数模型本地运行,并提供高达192GB统一内存,推动AI工作负载从云端向边缘设备迁移。
NVIDIA与Google Cloud深化开发者生态融合,推进AI基础设施与应用栈整合
NVIDIA与Google Cloud联合开发者社区规模超10万人,提供从JAX优化、NVIDIA Dynamo推理优化到AI水印(SynthID)的全栈学习路径。此举旨在通过整合双方底层硬件(Blackwell/Rubin GPU)、云平台(GKE, AI Hypercomputer)与软件框架(Nemotron, Gemma),加速企业级AI应用从原型到生产的落地。