情报
AI 生成的结构化厂商动态简报
NVIDIA推出车载AI Box架构,将高级LLM推理作为独立ECU模块
NVIDIA发布车载AI Box架构,基于DRIVE AGX平台提供模块化AI计算单元,可将高级LLM/VLM推理能力作为独立ECU添加至现有座舱系统。该方案旨在解决车载AI对实时性、隐私和算力的严苛要求,并支持与云端AI的混合编排。
思科收购Astrix Security,强化非人身份与AI代理安全控制层
思科宣布计划收购非人身份安全公司Astrix Security,旨在将AI代理与API密钥、服务账户等非人身份的安全管理,深度整合至其身份智能平台与零信任访问方案中。此举标志着安全控制点正从传统人机交互向自动化AI代理工作负载迁移,以应对由AI代理滥用凭证引发的全新攻击面。
AMD联合戴尔展示企业AI异构计算战略
AMD在戴尔技术世界大会上强调其异构计算产品组合,旨在为不同企业AI负载匹配合适的算力,并突出硬件安全与可管理性。此举标志着AI基础设施正从通用方案转向针对具体场景的精细化部署。
微软发布AI时代网络安全责任框架,强调公私协作与漏洞管理现代化
微软发布了一份关于利用下一代AI加强全球数字生态安全的框架性文件,核心观点是AI加速漏洞发现的同时,必须同步强化响应与修复能力。文件提出了五项具体建议,强调公私协作、负责任的AI能力发布以及现代化漏洞管理流程。
英伟达通过NemoClaw与OpenClaw合作,推动企业级自主AI代理安全部署
英伟达通过NemoClaw参考实现,整合OpenShell安全运行时与Nemotron开源模型,为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战,将AI基础设施控制点向本地、安全、可审计的架构迁移。
NVIDIA通过AI Agent技能库实现GPU内核跨语言自动化迁移
NVIDIA发布TileGym项目,通过构建包含17条关键规则、API映射和验证脚本的AI Agent技能库,实现了cuTile Python GPU内核向Julia(cuTile.jl)的自动化、可重复转换。此举旨在降低高性能计算生态间的迁移成本。
思科开源AI模型血缘工具包,瞄准AI供应链安全治理层
思科发布开源工具Model Provenance Kit,通过分析模型元数据、分词器及权重信号,生成唯一指纹并比对,以技术手段验证AI模型的血缘关系与完整性,旨在应对模型供应链中存在的篡改、伪造及合规风险。
AMD提出AI基础设施网络架构新范式:从无损网络转向智能端点
AMD发布博客,提出构建大规模AI基础设施的七个关键问题,核心观点是传统无损以太网或InfiniBand架构存在成本与复杂性瓶颈。其主张将网络智能和可靠性功能从昂贵的专用交换机转移到智能网卡(NIC)上,在标准(可能有损)以太网上实现可靠传输,以降低总拥有成本并简化运营。
AMD与Liquid AI探讨从芯片到系统的高效AI架构
AMD CTO与Liquid AI CEO探讨AI架构演进,强调效率是AI从云端向边缘和终端设备扩展的关键。双方认为,通过从芯片到系统的协同设计,可实现低功耗、高响应性的AI推理,支持持续运行的智能体与多模型协同。
英伟达发布Nemotron 3 Nano Omni统一多模态模型,瞄准AI Agent感知层
英伟达发布开源多模态模型Nemotron 3 Nano Omni,采用30B-A3B混合MoE架构,将视觉、音频与语言处理统一于单一模型,旨在作为AI Agent的“眼睛和耳朵”。该模型声称能消除多模型协作的延迟与上下文碎片化问题,在保持交互性的同时实现高达9倍的吞吐量提升,降低AI Agent的部署与推理成本。
Anthropic联合创意软件巨头发布Claude连接器,构建AI原生创作生态
Anthropic联合Adobe、Autodesk、Blender等创意软件巨头,发布一系列Claude连接器,将AI深度集成至专业创作工具链。此举旨在通过自然语言接口、代码生成与流程自动化,重塑创意工作流程,并基于MCP等开放协议促进生态互操作性。
AMD将边缘AI架构扩展至太空,定义轨道计算新范式
AMD CTO提出将地面边缘AI的“性能功耗比”与“任务关键可靠性”核心原则,应用于太空计算场景。公司正通过异构计算、开放软件栈和模块化系统设计,为从卫星在轨智能到未来轨道数据中心提供可重复构建的平台基础。
AMD发布IDC白皮书,强调AI PC是企业部署Agentic AI的关键基础设施
AMD发布IDC白皮书,指出超过80%的企业正在规划、试点或部署AI PC,以支持Agentic AI的规模化应用。报告强调,高性能NPU和端侧AI处理对于实现实时、安全的工作流至关重要,标志着企业AI基础设施正从云端向端侧扩展。
思科通过产品冲刺优化开发者门户,聚焦AI代理工作流数据
思科DevNet团队分享了其通过产品冲刺方法优化开发者门户和内容的具体实践,核心是建立可衡量的产品-市场匹配指标。值得注意的是,其新增的分析事件专门追踪开发者内容如何被AI编码助手或代理使用,例如复制Markdown、下载OpenAPI/SDK/MCP文档等行为。
NVIDIA与Google Cloud深化合作,构建面向AI工厂与物理AI的云基础设施
NVIDIA与Google Cloud宣布合作升级,推出基于Vera Rubin和Blackwell GPU的新实例,旨在构建支持近百万GPU集群的“AI工厂”,并整合Gemini、Nemotron等模型平台,加速从智能体到物理AI(如机器人、数字孪生)的生产级部署。
思科发布AI Agent安全扫描器,将安全控制点前移至IDE
思科发布针对集成开发环境(IDE)的AI Agent安全扫描器扩展,旨在识别和防范AI开发工具链中的新攻击面。该工具通过静态扫描MCP服务器配置、Agent技能定义,并结合代码生成时安全规则引导和运行时文件完整性监控,为开发者提供本地化、多层次的AI Agent安全防护。
NVIDIA联手Adobe与WPP,以OpenShell为核心构建企业级AI代理安全架构
NVIDIA深化与Adobe、WPP的战略合作,旨在将智能AI代理置于企业营销运营的核心。其关键动作是推出并强调NVIDIA OpenShell安全运行时,为运行多步工作流的AI代理提供基于策略的、可审计的隔离执行环境。这标志着从单纯的功能性AI向受控、可信的企业级AI代理架构演进。
英伟达推动AI基础设施评估指标从FLOPS转向每token成本
英伟达提出应将“每token成本”而非“每美元FLOPS”作为评估AI基础设施的核心经济指标。这标志着从衡量计算输入转向衡量商业输出,涉及硬件、软件、网络的全栈优化,以降低企业AI推理的总拥有成本。
NVIDIA发布Slinky slurm-operator,在Kubernetes上融合HPC与AI调度
NVIDIA通过其收购的SchedMD,推出开源项目Slinky的slurm-operator,使HPC领域主流的Slurm作业调度系统能够以原生方式在Kubernetes上运行。该方案将Slurm组件容器化,通过CRD管理集群生命周期,实现了Slurm与Kubernetes生态在监控、自动扩缩容、节点维护及多节点NVLink拓扑感知等方面的双向状态同步。
AMD发布突破性MLPerf 6.0推理结果,展示多节点扩展与多模态能力
AMD在MLPerf Inference 6.0基准测试中,凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型(Wan-2.2-t2v)的快速启用,以及广泛的合作伙伴生态系统复现结果。