Reports
AI-generated structured vendor updates
Intel CEO:AI推理时代CPU/GPU配比从1:8向1:1演进,Multi-Agent三大刚性需求
Intel CEO指出AI推理时代CPU/GPU配比从1:8向1:1演进,驱动因素为Multi-Agent三大刚性需求:Agent编排与调度、工具调用与API网关、推理卸载与本地执行。Intel三路CPU同时量产(Granite Rapids-D边缘/Aerial嵌入式/Xeon 6主流),非巧合而是系统性应对。Agent编排/工具调用/推理卸载构成CPU新增长极。企业AI基础设施团队需立即重新评估CPU/GPU配比,服务器采购需适配Agent工作负载特征。
英特尔以集成SoC架构推动边缘AI机器人计算从独立GPU迁移
英特尔宣布其Core Ultra Series 3处理器正被多家机器人公司采用,以集成CPU、GPU、NPU的SoC架构替代昂贵、高功耗的独立GPU,用于边缘AI推理。这标志着机器人“大脑”向成本效益更高、更易部署的集成化异构计算架构转变。
AMD定义“智能代理计算机”新品类,推动AI推理本地化
AMD提出“智能代理计算机”概念,旨在通过本地化硬件(Ryzen™ AI Max处理器、Radeon™ AI PRO显卡)运行持续AI推理工作负载,以应对云API成本上升。其核心是推动AI从云端按需消费模式向本地固定成本、高吞吐量模式转移。
AMD发布AI Halo开发平台与Max PRO 400系列处理器,瞄准本地AI代理计算
AMD发布Ryzen AI Halo开发者平台和Ryzen AI Max PRO 400系列处理器,旨在为本地AI代理(Agent)应用提供开发与运行环境。新平台支持高达2000亿参数模型本地运行,并提供高达192GB统一内存,推动AI工作负载从云端向边缘设备迁移。
NVIDIA与Google Cloud深化开发者生态融合,推进AI基础设施与应用栈整合
NVIDIA与Google Cloud联合开发者社区规模超10万人,提供从JAX优化、NVIDIA Dynamo推理优化到AI水印(SynthID)的全栈学习路径。此举旨在通过整合双方底层硬件(Blackwell/Rubin GPU)、云平台(GKE, AI Hypercomputer)与软件框架(Nemotron, Gemma),加速企业级AI应用从原型到生产的落地。
谷歌发布统一AI Agent开发工具包,整合本地与云端部署
谷歌在I/O大会上发布统一AI Agent开发工具包,包含Antigravity 2.0和Managed Agents API,旨在通过共享的A2A协议层,为开发者提供从本地快速原型到安全合规云部署的完整路径。该举措将Gemini Enterprise Agent Platform能力延伸至本地开发工具,提供从低代码到完全代码控制的多层次选择。
NVIDIA与戴尔发布全栈AI工厂,加速企业级Agentic AI部署
NVIDIA与戴尔深化合作,推出更新版Dell AI Factory with NVIDIA,旨在为企业提供从工作站到数据中心的端到端Agentic AI推理与部署平台。该平台整合了NVIDIA Vera Rubin GPU、Vera CPU、Confidential Computing及Nemotron模型,强调安全、高性能的本地化AI基础设施,以应对激增的AI推理需求。
微软开源Conductor:零Token成本的确定性AI Agent编排
微软在开源峰会上发布Conductor,一个用于多智能体AI工作流的开源编排工具。其核心在于通过YAML定义工作流,实现确定性的智能体间路由,并使用Jinja2模板处理条件分支,整个编排层不消耗任何LLM Token。
谷歌发布企业数据向AI Agent演进的五层架构蓝图
谷歌技术博客提出从静态API到基于MCP协议的自主工作流,共五个数据架构演进场景,旨在为企业构建支持AI Agent的“数据层”。这标志着数据访问模式正从人工开发向由AI驱动的、标准化的动态交互范式转变。
英伟达发布Vera Rubin平台,通过软硬件协同设计解决智能体AI规模化难题
英伟达发布Vera Rubin平台,通过Vera Rubin NVL72 GPU与Groq 3 LPX LPU的异构协同,结合Dynamo编排器,旨在解决智能体AI推理在长上下文、万亿参数MoE模型下的规模化、低延迟与高吞吐挑战。
微软发布多模型智能体安全系统,将AI安全从检测转向治理执行
微软推出名为MDASH的多模型智能体安全系统,整合超100个专业智能体,在CyberGym基准测试中取得领先成绩。该系统已用于提前发现并修复16个漏洞,标志着AI安全正从辅助工具演变为具备自主推理与验证能力的运行时架构。
思科与红帽深化AI基础设施集成,推动核心到边缘的智能平台
思科在红帽峰会上展示其与红帽生态的深度集成,涵盖AI POD、统一边缘、网络即代码及安全AI工厂。通过将Ansible、Splunk、Isovalent eBPF能力嵌入OpenShift平台,旨在为企业提供从核心到边缘的、可编程且安全的AI基础设施统一控制平面。
AMD联合清华开源项目,展示AI教育多智能体架构的端云协同部署
AMD与清华大学OpenMAIC团队合作,将多智能体交互式AI课堂框架部署在其ROCm软件栈上。该方案利用Instinct GPU进行云端课程内容生成,通过Ryzen AI PC和Lemonade本地服务器处理实时、低延迟的课堂交互,实现基于统一软件栈的端云协同架构。
微软Copilot Studio更新:强化AI Agent治理与智能工作流
微软在Copilot Studio中推出多项更新,重点强化AI Agent的集中治理、成本可见性及智能工作流能力。通过Agent 365控制平面、工作流内嵌Agent节点及业务应用集成,旨在将孤立的自动化转变为可信、可扩展的智能系统。
Google揭示AI驱动攻击产业化:从漏洞发现到自主执行
Google威胁情报团队报告,攻击者正将生成式AI大规模应用于对抗性工作流,首次确认AI辅助开发的零日漏洞利用,并观察到AI用于增强恶意软件混淆、自主攻击编排及供应链攻击。这标志着AI在攻击生命周期中的角色从实验性工具转变为工业化引擎。
谷歌通过Agent Platform展示AI原生应用架构范式
谷歌云客户案例展示了基于Gemini Enterprise Agent Platform构建的“流式意识转任务”应用。该架构利用原生音频流、主动工具调用和会话恢复等API,实现了从语音到结构化任务的无缝、低延迟转换,并设计了面向未来语音功能的提供商无关抽象层。
NVIDIA推出车载AI Box架构,将高级LLM推理作为独立ECU模块
NVIDIA发布车载AI Box架构,基于DRIVE AGX平台提供模块化AI计算单元,可将高级LLM/VLM推理能力作为独立ECU添加至现有座舱系统。该方案旨在解决车载AI对实时性、隐私和算力的严苛要求,并支持与云端AI的混合编排。
NVIDIA提出面向智能体系统的“极端协同设计”基础设施栈
NVIDIA发布技术博客,系统阐述AI智能体(Agent)工作负载对基础设施的颠覆性需求,并提出其‘极端协同设计’(Extreme Co-Design)技术栈与Vera Rubin平台作为解决方案。核心观点是传统单处理器架构无法满足智能体在长上下文、高缓存命中率和低延迟交互方面的苛刻要求,必须通过计算、网络、存储的跨层优化来重塑AI基础设施。
思科阐述AI Agent框架如何重塑网络运维架构
思科通过博客详细阐述了AI Agentic框架在网络工程中的应用,提出从聊天机器人到多步工作流编排的演进路径。其核心在于将人类专业知识编码为‘技能’文件,通过MCP协议连接基础设施API,并在关键步骤设置人工审批点,实现从任务执行到流程编排的角色转变。
思科分享企业AI助手实战模式,强调确定性安全与引导式交互
思科基于其客户体验部门AI助手的18个月实战经验,提炼出决定企业AI系统成败的非显性模式。核心包括:通过确定性代码而非LLM提示词执行RBAC、主动解决企业术语歧义、减少澄清式交互以提升效率,以及基于系统能力提供引导式后续问题。