Reports
AI-generated structured vendor updates
Build 2026:Office 365 Agent Mode发布,多Agent跨文档协作
微软在Build 2026发布Office 365 Copilot Agent Mode,6月下旬向M365订阅用户推出。多个持久化AI Agent同时运行在Word、Excel、Teams和Outlook,每个agent维护独立上下文、权限和记忆。Multi-agent canvas拖拽串联agent。Agent以命名参与者身份加入Teams频道。底层混合GPT-5.5-turbo和Phi-4-mini。自定义Agent Store Q4 2026开放。
AMD联合教育组织发起全国性青少年AI与工程挑战赛
AMD与Hack Club、NASA及GitHub Education合作,启动“Stardance”全国性暑期工程挑战赛。该项目面向13-18岁青少年,鼓励他们利用公开数据集和开发工具,构建从AI应用到游戏、硬件原型在内的实际项目,并计划在AMD Advancing AI大会期间举办线下黑客松。
NVIDIA发布工厂运营蓝图,定义自主工厂管理器代理架构
NVIDIA发布Factory Operations Blueprint (FOX)参考设计,用于构建基于AI的自主工厂管理器代理。该蓝图整合NemoClaw、AI-Q Blueprint及Nemotron开放模型,旨在连接工厂异构系统、自动化AI模型训练并协调各类专业代理,实现工厂级智能决策。
英特尔推出统一硬件-软件堆栈,瞄准物理AI机器人规模化部署
英特尔宣布其Series 3处理器已获得130多个边缘AI与机器人设计项目,并推出开源框架OpenVINO Physical AI。该组合旨在解决机器人从实验模型到规模化生产部署的碎片化挑战,通过统一的硬件-软件堆栈降低总拥有成本。
AMD 以 EPYC 4005 与紧凑型系统重塑零售边缘基础设施
AMD 通过其 EPYC 4005 系列 CPU,与 Supermicro 等合作伙伴推出专为零售边缘设计的紧凑型服务器平台。这些系统强调在有限空间和功耗下的高性能(DDR5, PCIe Gen5)、远程管理(BMC)与硬件安全(TPM),旨在将数据中心级能力下沉至门店,实现工作负载整合与集中化运维。
Intel CEO:AI推理时代CPU/GPU配比从1:8向1:1演进,Multi-Agent三大刚性需求
Intel CEO指出AI推理时代CPU/GPU配比从1:8向1:1演进,驱动因素为Multi-Agent三大刚性需求:Agent编排与调度、工具调用与API网关、推理卸载与本地执行。Intel三路CPU同时量产(Granite Rapids-D边缘/Aerial嵌入式/Xeon 6主流),非巧合而是系统性应对。Agent编排/工具调用/推理卸载构成CPU新增长极。企业AI基础设施团队需立即重新评估CPU/GPU配比,服务器采购需适配Agent工作负载特征。
NVIDIA 以智能体工具包推动 AI 工作流从模型调用向编排平台演进
NVIDIA 通过其 NeMo Agent Toolkit 开源库,展示了一个用于量化金融信号发现的多智能体系统参考架构。该系统将传统手动、碎片化的研究流程,转变为由配置驱动、具备可观测性的自动化闭环,凸显了智能体编排层在复杂 AI 应用中的核心价值。
英特尔以集成SoC架构推动边缘AI机器人计算从独立GPU迁移
英特尔宣布其Core Ultra Series 3处理器正被多家机器人公司采用,以集成CPU、GPU、NPU的SoC架构替代昂贵、高功耗的独立GPU,用于边缘AI推理。这标志着机器人“大脑”向成本效益更高、更易部署的集成化异构计算架构转变。
AMD定义“智能代理计算机”新品类,推动AI推理本地化
AMD提出“智能代理计算机”概念,旨在通过本地化硬件(Ryzen™ AI Max处理器、Radeon™ AI PRO显卡)运行持续AI推理工作负载,以应对云API成本上升。其核心是推动AI从云端按需消费模式向本地固定成本、高吞吐量模式转移。
AMD发布AI Halo开发平台与Max PRO 400系列处理器,瞄准本地AI代理计算
AMD发布Ryzen AI Halo开发者平台和Ryzen AI Max PRO 400系列处理器,旨在为本地AI代理(Agent)应用提供开发与运行环境。新平台支持高达2000亿参数模型本地运行,并提供高达192GB统一内存,推动AI工作负载从云端向边缘设备迁移。
NVIDIA与Google Cloud深化开发者生态融合,推进AI基础设施与应用栈整合
NVIDIA与Google Cloud联合开发者社区规模超10万人,提供从JAX优化、NVIDIA Dynamo推理优化到AI水印(SynthID)的全栈学习路径。此举旨在通过整合双方底层硬件(Blackwell/Rubin GPU)、云平台(GKE, AI Hypercomputer)与软件框架(Nemotron, Gemma),加速企业级AI应用从原型到生产的落地。
谷歌发布统一AI Agent开发工具包,整合本地与云端部署
谷歌在I/O大会上发布统一AI Agent开发工具包,包含Antigravity 2.0和Managed Agents API,旨在通过共享的A2A协议层,为开发者提供从本地快速原型到安全合规云部署的完整路径。该举措将Gemini Enterprise Agent Platform能力延伸至本地开发工具,提供从低代码到完全代码控制的多层次选择。
NVIDIA与戴尔发布全栈AI工厂,加速企业级Agentic AI部署
NVIDIA与戴尔深化合作,推出更新版Dell AI Factory with NVIDIA,旨在为企业提供从工作站到数据中心的端到端Agentic AI推理与部署平台。该平台整合了NVIDIA Vera Rubin GPU、Vera CPU、Confidential Computing及Nemotron模型,强调安全、高性能的本地化AI基础设施,以应对激增的AI推理需求。
微软开源Conductor:零Token成本的确定性AI Agent编排
微软在开源峰会上发布Conductor,一个用于多智能体AI工作流的开源编排工具。其核心在于通过YAML定义工作流,实现确定性的智能体间路由,并使用Jinja2模板处理条件分支,整个编排层不消耗任何LLM Token。
谷歌发布企业数据向AI Agent演进的五层架构蓝图
谷歌技术博客提出从静态API到基于MCP协议的自主工作流,共五个数据架构演进场景,旨在为企业构建支持AI Agent的“数据层”。这标志着数据访问模式正从人工开发向由AI驱动的、标准化的动态交互范式转变。
英伟达发布Vera Rubin平台,通过软硬件协同设计解决智能体AI规模化难题
英伟达发布Vera Rubin平台,通过Vera Rubin NVL72 GPU与Groq 3 LPX LPU的异构协同,结合Dynamo编排器,旨在解决智能体AI推理在长上下文、万亿参数MoE模型下的规模化、低延迟与高吞吐挑战。
微软发布多模型智能体安全系统,将AI安全从检测转向治理执行
微软推出名为MDASH的多模型智能体安全系统,整合超100个专业智能体,在CyberGym基准测试中取得领先成绩。该系统已用于提前发现并修复16个漏洞,标志着AI安全正从辅助工具演变为具备自主推理与验证能力的运行时架构。
思科与红帽深化AI基础设施集成,推动核心到边缘的智能平台
思科在红帽峰会上展示其与红帽生态的深度集成,涵盖AI POD、统一边缘、网络即代码及安全AI工厂。通过将Ansible、Splunk、Isovalent eBPF能力嵌入OpenShift平台,旨在为企业提供从核心到边缘的、可编程且安全的AI基础设施统一控制平面。
AMD联合清华开源项目,展示AI教育多智能体架构的端云协同部署
AMD与清华大学OpenMAIC团队合作,将多智能体交互式AI课堂框架部署在其ROCm软件栈上。该方案利用Instinct GPU进行云端课程内容生成,通过Ryzen AI PC和Lemonade本地服务器处理实时、低延迟的课堂交互,实现基于统一软件栈的端云协同架构。
微软Copilot Studio更新:强化AI Agent治理与智能工作流
微软在Copilot Studio中推出多项更新,重点强化AI Agent的集中治理、成本可见性及智能工作流能力。通过Agent 365控制平面、工作流内嵌Agent节点及业务应用集成,旨在将孤立的自动化转变为可信、可扩展的智能系统。