情报
AI 生成的结构化厂商动态简报
微软通过Hackathon模式将AI洞察转化为垂直行业SaaS解决方案
微软车库项目RushReady展示了其通过与Ecolab合作,利用餐厅运营数据和AI模型为快餐店经理提供实时决策指导的SaaS产品。该项目证明了微软从内部创新到行业解决方案的商业化路径,并强调了针对特定场景、可自适应学习的数据模型的重要性。
谷歌发布Gemma 4开源模型,推动AI代理本地化部署
谷歌发布Gemma 4开源模型系列,采用Apache 2.0许可,并首次引入MoE架构,旨在将高性能AI代理能力直接部署于移动设备和边缘硬件。此举显著降低了复杂AI工作流对云端集群的依赖,为本地化、私有化AI应用开辟新路径。
AMD与OpenAI将MRC网络协议贡献给OCP,推进AI网络规模化
AMD与OpenAI、微软等合作,将专为大规模AI训练设计的网络协议MRC(多路径可靠连接)贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者,其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证,旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。
谷歌通过Agent Platform展示AI原生应用架构范式
谷歌云客户案例展示了基于Gemini Enterprise Agent Platform构建的“流式意识转任务”应用。该架构利用原生音频流、主动工具调用和会话恢复等API,实现了从语音到结构化任务的无缝、低延迟转换,并设计了面向未来语音功能的提供商无关抽象层。
AMD联合OpenAI发布下一代AI训练网络传输协议MRC
AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection(MRC)协议规范,旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制,提升网络带宽利用率和训练任务弹性。
NVIDIA推出车载AI Box架构,将高级LLM推理作为独立ECU模块
NVIDIA发布车载AI Box架构,基于DRIVE AGX平台提供模块化AI计算单元,可将高级LLM/VLM推理能力作为独立ECU添加至现有座舱系统。该方案旨在解决车载AI对实时性、隐私和算力的严苛要求,并支持与云端AI的混合编排。
AMD联合戴尔展示企业AI异构计算战略
AMD在戴尔技术世界大会上强调其异构计算产品组合,旨在为不同企业AI负载匹配合适的算力,并突出硬件安全与可管理性。此举标志着AI基础设施正从通用方案转向针对具体场景的精细化部署。
谷歌发布企业级AI代理平台与第八代TPU,押注“代理时代”
谷歌在Cloud Next '26上推出Gemini企业级代理平台,用于构建和管理自主AI代理工作流,并发布专为代理AI设计的第八代TPU芯片。同时,谷歌还发布了Gemma 4开源模型和Deep Research Max等高级分析工具。
英伟达通过NemoClaw与OpenClaw合作,推动企业级自主AI代理安全部署
英伟达通过NemoClaw参考实现,整合OpenShell安全运行时与Nemotron开源模型,为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战,将AI基础设施控制点向本地、安全、可审计的架构迁移。
AMD提出AI基础设施网络架构新范式:从无损网络转向智能端点
AMD发布博客,提出构建大规模AI基础设施的七个关键问题,核心观点是传统无损以太网或InfiniBand架构存在成本与复杂性瓶颈。其主张将网络智能和可靠性功能从昂贵的专用交换机转移到智能网卡(NIC)上,在标准(可能有损)以太网上实现可靠传输,以降低总拥有成本并简化运营。
英特尔与ChatPPT合作推出混合AI PC版,推动AI工作负载本地化
英特尔与AI应用ChatPPT合作,利用其AI Super Builder技术推出混合AI PC版。该版本将部分AI工作负载(如格式调整)从云端卸载至本地PC处理,降低了50%的云成本并提升了32%的用户使用时长,同时增强了数据隐私。
谷歌将Gemini AI助手集成至车载平台,替换Google Assistant
谷歌宣布将Gemini AI助手通过软件更新方式,集成至搭载Google built-in的车载平台,取代原有的Google Assistant。该更新将向现有和新车辆推送,初期支持美国英语用户,旨在提供更自然的对话式交互,并集成车辆手册和实时信息以控制导航、音乐和车辆设置。
AMD与Liquid AI探讨从芯片到系统的高效AI架构
AMD CTO与Liquid AI CEO探讨AI架构演进,强调效率是AI从云端向边缘和终端设备扩展的关键。双方认为,通过从芯片到系统的协同设计,可实现低功耗、高响应性的AI推理,支持持续运行的智能体与多模型协同。
谷歌财报揭示企业AI堆栈战略,推动代理与推理基础设施增长
谷歌Q1财报显示其全栈AI战略成效显著,云业务因AI产品需求激增,收入增长63%。关键信号包括:推出Gemini Enterprise Agent Platform,代理数据处理量激增(330个客户年处理超万亿tokens),并计划将TPU硬件直接部署至客户数据中心。
AMD将边缘AI架构扩展至太空,定义轨道计算新范式
AMD CTO提出将地面边缘AI的“性能功耗比”与“任务关键可靠性”核心原则,应用于太空计算场景。公司正通过异构计算、开放软件栈和模块化系统设计,为从卫星在轨智能到未来轨道数据中心提供可重复构建的平台基础。
AMD发布IDC白皮书,强调AI PC是企业部署Agentic AI的关键基础设施
AMD发布IDC白皮书,指出超过80%的企业正在规划、试点或部署AI PC,以支持Agentic AI的规模化应用。报告强调,高性能NPU和端侧AI处理对于实现实时、安全的工作流至关重要,标志着企业AI基础设施正从云端向端侧扩展。
微软推出“前沿成功”框架,将智能体AI与企业工作流深度融合
微软在香港AI巡展上推出“前沿成功”框架,旨在帮助企业将智能体AI从实验阶段转向规模化运营。该框架通过整合Copilot、Work IQ和Agent 365等组件,强调在深度工作上下文和安全治理基础上实现AI价值。
思科发布AI Agent安全扫描器,将安全控制点前移至IDE
思科发布针对集成开发环境(IDE)的AI Agent安全扫描器扩展,旨在识别和防范AI开发工具链中的新攻击面。该工具通过静态扫描MCP服务器配置、Agent技能定义,并结合代码生成时安全规则引导和运行时文件完整性监控,为开发者提供本地化、多层次的AI Agent安全防护。
思科研究揭示多模态提示注入攻击新风险与防御信号
思科AI安全研究团队发布报告,系统评估了针对视觉语言模型的排版式提示注入攻击。研究发现,字体大小、模糊、旋转等视觉变换显著影响攻击成功率,并首次提出文本-图像嵌入距离可作为轻量级、模型无关的风险信号,为构建多模态AI安全防御层提供了新思路。
思科通过新防火墙架构应对AI基础设施的规模化安全挑战
思科发布Secure Firewall 6100系列,通过软件数据平面重构和硬件优化,旨在为AI数据中心、云和电信环境提供高性能、高能效的安全防护。该方案强调在加密流量激增和东西向流量增长背景下,实现安全与性能的平衡,并与Hybrid Mesh Firewall架构集成,提供跨混合环境的一致性策略。