情报
AI 生成的结构化厂商动态简报
思科与AT&T深化5G SA物联网平台合作
思科与AT&T宣布深化战略合作,推出5G SA原生物联网平台,集成AT&T的5G核心网与思科移动服务平台。该平台提供网络切片、应用感知优化和本地流量疏导能力,针对高要求物联网场景如联网汽车和智慧城市。
思科定义Agentic AI时代安全架构,扩展AI Defense与SASE能力
思科宣布其AI Defense解决方案的重大更新,新增AI供应链治理和运行时保护功能,以降低Agentic AI被篡改或操纵的风险。同时,思科SASE引入AI流量检测与优化能力,旨在保障Agentic工作流的安全性和可靠性。这些更新反映了思科在AI安全与网络架构融合方向上的战略布局。
思科发布AI基础设施芯片与AgenticOps平台,强化统一架构战略
思科推出Silicon One G300芯片和AgenticOps平台,旨在优化AI集群的网络性能和任务完成时间,同时通过统一的Nexus One管理平面简化混合云环境运维。其AI Defense解决方案更新重点关注AI供应链治理和运行时保护。
OpenAI 阐述全球AI模型本地化方法
OpenAI公开其AI模型本地化技术路径,展示如何在不影响安全性的前提下,使全球共享的前沿模型适应本地语言、法律和文化要求。
OpenAI推出Codex原生AI代理,强化长期技术任务支持
OpenAI发布基于Codex的AI代理GPT-5.3-Codex,将前沿编码能力与通用推理相结合,旨在支持长期现实世界技术工作。这标志着OpenAI在专业领域AI代理方向的重要推进。
OpenAI 内部数据代理整合 GPT-5 与记忆系统实现大规模推理
OpenAI 开发了内部 AI 数据代理,融合 GPT-5、Codex 和记忆系统,能够在大规模数据集上进行推理并在几分钟内提供可靠见解。这一技术整合展示了 OpenAI 在增强 AI 推理能力和数据处理效率方面的战略方向。
OpenAI 发布欧盟经济蓝图2.0,强调通过数据与伙伴关系加速AI应用
OpenAI发布了欧盟经济蓝图2.0,旨在通过提供新数据、建立合作伙伴关系及启动新倡议,加速人工智能在欧洲的采用、技能提升和经济增长。该计划侧重于推动AI技术的广泛落地,而非发布具体的产品或技术架构。
OpenAI 披露 Codex Agent Loop 执行架构
OpenAI 发布技术解析,详细说明 Codex CLI 如何通过 Responses API 协调模型、工具、提示和性能,揭示了 AI Agent 内部执行架构的关键设计。
OpenAI 披露 PostgreSQL 扩展技术以支持 ChatGPT 高并发查询
OpenAI 公开了其如何通过副本、缓存、速率限制和工作负载隔离等技术手段,将 PostgreSQL 数据库扩展至每秒数百万查询,以支撑 ChatGPT 的高并发需求。这一技术方案展示了 AI 基础设施在数据处理层的关键优化方向。
思科以AI就绪数据中心与园区网络架构,成为麦迪逊广场花园官方技术合作伙伴
思科与麦迪逊广场花园娱乐公司达成多年合作伙伴关系,思科成为其官方合作伙伴。思科为其提供由Catalyst交换机与无线硬件、Catalyst Center网络管理平台、Identity Services Engine(ISE)以及Nexus 9000系列数据中心交换机构成的网络基础设施,旨在构建灵活、可扩展且支持未来技术的网络基础。
Check Point推出基于NVIDIA DPU的AI防火墙架构
Check Point发布AI Factory Firewall,采用NVIDIA BlueField-3 DPU实现AI工作负载安全防护。新架构将安全策略执行点下沉至DPU层,通过硬件加速实现AI流量专用检测,同时提供统一策略管理框架。
NVIDIA与SK hynix联合定义下一代AI内存,锁定HBM4与Vera Rubin架构协同
NVIDIA与SK hynix宣布多年技术合作,联合开发面向Vera Rubin、RTX Spark及Jetson Thor的下一代内存。同时,SK Telecom采用DGX全栈平台建设吉瓦级AI云,计划2027年上线。此举将SK hynix从供应商升级为联合架构定义者,强化NVIDIA在HBM及AI生态的锁定效应。
Intel携18A Xeon 6+与SambaNova RDU构建Rack Scale AI,正面挑战NVIDIA推理生态
Intel在Computex 2026推出基于18A制程的Xeon 6+处理器、与SambaNova合作的Rack Scale AI平台,以及全解耦推理服务Vector Core Compute,旨在通过CPU+RDU混合架构在智能体推理时代重新夺回数据中心核心地位,直接竞争NVIDIA的Vera Rubin NVL72。
NVIDIA RTX Spark与Nemotron-3 Ultra:端侧AI控制权从云端下沉至个人PC
NVIDIA在GTC Taipei 2026发布RTX Spark个人AI超级计算机(与联发科合作)及Nemotron-3 Ultra开源混合架构模型。RTX Spark搭载N1X芯片,提供1 PFLOPS本地AI算力,首次将大模型推理下沉至PC端,并重构软件生态。此举标志英伟达从云端GPU供应商转型为端侧AI基础设施垄断者。
微软发布季度财报日期,未披露技术架构或战略变化
微软宣布了其2025财年第三季度的财报发布日期,该信息仅为财务日程公告,未包含任何关于AI基础设施、企业网络、安全或产品战略的新技术细节或架构变化。
微软回应TRC Capital迷你收购要约,无技术架构或战略变化
微软发布声明,回应TRC Capital以低于市价发起的迷你收购要约,建议股东不要接受。该公告为常规公司财务与股东沟通,不涉及任何技术产品发布、架构演进或战略方向调整。
微软推出Phi-4系列小语言模型,强化边缘AI与多模态推理能力
微软发布Phi-4系列小型语言模型(SLM),包括5.6B参数的Phi-4-multimodal模型,支持语音、视觉和文本的多模态处理。该系列已部署至Azure AI Foundry、HuggingFace和NVIDIA API Catalog,重点优化边缘设备上的AI推理能力。
NVIDIA 200亿美元购Groq LPU:推理芯片从HBM转向片上SRAM
NVIDIA与Groq达成约200亿美元技术许可协议,获取LPU(Language Processing Unit)核心技术与团队。LPU采用230MB片上SRAM,带宽80TB/s,专为Transformer推理解码优化,替代传统GPU的HBM瓶颈,重塑AI推理芯片格局。
华为昇腾910C完成1.6万亿参数训练:国产算力首次突破MoE全流程
华为联合河套学院等机构,基于昇腾910C集群完成DeepSeek-V4-Pro(1.6万亿参数MoE架构)全参数后训练。核心数据:千卡集群稳定1500步,算力利用率30%,算子效率提升14%,全程无海外GPU依赖,标志着国产算力首次实现万亿级大模型完整训练闭环。
英伟达吞下Groq LPU:Feynman GPU融合SRAM推理单元,混合架构加速2028
英伟达通过非排他许可与逆向招安获取Groq的LPU推理技术,计划在2028年Feynman GPU中采用台积电SoIC混合键合集成大容量SRAM芯片块,实现确定性调度与80TB/s片上带宽,从纯GPU供应商向混合推理/训练平台转型。