情报
AI 生成的结构化厂商动态简报
思科扩展零信任安全至AI代理生态
思科在RSA 2026宣布针对AI代理的安全创新,扩展Zero Trust Access至非人类身份,引入agentic IAM在Duo、MCP策略执行于Secure Access SSE,并推出AI Defense: Explorer Edition自助测试工具及DefenseClaw开源框架,以自动化安全部署。
英伟达与电信运营商共建AI网格,重构分布式推理基础设施
英伟达与AT&T、康卡斯特等全球电信运营商合作,将现有分布式网络站点(如中心局、基站)升级为“AI网格”,旨在将AI推理能力部署到网络边缘,以降低延迟和成本。此举标志着电信网络从数据管道向分布式AI计算平台的战略转变。
HPE报告揭示攻击者商业模式AI化
HPE Threat Labs发布报告,显示网络攻击者采用企业化运营模式,利用自动化和生成式AI加速攻击。基于2025年全球威胁活动分析,强调防御需整合AI和零信任架构。
Cisco与NVIDIA扩展AI工厂架构覆盖边缘和安全
Cisco宣布扩展与NVIDIA的Secure AI Factory,支持从数据中心到边缘站点的AI部署,新增安全功能如防火墙策略在DPUs和AI防御集成,提供灵活架构选择加速生产部署。
HPE提出AI数据管道即平台,强调企业AI生产化支柱
HPE提出企业AI正从实验转向生产,其成功依赖于由数据管道、统一存储和加速计算构成的基础设施平台。该公司强调,持续性能、可预测扩展和长期成本效益是三大核心支柱,旨在解决生产环境中AI工作负载的复杂性问题。
OpenAI 展示企业级 ChatGPT 规模化部署案例
OpenAI 展示了德国足球甲级联赛俱乐部如何规模化部署 ChatGPT,提升效率、创造力和知识管理。案例强调从试点到规模化应用的转变,而非技术细节。
NVIDIA将CUDA Tile编程模型扩展至Julia语言
NVIDIA通过cuTile.jl包将其CUDA Tile高级GPU编程模型引入Julia语言生态。此举旨在降低高性能GPU内核开发门槛,通过数据块抽象简化底层线程与内存管理,并保持与Python版本在语法和性能上的高度一致性。
Trend Micro发布AI安全报告,揭示AI供应链风险与模型攻击面
Trend Micro发布《AI生态系统断层线》报告,系统性地分析了AI供应链中的安全风险,包括模型训练数据污染、第三方插件漏洞以及模型窃取攻击。报告指出,企业AI应用的安全边界已从传统IT基础设施扩展至模型层和数据管道。
AMD发布FSR Redstone SDK强化AI驱动图形生态
AMD通过GPUOpen平台发布FSR Redstone SDK,集成ML超分辨率、帧生成等神经渲染技术。该工具降低开发者使用AMD硬件加速AI图形处理的门槛,旨在扩大FSR生态系统影响力。
思科发布G300芯片与系统,定位AI Agent时代数据中心网络基础
思科推出102.4Tbps的Silicon One G300交换芯片及配套N9000/8000系统,采用液冷设计提升70%能效,支持1.6T光学模块,并升级Nexus One统一管理平面。
NVIDIA 展示 AI 驱动游戏资产管线,加速传统游戏现代化
NVIDIA 开发者博客详细介绍了《Painkiller RTX》项目如何利用其生态下的工具(如 PBRFusion、RTX Remix)和生成式AI模型,批量将数千个低分辨率纹理转换为高质量的 PBR (Physically Based Rendering) 材质。该案例展示了将 AI 自动化与艺术判断相结合的混合生产管线,显著降低了小团队进行大规模视觉资产重建的门槛。
NVIDIA 通过 NVFP4 量化与 TeaCache 技术将 FLUX.2 图像生成模型推理速度提升 10 倍
NVIDIA 与 Black Forest Labs 合作,针对 FLUX.2 [dev] 图像生成模型,在 Blackwell 数据中心 GPU 上应用了包括 NVFP4 4-bit 量化、Timestep Embedding Aware Caching (TeaCache)、CUDA Graphs 及多 GPU 支持在内的一系列推理优化技术。这些优化使模型在双 B200 GPU 配置下相比 H200 实现了 10.2 倍的延迟降低,并将内存占用减少超 40%,显著降低了高质量图像生成模型的部署门槛。
OpenAI启动国内AI供应链强化计划
OpenAI发布新的RFP,旨在通过加速本土制造、创造就业和扩展AI基础设施来加强美国AI供应链。
英伟达推出DGX Spark软件更新与NVFP4格式,强化本地AI开发
英伟达通过软件优化、新NVFP4数据格式及开源合作,大幅提升DGX Spark本地AI开发平台性能,并整合Brev云服务实现混合部署。此举将高性能AI模型运行从云端延伸至企业边缘和开发者桌面。
NVIDIA发布开源数据科学代理原型,整合Nemotron LLM与CUDA-X加速库
NVIDIA在官方博客开源了一个交互式数据科学AI代理原型。该代理使用Nemotron Nano-9B-v2作为推理引擎,通过自然语言理解用户意图,并调用基于CUDA-X库(如cuDF、cuML)的GPU加速工具层,自动化执行数据清洗、模型训练与超参数优化等任务。其模块化架构旨在实现从自然语言到高性能计算的端到端加速,据称可获得3倍至43倍的性能提升。
博世与高通深化合作,将ADAS平台与座舱计算整合至单一SoC
博世与高通宣布扩大战略合作,将联合开发基于高通Snapdragon Ride平台的量产ADAS解决方案,并利用Snapdragon Ride Flex SoC将座舱与辅助驾驶功能整合至单一芯片。此举旨在为车企提供从分散式到集中式计算架构的清晰迁移路径,以降低系统复杂性和成本。
Google Cloud推出MCP与Apigee集成及Agentic Platform,推动企业API向AI Agent化演进
Google Cloud宣布Apigee Model Context Protocol (MCP)正式可用,并推出Agentic Platform,旨在将传统企业API转化为可被AI Agent安全、规模化调用的工具。此举结合了API治理、安全层与AI推理基础设施,为企业从API驱动转向Agent驱动架构提供了核心平台能力。