情报
AI 生成的结构化厂商动态简报
HPE与NVIDIA推出AI Grid Solution,构建AI WAN fabric
HPE宣布与NVIDIA合作推出AI Grid Solution,旨在安全扩展边缘AI。该方案将WAN转化为AI WAN fabric,连接分布式推理站点与AI工厂,提供一致策略和可预测性能。支持服务提供商从连接转向AI服务提供。
HPE与NVIDIA深化AI工厂合作,推出全栈式超算解决方案
HPE在GTC 2026上宣布升级与NVIDIA的AI计算产品组合,推出面向大规模AI工厂和超级计算机的全栈解决方案,整合计算、GPU、网络、液冷、软件与服务,旨在提升部署效率与洞察速度。
HPE提出AI数据管道即平台,强调企业AI生产化支柱
HPE提出企业AI正从实验转向生产,其成功依赖于由数据管道、统一存储和加速计算构成的基础设施平台。该公司强调,持续性能、可预测扩展和长期成本效益是三大核心支柱,旨在解决生产环境中AI工作负载的复杂性问题。
Introducing The Anthropic Institute \ Anthropic
AnnouncementsIntroducing The Anthropic InstituteMar 11, 2026We’re launching The Anthropic Institute, a new effort to confront the most significant challenges that powerful AI will pose to our societie...
NVIDIA在CCCL库中引入浮点确定性控制层级
NVIDIA在其CUDA核心计算库(CCCL)3.1中,为CUB库的规约算法新增了单阶段API和可配置的确定性级别。用户可在“不保证”、“运行间一致”和“GPU间一致”三个级别间权衡性能与结果可复现性,并引入了基于分桶算法的可复现浮点累加器(RFA)技术。
NVIDIA将CUDA Tile编程模型扩展至Julia语言
NVIDIA通过cuTile.jl包将其CUDA Tile高级GPU编程模型引入Julia语言生态。此举旨在降低高性能GPU内核开发门槛,通过数据块抽象简化底层线程与内存管理,并保持与Python版本在语法和性能上的高度一致性。
Trend Micro发布AI安全报告,揭示AI供应链风险与模型攻击面
Trend Micro发布《AI生态系统断层线》报告,系统性地分析了AI供应链中的安全风险,包括模型训练数据污染、第三方插件漏洞以及模型窃取攻击。报告指出,企业AI应用的安全边界已从传统IT基础设施扩展至模型层和数据管道。
苹果推出AI操作系统集成架构与私有云推理基础设施
苹果发布Apple Intelligence,采用设备端与云端混合处理模型,通过Private Cloud Compute架构提供AI推理服务。该系统深度集成于操作系统层面,实现隐私保护的AI功能交付。
思科发布G300芯片与系统,定位AI Agent时代数据中心网络基础
思科推出102.4Tbps的Silicon One G300交换芯片及配套N9000/8000系统,采用液冷设计提升70%能效,支持1.6T光学模块,并升级Nexus One统一管理平面。
NVIDIA 展示 AI 驱动游戏资产管线,加速传统游戏现代化
NVIDIA 开发者博客详细介绍了《Painkiller RTX》项目如何利用其生态下的工具(如 PBRFusion、RTX Remix)和生成式AI模型,批量将数千个低分辨率纹理转换为高质量的 PBR (Physically Based Rendering) 材质。该案例展示了将 AI 自动化与艺术判断相结合的混合生产管线,显著降低了小团队进行大规模视觉资产重建的门槛。
NVIDIA 通过 NVFP4 量化与 TeaCache 技术将 FLUX.2 图像生成模型推理速度提升 10 倍
NVIDIA 与 Black Forest Labs 合作,针对 FLUX.2 [dev] 图像生成模型,在 Blackwell 数据中心 GPU 上应用了包括 NVFP4 4-bit 量化、Timestep Embedding Aware Caching (TeaCache)、CUDA Graphs 及多 GPU 支持在内的一系列推理优化技术。这些优化使模型在双 B200 GPU 配置下相比 H200 实现了 10.2 倍的延迟降低,并将内存占用减少超 40%,显著降低了高质量图像生成模型的部署门槛。
思科第二届AI峰会聚焦AI经济构建者,汇集NVIDIA、OpenAI、AWS、Google等基础设施与模型层领袖
思科宣布将于2026年2月3日举办第二届AI峰会,由CEO Chuck Robbins和首席产品官Jeetu Patel主持。峰会嘉宾阵容汇集了AI基础设施(NVIDIA、AWS、Google)、核心模型(OpenAI、Anthropic)、应用(Figma、Box)及资本(Andreessen Horowitz)等领域的决策者。议程覆盖从重塑计算、风险投资和基础设施到重新定义设计、劳动力及地缘政治的完整AI影响谱系。
OpenAI投资Merge Labs布局脑机接口
OpenAI宣布投资Merge Labs,支持开发连接生物与人工智能的脑机接口技术,旨在增强人类能力与体验。该动作显示OpenAI正探索AI与生物智能融合的新方向。
OpenAI 与 Cerebras 合作提升 AI 推理基础设施
OpenAI 宣布与 Cerebras 合作,新增 750MW 高速 AI 计算能力,旨在降低推理延迟并优化 ChatGPT 实时 AI 工作负载性能。这一合作凸显 OpenAI 持续投资专用 AI 硬件以支撑其大规模模型服务的战略方向。
趋势科技揭示Docker Desktop WSL2新型虚拟机逃逸攻击面
趋势科技发现Docker Desktop在WSL2环境下的新型虚拟机逃逸技术,攻击者可利用暴露的内部API与配置机制,从容器环境突破至宿主机执行任意代码。这暴露了开发工具链中隐藏的严重安全边界风险。
英伟达推出DGX Spark软件更新与NVFP4格式,强化本地AI开发
英伟达通过软件优化、新NVFP4数据格式及开源合作,大幅提升DGX Spark本地AI开发平台性能,并整合Brev云服务实现混合部署。此举将高性能AI模型运行从云端延伸至企业边缘和开发者桌面。
思科以AI就绪数据中心与园区网络架构,成为麦迪逊广场花园官方技术合作伙伴
思科与麦迪逊广场花园娱乐公司达成多年合作伙伴关系,思科成为其官方合作伙伴。思科为其提供由Catalyst交换机与无线硬件、Catalyst Center网络管理平台、Identity Services Engine(ISE)以及Nexus 9000系列数据中心交换机构成的网络基础设施,旨在构建灵活、可扩展且支持未来技术的网络基础。
NVIDIA推动将可训练神经网络直接集成至实时图形渲染管线
NVIDIA发布技术博客,详细阐述如何将可训练的神经网络模型(神经着色)直接集成到实时图形渲染管线中。此举旨在利用专用AI硬件(如Tensor Cores)提升渲染质量与性能,标志着图形计算架构从纯手工编程向数据驱动、可学习的混合模式演进。
NVIDIA发布开源数据科学代理原型,整合Nemotron LLM与CUDA-X加速库
NVIDIA在官方博客开源了一个交互式数据科学AI代理原型。该代理使用Nemotron Nano-9B-v2作为推理引擎,通过自然语言理解用户意图,并调用基于CUDA-X库(如cuDF、cuML)的GPU加速工具层,自动化执行数据清洗、模型训练与超参数优化等任务。其模块化架构旨在实现从自然语言到高性能计算的端到端加速,据称可获得3倍至43倍的性能提升。
Apple 通过开发者故事与教程,持续强化其端侧AI与空间计算开发生态
Apple 发布 Swift Student Challenge 获奖者故事,展示开发者如何利用 SwiftUI、Core ML(设备端机器学习框架)和空间计算技术构建应用。同时,Apple 宣布为 2026 年挑战赛提供新的开发教程,重点涵盖 SwiftUI、空间计算和机器学习。这体现了 Apple 对设备端 AI、沉浸式体验及开发者工具链的持续投入。