筛选

×
当前筛选 清除全部
关键词: inference ×
142 情报总数
7/8 当前页
ARM 其他 强信号 2026-03-25

ARM Neoverse重塑AI基础设施控制层

ARM推出Neoverse系列基础设施CPU核心,专为云计算、AI和高性能计算优化,被NVIDIA、AWS、Microsoft和Google等厂商采用于其AI平台,实现性能提升和能效改进。该架构推动AI工作负载在云和边缘的高密度部署,强化安全多租户支持。

NVIDIA 其他 强信号 2026-03-24

NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区

NVIDIA将其GPU动态资源分配(DRA)驱动捐献给CNCF,使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区,并协同多家云厂商推动标准化。

ARM 其他 强信号 2026-03-24

ARM与NVIDIA推动AI工作站本地化变革

ARM与NVIDIA联合推出基于GB10 Grace Blackwell芯片的DGX Spark AI工作站系列,八家主流OEM厂商同步发布产品。该方案采用统一内存架构支持2000亿参数模型本地运行,第三方测试显示较x86方案提升41%渲染性能与3.2倍AI处理速度,实现云端工具链向边缘端无缝迁移。

Check Point 其他 强信号 2026-03-23

Check Point发布AI工厂安全蓝图,定义从GPU到LLM的全栈防护架构

Check Point发布AI工厂安全架构蓝图,提出从硬件到应用层的分层安全参考架构。该蓝图整合了NVIDIA BlueField DPU硬件加速、AI Agent安全、以及面向Kubernetes的微隔离,旨在为私有AI基础设施提供内生安全。

AMD 其他 强信号 2026-03-18

AMD与NAVER Cloud合作推进韩国主权AI基础设施建设

AMD与韩国NAVER Cloud宣布深化战略合作,旨在加速韩国主权AI基础设施建设。NAVER Cloud将扩大部署AMD EPYC“威尼斯”处理器,并获得下一代Instinct MI455X GPU的早期访问权限,双方将共同优化AI服务与软件栈。

AMD 其他 强信号 2026-03-18

AMD与三星深化合作,锁定HBM4供应并探索代工

AMD与三星签署谅解备忘录,将三星作为下一代Instinct MI455X GPU的HBM4主要供应商,并合作优化用于第六代EPYC CPU的DDR5内存。双方还将探讨三星为AMD提供先进制程代工服务的可能性。

NVIDIA 其他 强信号 2026-03-18

英伟达与电信运营商共建AI网格,重构分布式推理基础设施

英伟达与AT&T、康卡斯特等全球电信运营商合作,将现有分布式网络站点(如中心局、基站)升级为“AI网格”,旨在将AI推理能力部署到网络边缘,以降低延迟和成本。此举标志着电信网络从数据管道向分布式AI计算平台的战略转变。

HPE 其他 强信号 2026-03-17

HPE联合NVIDIA推出AI Grid,构建分布式推理统一网格

HPE在NVIDIA GTC上发布AI Grid解决方案,基于NVIDIA参考架构,旨在将分布式的AI工厂和推理集群安全连接成一个统一的智能系统。该方案帮助服务提供商大规模部署和管理边缘推理站点,以满足AI原生应用对低延迟、可预测基础设施的需求。

HPE 其他 强信号 2026-03-17

HPE与NVIDIA推出AI Grid Solution,构建AI WAN fabric

HPE宣布与NVIDIA合作推出AI Grid Solution,旨在安全扩展边缘AI。该方案将WAN转化为AI WAN fabric,连接分布式推理站点与AI工厂,提供一致策略和可预测性能。支持服务提供商从连接转向AI服务提供。

Cisco 其他 强信号 2026-03-17

Cisco与NVIDIA扩展AI工厂架构覆盖边缘和安全

Cisco宣布扩展与NVIDIA的Secure AI Factory,支持从数据中心到边缘站点的AI部署,新增安全功能如防火墙策略在DPUs和AI防御集成,提供灵活架构选择加速生产部署。

HPE 其他 强信号 2026-03-16

HPE Alletra MP X10000成为首个NVIDIA认证的企业AI对象存储平台

HPE宣布其Alletra Storage MP X10000成为首个获得NVIDIA认证的企业级AI对象存储平台。这标志着存储性能与AI工作负载的认证标准从计算层延伸至数据层,旨在解决大规模AI训练、微调和推理中的数据访问瓶颈。

NVIDIA 其他 强信号 2026-03-14

英伟达发布Cosmos世界模型套件,强化物理AI合成数据与推理能力

英伟达发布其Cosmos世界基础模型(WFM)套件的重要更新,包括Transfer 2.5、Predict 2.5和Reason 2。这些模型旨在加速生成高保真、符合物理规律的合成数据,并支持对机器人、自动驾驶等物理AI系统进行下游任务微调和推理,以解决真实世界数据稀缺的瓶颈。

Trend Micro 其他 强信号 2026-03-03

Trend Micro发布AI安全报告,揭示AI供应链风险与模型攻击面

Trend Micro发布《AI生态系统断层线》报告,系统性地分析了AI供应链中的安全风险,包括模型训练数据污染、第三方插件漏洞以及模型窃取攻击。报告指出,企业AI应用的安全边界已从传统IT基础设施扩展至模型层和数据管道。

Cisco 其他 强信号 2026-02-10

思科发布AI基础设施芯片与AgenticOps平台,强化统一架构战略

思科推出Silicon One G300芯片和AgenticOps平台,旨在优化AI集群的网络性能和任务完成时间,同时通过统一的Nexus One管理平面简化混合云环境运维。其AI Defense解决方案更新重点关注AI供应链治理和运行时保护。

Cisco 其他 强信号 2026-02-10

思科发布G300芯片与系统,定位AI Agent时代数据中心网络基础

思科推出102.4Tbps的Silicon One G300交换芯片及配套N9000/8000系统,采用液冷设计提升70%能效,支持1.6T光学模块,并升级Nexus One统一管理平面。

NVIDIA 其他 强信号 2026-01-23

NVIDIA 通过 NVFP4 量化与 TeaCache 技术将 FLUX.2 图像生成模型推理速度提升 10 倍

NVIDIA 与 Black Forest Labs 合作,针对 FLUX.2 [dev] 图像生成模型,在 Blackwell 数据中心 GPU 上应用了包括 NVFP4 4-bit 量化、Timestep Embedding Aware Caching (TeaCache)、CUDA Graphs 及多 GPU 支持在内的一系列推理优化技术。这些优化使模型在双 B200 GPU 配置下相比 H200 实现了 10.2 倍的延迟降低,并将内存占用减少超 40%,显著降低了高质量图像生成模型的部署门槛。

OpenAI 其他 中信号 2026-01-14

OpenAI 与 Cerebras 合作提升 AI 推理基础设施

OpenAI 宣布与 Cerebras 合作,新增 750MW 高速 AI 计算能力,旨在降低推理延迟并优化 ChatGPT 实时 AI 工作负载性能。这一合作凸显 OpenAI 持续投资专用 AI 硬件以支撑其大规模模型服务的战略方向。

NVIDIA 其他 强信号 2026-01-06

英伟达推出DGX Spark软件更新与NVFP4格式,强化本地AI开发

英伟达通过软件优化、新NVFP4数据格式及开源合作,大幅提升DGX Spark本地AI开发平台性能,并整合Brev云服务实现混合部署。此举将高性能AI模型运行从云端延伸至企业边缘和开发者桌面。

NVIDIA 其他 强信号 2025-11-14

NVIDIA推动将可训练神经网络直接集成至实时图形渲染管线

NVIDIA发布技术博客,详细阐述如何将可训练的神经网络模型(神经着色)直接集成到实时图形渲染管线中。此举旨在利用专用AI硬件(如Tensor Cores)提升渲染质量与性能,标志着图形计算架构从纯手工编程向数据驱动、可学习的混合模式演进。

NVIDIA 其他 强信号 2025-11-08

NVIDIA发布开源数据科学代理原型,整合Nemotron LLM与CUDA-X加速库

NVIDIA在官方博客开源了一个交互式数据科学AI代理原型。该代理使用Nemotron Nano-9B-v2作为推理引擎,通过自然语言理解用户意图,并调用基于CUDA-X库(如cuDF、cuML)的GPU加速工具层,自动化执行数据清洗、模型训练与超参数优化等任务。其模块化架构旨在实现从自然语言到高性能计算的端到端加速,据称可获得3倍至43倍的性能提升。