筛选

×
当前筛选 清除全部
关键词: NVIDIA ×
246 情报总数
3/13 当前页
Google 产品发布 强信号 2026-05-22

Google I/O 2026全面押注Agentic AI:Gemini 3.5 Flash/Omni/Antigravity 2.0/Gemini Spark密集发布

Google I/O 2026发布Gemini 3.5 Flash(4倍输出速度+前沿智能)、Gemini Omni Flash(原生多模态视频生成)、Antigravity 2.0(Agent编排桌面平台+CLI+SDK)、Gemini Spark(24/7个人AI助手)。Gemini MAU从4亿增至9亿;资本开支2026年预计1800-1900亿美元(2022年的6倍)。

NVIDIA 其他 强信号 2026-05-22

NVIDIA 以智能体工具包推动 AI 工作流从模型调用向编排平台演进

NVIDIA 通过其 NeMo Agent Toolkit 开源库,展示了一个用于量化金融信号发现的多智能体系统参考架构。该系统将传统手动、碎片化的研究流程,转变为由配置驱动、具备可观测性的自动化闭环,凸显了智能体编排层在复杂 AI 应用中的核心价值。

NVIDIA 其他 强信号 2026-05-22

NVIDIA开源GPU Usage Monitor,简化Kubernetes集群GPU监控

NVIDIA发布开源项目GPU Usage Monitor,通过一个预集成的Helm Chart,将DCGM Exporter、kube-state-metrics、Prometheus和Grafana打包部署,为Kubernetes集群中的GPU资源提供开箱即用的实时监控能力。此举旨在解决AI工作负载在K8s环境中GPU利用率不透明、资源调度盲点等运营难题。

NVIDIA 其他 强信号 2026-05-22

NVIDIA在COMPUTEX展示Vera Rubin NVL72等AI基础设施创新

NVIDIA在COMPUTEX 2026上获得多项最佳选择奖,其Vera Rubin NVL72机柜级AI超算、Jetson Thor边缘平台及Alpamayo自动驾驶开放平台获奖,展示了其在AI工厂、边缘推理和物理AI领域的基础设施布局。

Cisco 其他 强信号 2026-05-21

思科全面拥抱SONiC,提供从硬件到软件的全栈开放网络方案

思科宣布在其Cisco 8000和即将推出的N9000系列交换机上全面支持开放网络操作系统SONiC,并提供构建自有发行版和预构建镜像两种消费模式。此举旨在将思科硅芯片性能与SONiC的开放架构相结合,为AI和高性能工作负载提供可编程、可扩展的网络基础设施。

Intel 其他 强信号 2026-05-20

英特尔以集成SoC架构推动边缘AI机器人计算从独立GPU迁移

英特尔宣布其Core Ultra Series 3处理器正被多家机器人公司采用,以集成CPU、GPU、NPU的SoC架构替代昂贵、高功耗的独立GPU,用于边缘AI推理。这标志着机器人“大脑”向成本效益更高、更易部署的集成化异构计算架构转变。

NVIDIA 其他 强信号 2026-05-20

NVIDIA与Google Cloud深化开发者生态融合,推进AI基础设施与应用栈整合

NVIDIA与Google Cloud联合开发者社区规模超10万人,提供从JAX优化、NVIDIA Dynamo推理优化到AI水印(SynthID)的全栈学习路径。此举旨在通过整合双方底层硬件(Blackwell/Rubin GPU)、云平台(GKE, AI Hypercomputer)与软件框架(Nemotron, Gemma),加速企业级AI应用从原型到生产的落地。

NVIDIA 其他 强信号 2026-05-20

英伟达强调AI智能体评估,推动生产系统标准

英伟达发布技术博客,系统阐述AI智能体与基础模型评估的根本差异,提出以任务成功率、轨迹效率和工具调用准确性为核心的动态评估框架。此举旨在将AI智能体从模型能力测试转向生产系统行为验证,并推广其NeMo Agent Toolkit作为评估工具。

NVIDIA 其他 强信号 2026-05-19

NVIDIA与戴尔发布全栈AI工厂,加速企业级Agentic AI部署

NVIDIA与戴尔深化合作,推出更新版Dell AI Factory with NVIDIA,旨在为企业提供从工作站到数据中心的端到端Agentic AI推理与部署平台。该平台整合了NVIDIA Vera Rubin GPU、Vera CPU、Confidential Computing及Nemotron模型,强调安全、高性能的本地化AI基础设施,以应对激增的AI推理需求。

Google 其他 强信号 2026-05-19

Google 通过 TPU 8 与分布式训练架构强化全栈 AI 控制力

Google 在 I/O 2026 上披露其 AI 基础设施战略核心:发布专为训练和推理优化的 TPU 8t 与 8i 芯片,并实现基于 JAX 和 Pathways 的跨数据中心分布式训练。同时,其年度资本支出预计达 1800-1900 亿美元,以支撑激增的 AI 算力需求。

NVIDIA 其他 强信号 2026-05-16

NVIDIA CUDA Toolkit堆溢出漏洞暴露GPU云共享模型的根本架构缺陷

Pwn2Own Berlin 2026首次纳入AI/ML类别,NVIDIA CUDA NVVM编译器堆溢出CVE-2026-12839被利用。恶意PTX代码可从GPU驱动逃逸至主机内核,云环境中实现跨租户逃逸。GPU云安全隔离依赖驱动层,此漏洞打破隔离基础假设。

NVIDIA 其他 强信号 2026-05-15

英伟达发布Vera Rubin平台,通过软硬件协同设计解决智能体AI规模化难题

英伟达发布Vera Rubin平台,通过Vera Rubin NVL72 GPU与Groq 3 LPX LPU的异构协同,结合Dynamo编排器,旨在解决智能体AI推理在长上下文、万亿参数MoE模型下的规模化、低延迟与高吞吐挑战。

Cisco 其他 强信号 2026-05-14

思科借SRv6与MRC协议,强化其在AI基础设施网络层的核心地位

思科通过其博客强调,其主导的SRv6网络架构是支撑OpenAI等巨头发布的MRC协议的关键基础。这标志着AI超算网络正从传统ECMP向基于SRv6的确定性、应用驱动架构演进,思科试图将自身定位为这一变革的核心标准制定者和技术提供方。

NVIDIA 其他 强信号 2026-05-14

NVIDIA通过cuPyNumeric与GDS加速科学计算工作流

NVIDIA展示了其XANI工作流,利用cuPyNumeric分布式计算库与GPUDirect Storage,将量子材料X射线分析的计算时间从9个月缩短至4小时。这标志着GPU加速正从训练/推理向科学计算与实时数据处理的端到端工作流渗透。

Cisco 其他 强信号 2026-05-13

思科在ONUG 2026提出AI数据中心网络与安全融合架构

思科在ONUG 2026峰会上,围绕AI Agentic时代的数据中心,系统阐述了其融合网络与安全的AI原生基础设施蓝图。其核心是通过将安全策略(如防火墙、微分段)卸载至DPU,并利用AI驱动的运维模型,解决AI工作负载对网络性能与安全隔离的双重苛刻需求。

NVIDIA 其他 强信号 2026-05-13

英伟达联合Ineffable Intelligence,共同设计强化学习基础设施

英伟达与由AlphaGo架构师David Silver创立的Ineffable Intelligence达成工程级合作,旨在共同设计面向大规模强化学习(RL)的基础设施。双方将基于Grace Blackwell平台探索RL训练流水线,并计划适配下一代Vera Rubin平台,以应对RL对互连、内存带宽和实时服务带来的独特挑战。

NVIDIA 其他 强信号 2026-05-13

英伟达通过Hermes与Qwen 3.6推动本地AI Agent基础设施

英伟达联合Nous Research推广开源AI Agent框架Hermes,并适配阿里通义千问Qwen 3.6模型,旨在构建一个以RTX PC和DGX Spark为核心的、可靠的本地AI Agent运行环境。此举将高性能AI Agent的部署边界从云端扩展至企业边缘和个人设备。

NVIDIA 其他 强信号 2026-05-13

英伟达发布AI模型部署最佳实践,强调TensorRT与Dynamo-Triton集成

英伟达通过官方博客详细阐述了消除AI模型服务“流水线摩擦”的系统性方法,核心是推广其TensorRT优化工具与Dynamo-Triton服务平台的深度集成,旨在将模型从训练到部署的流程标准化和高效化。

Cisco 其他 强信号 2026-05-12

思科与红帽深化AI基础设施集成,推动核心到边缘的智能平台

思科在红帽峰会上展示其与红帽生态的深度集成,涵盖AI POD、统一边缘、网络即代码及安全AI工厂。通过将Ansible、Splunk、Isovalent eBPF能力嵌入OpenShift平台,旨在为企业提供从核心到边缘的、可编程且安全的AI基础设施统一控制平面。

HPE 其他 中信号 2026-05-12

HPE整合私有云与数据平台,强化AI数据就绪能力

HPE宣布其GreenLake平台的多项更新,旨在通过统一的私有云、存储和数据保护方案,帮助企业现代化基础设施并加速AI数据就绪。核心动作包括整合Kubernetes管理、统一文件与对象存储,并引入跨存储与数据保护产品的智能代理能力。