Filter

×
当前筛选 清除全部
关键词: CUDA ×
21 情报总数
1/2 当前页
NVIDIA Other 强信号 2026-05-16

NVIDIA CUDA Toolkit堆溢出漏洞暴露GPU云共享模型的根本架构缺陷

Pwn2Own Berlin 2026首次纳入AI/ML类别,NVIDIA CUDA NVVM编译器堆溢出CVE-2026-12839被利用。恶意PTX代码可从GPU驱动逃逸至主机内核,云环境中实现跨租户逃逸。GPU云安全隔离依赖驱动层,此漏洞打破隔离基础假设。

Google Other 强信号 2026-05-12

Google Cloud G4 VM助力Imgix实现实时图像处理性能跃升

Google Cloud通过其G4 VM实例,为Imgix的图像处理平台提供了基于NVIDIA Blackwell GPU的AI Hypercomputer基础设施。该迁移使Imgix的中位处理延迟降低50%,单节点吞吐量提升6倍,且无需修改核心应用代码,展示了云上AI推理基础设施对实时媒体处理工作负载的变革性影响。

NVIDIA Other 强信号 2026-05-08

NVIDIA为NCCL引入Prometheus实时监控,强化AI训练可观测性

NVIDIA在NCCL 2.30中推出Prometheus模式,将GPU间通信性能指标转化为时间序列数据。这使AI训练团队能够通过Grafana仪表板实时监控和调试分布式训练性能问题,尤其是网络与NVLink混合通信场景下的瓶颈。

NVIDIA Other 强信号 2026-05-06

NVIDIA推出车载AI Box架构,将高级LLM推理作为独立ECU模块

NVIDIA发布车载AI Box架构,基于DRIVE AGX平台提供模块化AI计算单元,可将高级LLM/VLM推理能力作为独立ECU添加至现有座舱系统。该方案旨在解决车载AI对实时性、隐私和算力的严苛要求,并支持与云端AI的混合编排。

NVIDIA Other 强信号 2026-05-05

NVIDIA将cuOpt优化引擎封装为AI Agent技能,加速供应链决策

NVIDIA发布cuOpt Agent Skills,将GPU加速的决策优化引擎封装为AI Agent可调用的标准化技能。该方案允许LLM通过自然语言理解业务问题,并自动调用cuOpt进行数学建模与求解,将传统需数周的供应链优化流程缩短至秒级。

NVIDIA Other 中信号 2026-05-01

英伟达发布TensorRT for RTX插件,优化虚幻引擎AI推理性能

英伟达发布针对虚幻引擎5(UE5)的TensorRT for RTX插件,作为其Neural Network Engine(NNE)的新运行时选项。该插件通过即时编译优化,在RTX GPU上为AI后处理(如超分、去噪)任务提供比DirectML等运行时更高的推理吞吐量,展示了英伟达将高效AI推理能力嵌入主流实时图形引擎工作流的努力。

NVIDIA Other 中信号 2026-04-30

NVIDIA通过AI Agent技能库实现GPU内核跨语言自动化迁移

NVIDIA发布TileGym项目,通过构建包含17条关键规则、API映射和验证脚本的AI Agent技能库,实现了cuTile Python GPU内核向Julia(cuTile.jl)的自动化、可重复转换。此举旨在降低高性能计算生态间的迁移成本。

NVIDIA Product Launch 强信号 2026-04-14

NVIDIA发布全球首个开源量子AI模型Ising

NVIDIA发布全球首个开源量子AI模型家族Ising,包含校准模型(350亿参数VLM)和解码模型(3D CNN),性能超越行业标准2.5-3倍,校准时间从数天缩短到数小时。黄仁勋称AI成为量子机器操作系统。IonQ、Harvard、Fermi Lab等机构已采用,量子股票大涨18%。

Nokia Other 强信号 2026-04-09

诺基亚获英伟达投资,联合推出AI-RAN平台加速6G演进

诺基亚与英伟达达成战略合作,后者将投资10亿美元并联合推出基于英伟达计算平台的AI-RAN产品。该合作旨在将AI数据中心能力嵌入无线接入网,推动5G向AI原生6G网络转型,T-Mobile将成为首个部署客户。

NVIDIA Other 中信号 2026-04-03

NVIDIA优化VC-6解码器架构,提升批量AI视觉管道性能

NVIDIA通过Nsight工具分析,对其VC-6视频解码器进行架构级重构,从单图解码器转向支持批量处理的单一解码器,并优化GPU内核,显著降低批处理场景下的解码延迟,提升AI视觉管道效率。

NVIDIA Other 强信号 2026-04-03

英伟达联合谷歌优化Gemma 4,强化本地AI代理基础设施

英伟达宣布与谷歌合作,针对其RTX、DGX Spark及Jetson平台,对Gemma 4系列开源模型进行深度优化。此举旨在将高性能、多模态AI推理能力从云端扩展至边缘设备和个人工作站,为本地AI代理(Agentic AI)提供从2B到31B参数的全栈模型支持。

NVIDIA Other 中信号 2026-04-03

NVIDIA 优化 Gemma 4 模型以加速本地代理 AI

NVIDIA 与 Google 合作优化 Gemma 4 系列模型,使其能够在从边缘设备到高性能 GPU 的各种 NVIDIA 硬件上高效运行。这些模型支持多种任务,包括推理、编码和代理功能,适用于本地代理 AI 应用。

Cisco Other 中信号 2026-03-27

思科推出Nexus Hyperfabric AI方案,集成800G交换机与HGX B300 GPU

思科发布Nexus Hyperfabric AI基础设施方案,整合800G以太网交换机和NVIDIA HGX B300 GPU,提供全栈预集成或灵活的'自带'模式。该方案符合NVIDIA Cloud Partner计划,旨在简化AI基础设施部署与运维。

NVIDIA Other 强信号 2026-03-17

NVIDIA cuDF加速Spark数据处理,优化企业A/B测试工作流

NVIDIA通过cuDF GPU DataFrame库和CUDA-X库,在Google Kubernetes Engine上加速Apache Spark工作流,使Snap实现4倍性能提升和76%成本节省。该方案支持无需代码修改的Spark应用迁移,处理超10PB数据。

NVIDIA Other 中信号 2026-03-12

NVIDIA与达索系统集成虚拟孪生与AI物理模型平台

NVIDIA与达索系统合作,将达索的虚拟孪生平台与NVIDIA加速计算、AI物理开放模型及CUDA-X和Omniverse库结合。该集成通过SIMULIA软件实现基于AI的物理行为模拟,支持多行业即时预测仿真结果。

NVIDIA Other 中信号 2026-03-06

NVIDIA在CCCL库中引入浮点确定性控制层级

NVIDIA在其CUDA核心计算库(CCCL)3.1中,为CUB库的规约算法新增了单阶段API和可配置的确定性级别。用户可在“不保证”、“运行间一致”和“GPU间一致”三个级别间权衡性能与结果可复现性,并引入了基于分桶算法的可复现浮点累加器(RFA)技术。

NVIDIA Other 中信号 2026-03-04

NVIDIA将CUDA Tile编程模型扩展至Julia语言

NVIDIA通过cuTile.jl包将其CUDA Tile高级GPU编程模型引入Julia语言生态。此举旨在降低高性能GPU内核开发门槛,通过数据块抽象简化底层线程与内存管理,并保持与Python版本在语法和性能上的高度一致性。

Trend Micro Other 强信号 2026-03-03

Trend Micro发布AI安全报告,揭示AI供应链风险与模型攻击面

Trend Micro发布《AI生态系统断层线》报告,系统性地分析了AI供应链中的安全风险,包括模型训练数据污染、第三方插件漏洞以及模型窃取攻击。报告指出,企业AI应用的安全边界已从传统IT基础设施扩展至模型层和数据管道。

AMD Other 中信号 2026-03-02

AMD推出企业AI套件强化硬件软件整合

AMD发布企业AI套件,整合硬件与软件生态系统,提供从模型优化到部署的端到端工具链。该套件针对Instinct加速器和Ryzen AI处理器优化,旨在提升AI工作负载性能并降低开发复杂性。

AMD Other 强信号 2026-03-02

AMD推出AI开发者计划强化软件生态

AMD推出集中式AI开发者门户,提供ROCm软件栈、优化框架和工具支持,旨在降低开发门槛并提升其硬件性能。该计划通过预优化模型和社区支持系统性地补强AI软件生态,直接挑战NVIDIA的CUDA主导地位。