筛选

当前筛选 清除全部
NVIDIA ×
145 情报总数
1/8 当前页
NVIDIA 其他 强信号 2026-06-03

NVIDIA联合工业软件巨头推出NemoClaw,构建安全自主的AI工程师

NVIDIA联合Cadence、Dassault Systèmes、西门子等十多家工业软件厂商,发布开放蓝图NemoClaw。该框架旨在构建安全、长期运行的专业AI代理,以端到端自动化CAE/EDA等复杂工程工作流,将数周仿真时间压缩至数小时。

NVIDIA 其他 强信号 2026-06-02

GTC台北2026:DSX开源数据中心平台,同等电力多部署40%芯片

NVIDIA在GTC台北2026推出开源数据中心软件平台DSX,提供规划、部署和监控工具套件。关键优势:同等电力预算下额外部署最多40%加速芯片。黄仁勋称可零成本对整个工厂数字孪生。同时发布DGX Station for Windows,748GB统一内存、20 petaflops FP4算力,Q4 2026上市。

NVIDIA 其他 强信号 2026-06-02

GTC台北2026:Vera 88核CPU专为智能体设计,1.8倍x86性能

NVIDIA在GTC台北2026发布首款独立数据中心微处理器Vera,首次以自有CPU直接对标Intel Xeon和AMD EPYC。Vera采用88个定制Olympus Arm核心,单片mesh网络(非chiplet),核心间通信比传统CPU快50%。LPDDR5X带宽1.2TB/s,PCIe Gen6,内外带宽为同类最高性能CPU的2-3倍。智能体沙箱性能1.8倍x86。首批客户:OpenAI、Anthropic、SpaceX。Q3 2026投产,FY CPU收入目标200亿美元。标志着NVIDIA从GPU加速器厂商向全栈数据中心平台厂商的战略跃迁。

NVIDIA 其他 强信号 2026-06-02

NVIDIA联合金融巨头推动交易基础模型,重构AI架构范式

NVIDIA联合Revolut、Mastercard、Stripe等金融机构,基于其全栈AI平台(Hopper GPU, Nemotron, NeMo)推出“构建您自己的交易基础模型”开发者示例。该模型旨在通过单一Transformer架构统一处理海量交易数据,替代传统针对单一业务(如欺诈、信用评分)的孤立模型,并已通过AWS、Nebius等云平台及多家服务商进行生态化部署。

NVIDIA 其他 强信号 2026-06-02

NVIDIA通过JetPack 7.2与NemoClaw将Agentic AI控制力延伸至物理边缘

NVIDIA发布JetPack 7.2边缘AI软件栈并集成NemoClaw框架,构建了从底层Yocto OS、中间层Agent Skills到上层Agentic AI框架的三层栈。此举旨在将数据中心成熟的AI代理开发范式与编排能力系统性地下沉至Jetson边缘平台,加速物理AI代理在机器人、工业自动化等领域的规模化生产部署。

NVIDIA 其他 强信号 2026-06-01

NVIDIA GTC台北2026:DSX开源数据中心平台,同等电力多部署40%加速芯片

NVIDIA在GTC台北2026推出开源数据中心软件平台DSX,以开源模式向基础设施运营商提供规划、部署和监控完整工具套件,用户可按需选取组件。关键优势:同等电力预算下可额外部署最多40%加速芯片——对受供电容量限制的大型数据中心尤为显著。黄仁勋表示借助DSX可在不花一分钱的情况下对整个工厂进行模拟,安装任何机架之前验证性能。同时发布DGX Station for Windows高端工作站,748GB统一内存、20 petaflops FP4算力,运行万亿参数模型和数百个智能体,Q4 2026上市。

NVIDIA 其他 强信号 2026-06-01

NVIDIA GTC台北2026:Vera 88核CPU专为智能体设计,1.8倍x86性能,OpenAI/Anthropic首批部署

NVIDIA在GTC台北2026发布首款独立数据中心微处理器Vera,首次以自有CPU直接对标Intel Xeon和AMD EPYC。Vera采用88个定制Olympus Arm核心,单片mesh网络(非chiplet),核心间通信比传统CPU快50%。LPDDR5X带宽1.2TB/s,PCIe Gen6,内外带宽为同类最高性能CPU的2-3倍。智能体沙箱性能1.8倍x86。首批客户:OpenAI、Anthropic、SpaceX。Q3 2026投产,FY CPU收入目标200亿美元。标志着NVIDIA从GPU加速器厂商向全栈数据中心平台厂商的战略跃迁。

NVIDIA 其他 强信号 2026-06-01

NVIDIA借DSX平台与全球伙伴构建全栈AI云生态,定义AI工厂经济性

NVIDIA正通过其DSX平台与全球云伙伴(如CoreWeave、Firmus、Nebius)深度合作,共同构建由NVIDIA全栈技术定义的‘AI Cloud’生态系统。该生态旨在将‘AI工厂’基础设施贴近数据与用户,并引入‘每Token成本’作为核心经济性指标,以优化从训练、推理到智能体(agentic AI)的全周期工作负载。

NVIDIA 其他 强信号 2026-06-01

NVIDIA发布工厂运营蓝图,定义自主工厂管理器代理架构

NVIDIA发布Factory Operations Blueprint (FOX)参考设计,用于构建基于AI的自主工厂管理器代理。该蓝图整合NemoClaw、AI-Q Blueprint及Nemotron开放模型,旨在连接工厂异构系统、自动化AI模型训练并协调各类专业代理,实现工厂级智能决策。

NVIDIA 其他 强信号 2026-06-01

NVIDIA联合台系制造巨头,以AI平台重构制造业运营与控制层

NVIDIA联合台积电、富士康、广达等超过500家生态伙伴,在其Vera Rubin NVL72 AI基础设施生产过程中,深度应用CUDA-X、Omniverse、AI代理及物理AI技术,优化从芯片设计、工厂规划到产线运营的全流程。此举将NVIDIA的技术栈从计算加速延伸至制造运营的核心控制层。

NVIDIA 其他 强信号 2026-06-01

NVIDIA发布Vera CPU,为AI代理工作负载定义新设计标准

NVIDIA推出基于自研Olympus核心的Vera CPU,针对AI代理和强化学习工作负载中的‘工具调用-执行’循环进行架构优化。该CPU通过高单核性能、高并发及高效LPDDR5X内存子系统,旨在提升AI工厂中CPU关键路径的性能,从而增加整体AI输出吞吐量和能效。

NVIDIA 其他 强信号 2026-06-01

NVIDIA开源DSX OS,定义AI工厂全栈运营软件层

NVIDIA发布其DSX平台的软件核心DSX OS,这是一套开源、模块化的软件组件,旨在协调从芯片、系统、软件到设施(电力、冷却)的整个AI工厂堆栈。它通过DSX Exchange(MQTT通信枢纽)、MaxLPS(动态功耗管理)、Infra Controller(裸金属生命周期管理)等组件,实现IT/OT深度融合,目标是提升“每瓦特token产出”并降低token成本。

NVIDIA 其他 强信号 2026-06-01

NVIDIA RTX Spark发布:AI PC时代的开启

NVIDIA在Computex 2026正式发布RTX Spark——首款面向AI Agent时代的Windows PC超级芯片。该芯片基于TSMC 3nm工艺,整合Blackwell架构GPU(6144 CUDA核心+第五代Tensor Core,FP4精度)与20核Grace CPU,通过NVLink-C2C互联(600GB/s),提供1 petaflop AI算力和最高128GB统一LPDDR5X内存(300GB/s带宽)。笔记本最薄14mm、最轻3磅,支持本地运行1200亿参数大模型。NVIDIA与微软合作推出OpenShell运行时和Windows安全原语,Adobe正在为RTX Spark重新架构Photoshop和Premiere。首批设备秋季上市,来自ASUS、Dell、HP、Lenovo、Microsoft Surface、MSI,Acer和GIGABYTE随后跟进。预计售价$3000-4000。RTX Spark路线图延伸至2030年:2027年升级Vera CPU+Rubin GPU+LPDDR6,2029-2030年Rosa CPU+Feynman GPU。这是继2020年Apple M1之后PC行业最大的架构变革信号。

NVIDIA 其他 强信号 2026-05-30

NVIDIA 发布 DynoSim 仿真框架,将 AI 服务栈优化从硬件试错转向模拟优先

NVIDIA 推出 DynoSim,这是一个基于 Rust 的、全栈离散事件仿真框架,用于对 NVIDIA Dynamo AI 服务栈进行原子级模拟。它通过虚拟时钟和组件化事件队列,将配置搜索和算法研究从昂贵的 GPU 硬件实验转变为快速模拟验证循环,旨在高效探索服务部署的帕累托前沿。

NVIDIA 其他 强信号 2026-05-30

NVIDIA 发布容器化 AI 模型文档自动生成工具包,集成 RAG 与 NIM 应对监管

NVIDIA 推出 Model Card Generator (MCG) 工具包,一个容器化流水线,可在一分钟内自动从源代码生成符合 Model Card++ 标准的 AI 模型文档。该工具利用 NVIDIA Nemotron RAG 进行高精度信息检索,并由大语言模型(如 GPT-OSS-120B)提取和格式化内容,旨在应对欧盟 AI 法案等法规要求。

NVIDIA 其他 强信号 2026-05-29

NVIDIA将Step 3.7 Flash多模态模型深度整合至其企业AI全栈

NVIDIA宣布在其加速平台上全面支持StepFun的Step 3.7 Flash模型,这是一个1980亿参数的MoE多模态模型。通过TensorRT-LLM、vLLM进行优化推理,并通过NVIDIA NIM提供生产就绪的容器化微服务部署,同时支持基于NeMo框架的Day 0微调。

NVIDIA 产品发布 强信号 2026-05-29

NVIDIA Vera CPU交付四大AI实验室,Computex前夕N1X+硅光子学三线并发

NVIDIA于5月18日宣布Vera CPU首批交付Anthropic、OpenAI、SpaceX AI和Oracle Cloud Infrastructure,由超大规模计算副总裁Ian Buck亲自送货。Vera是NVIDIA首款专为Agent式AI设计的CPU,88颗自研Olympus核心(Arm v9.2),LPDDR5X带宽1.2TB/s,Phoronix基准测试单核超越AMD EPYC 9575F和Intel Xeon 6980P,Linux内核编译仅20秒。同日NVIDIA+微软+Arm联合发布神秘海报预告N1X笔记本处理器(Blackwell GPU+20核联发科Arm CPU+128GB统一内存),Dell/Lenovo/ASUS已准备设备。此外NVIDIA三个月内向硅光子学投资至少$65亿(Lumentum/Coherent/Marvell各$20亿+Corning $5亿+Ayer Labs E轮$5亿),黄仁勋称硅光产能需求远超全球供给,CPO 2026渗透率0.5%→2030年35%。

NVIDIA 其他 中信号 2026-05-28

NVIDIA以游戏捆绑订阅深化云游戏市场,凸显AI基础设施复用策略

NVIDIA通过GeForce NOW平台发布新游戏《007 First Light》,并将其与12个月Ultimate会员订阅捆绑销售。此举旨在利用其强大的云端RTX GPU算力(包括RTX 50系列)吸引并锁定用户,同时展示了其底层AI基础设施向消费级云游戏服务的能力复用。

NVIDIA 其他 强信号 2026-05-27

NVIDIA CUDA 13.3为C++引入Tile编程模型,抽象GPU并行与内存管理

NVIDIA在CUDA 13.3中为C++添加了CUDA Tile编程模型支持,允许开发者在现有C++代码库中使用基于tile的抽象编写GPU内核。该模型通过tensor_span和partition_view操作固定大小的数组块,自动处理块内并行性、内存移动和硬件特性利用,无需显式线程管理,并支持Nsight Compute性能剖析。

NVIDIA 其他 强信号 2026-05-27

NVIDIA CUDA 13.3 通过 Tile C++、编译器自动调优与 Python 生态巩固软件栈控制权

NVIDIA 发布 CUDA 13.3,核心动作包括将高级 CUDA Tile 编程模型扩展至 C++、正式发布稳定的 CUDA Python 1.0 并引入进程检查点等功能,以及推出 CompileIQ 编译器自动调优框架。此举旨在通过更高层级的抽象和自动化工具,进一步降低 GPU 编程门槛并提升性能。