NVIDIA - AI基础设施情报搜索

Apple 其他 2026-07-10

PrismML 1-bit压缩技术突破：270亿参数Qwen模型4GB内完整运行于手机端

PrismML实现270亿参数稠密大模型压缩至4GB，在iPhone 17 Pro上全量激活运行。采用原生1-bit技术（权重仅{-1, +1}），压缩比超92%，推理速度提升8倍，能耗降低75-80%。显著区别于Apple稀疏架构方案，有望重塑端侧AI部署范式。

Amazon 其他 2026-07-10

AWS Trainium 3对外销售：自研AI芯片挑战NVIDIA霸权

AWS正式对外销售第三代自研AI训练芯片Trainium 3，采用台积电3nm制程，单芯片算力达2.52 PFLOPS。Anthropic、Uber为首批客户，此举直接挑战NVIDIA主导地位，标志着AWS从云服务商向芯片供应商的战略延伸。

AMD 其他 2026-07-10

Towards Feature Complete Triton Support in JAX-Triton â ROCm Blogs

...

NVIDIA 其他 2026-07-09

SambaNova完成11亿美元融资估值110亿美元：推理芯片新格局确立

...

NVIDIA 其他 2026-07-08

NVIDIA发布Rigel CPU核心：单线程性能成Agentic AI新控制点

NVIDIA首次披露Rosa CPU架构，采用自研Rigel核心（Arm v9.2），专为Agentic AI工作负载优化单线程性能，配套Feynman GPU（1.6nm，50 PFLOPS）于2028年推出。该战略将CPU从核心数量竞赛转向串行延迟优化，直接威胁AMD EPYC和Intel至强数据中心基本盘。

NVIDIA 其他 2026-07-07

NVIDIA Vera CPU获Perplexity/OpenAI/Anthropic/Oracle采用 AI Agent性能验证1.5-1.9x加速

...

NVIDIA 其他 2026-07-07

NVIDIA发布Vera CPU：以最大单线程性能重构AI Agent生态

NVIDIA推出Vera CPU，专为AI Agent工作负载设计，采用Olympus核心，提供比x86高1.8倍的持续每核心性能。该CPU与NVIDIA GPU和BlueField统一架构，旨在构建AI工厂的统一计算平台，挑战现有x86 CPU生态。

NVIDIA 其他 2026-07-07

AI Innovators Adopt NVIDIA Vera — Why Max Single-Threaded CPU at Scale Matters

...

Anthropic 其他 2026-07-07

Anthropic企业AI采用首超OpenAI 300亿年化收入运行率确认

...

NVIDIA 其他 2026-07-07

英伟达否认Kyber NVL144延期，但78层PCB工艺瓶颈暴露AI硬件物理极限

英伟达官方否认Kyber NVL144机架延期至2028年的报道，但SemiAnalysis披露的78层超高密度PCB中板制造瓶颈及Rubin Ultra取消，揭示了下一代AI集群在信号完整性与物理制造上的硬性天花板，为AMD与Google留下战略窗口。

Amazon 其他 2026-07-06

AWS上调Trainium 3出货量，自研AI芯片对NVIDIA GPU替代加速

据供应链消息，亚马逊AWS通知供应商将2026年Q3的Trainium 3出货量上调20-30%。此举表明AWS对其自研AI芯片的信心，旨在降低对NVIDIA GPU的依赖，并凭借成本与能效优势抢占云端AI训练市场。

NVIDIA 其他 2026-07-06

NVIDIA Kyber NVL144延迟至2028年：PCB中板制造瓶颈暴露AI规模扩展隐形天花板

半导体研究机构SemiAnalysis披露，NVIDIA下一代机架级AI架构Kyber NVL144因78层正交背板（PCB中板）制造工艺挑战延迟超12个月至2028年。过渡方案NVL72x2因运维负担被取消，4芯片版Rubin Ultra也已取消，NVIDIA在规模扩展域出现产品空白期。

Anthropic 其他 2026-07-06

Anthropic启动自研AI芯片，三星2nm代工，算力自主战略加速

Anthropic正式启动自研AI芯片研发，并与三星洽谈2nm代工合作。此举旨在降低对NVIDIA GPU的依赖，优化推理成本，并在IPO前强化技术护城河。加入OpenAI、Google等自研芯片行列，标志AI算力从软件竞赛转向硬件圈地。

AMD 其他 2026-07-06

AMD亮出Zen 6/7与MI400/500路线图，以HBM4和2nm向NVIDIA Rubin发起总攻

AMD在2026年财务分析师日上公布Zen 6/7 CPU和MI400/500 GPU路线图，采用台积电2nm制程和HBM4内存。MI400系列内存容量达432GB，带宽19.6TB/s，FP4算力40PFLOPs，直接对标NVIDIA Vera Rubin架构，意图通过年度迭代和高性能指标打破AI市场垄断。

Anthropic 其他 2026-07-05

Anthropic启动自研AI芯片：软硬一体化锁定推理成本控制权

Anthropic发布Claude Sonnet 5的同时，被曝启动自研AI芯片计划，采用三星代工。此举旨在降低对NVIDIA的依赖，控制长期推理成本，标志着Anthropic从纯软件公司向软硬一体化基础设施企业转型。

OpenAI 其他 2026-07-05

OpenAI解除Azure独家锁定：模型交付控制权从微软转移至多云

OpenAI与微软于2026年4月修订合作，取消Azure独家授权和容量承诺，允许OpenAI在任何云平台服务客户。微软保留优先购买权，收入分成仅限其平台流量。此举源于GPT-5.1推理需求激增（近3 exaflops）及FTC反垄断调查压力。

NVIDIA 其他 2026-07-04

NVIDIA Vera Rubin定档2026年7月出货，AI算力迭代但架构未变

NVIDIA确认其下一代AI计算平台Vera Rubin将于2026年7月启动出货，面向微软、谷歌等大型云厂商。该平台采用先进制程，旨在提升AI训练与推理性能，是继Hopper、Blackwell之后的又一迭代产品，但未引入根本性架构变革。

NVIDIA 其他 2026-07-04

英伟达RTX 5080公版显卡将在BW2026限量发售，售价8299元

...

OpenAI 其他 2026-07-03

OpenAI通过系统优化将推理成本砍半，数百GPU支撑ChatGPT海量请求

OpenAI通过模型量化（FP16→INT4/INT8）、KV-Cache优化、动态批处理与投机解码等系统底层技术，将AI推理成本降低50%以上，仅用数百张NVIDIA GPU支撑ChatGPT未登录用户流量。推理毛利率从38%跃升至65%，实现接近盈亏平衡。

NVIDIA 其他 2026-07-02

NVIDIA推AI计算合伙人计划：用信用兜底+收入分成锁定云厂商，转型算力央行

NVIDIA推出AI计算合伙人计划，通过收入分成与信用兜底机制，从硬件销售转向持续性服务收益。首批项目包括澳洲Sharon AI的4万张GB300芯片和印尼Firmus的17万张GPU，总规模二十万级高端芯片。NVIDIA正成为AI算力的“中央银行”，压缩云中间商空间。

情报

筛选

PrismML 1-bit压缩技术突破：270亿参数Qwen模型4GB内完整运行于手机端

AWS Trainium 3对外销售：自研AI芯片挑战NVIDIA霸权

Towards Feature Complete Triton Support in JAX-Triton â ROCm Blogs

SambaNova完成11亿美元融资估值110亿美元：推理芯片新格局确立

NVIDIA发布Rigel CPU核心：单线程性能成Agentic AI新控制点

NVIDIA Vera CPU获Perplexity/OpenAI/Anthropic/Oracle采用 AI Agent性能验证1.5-1.9x加速

NVIDIA发布Vera CPU：以最大单线程性能重构AI Agent生态

AI Innovators Adopt NVIDIA Vera — Why Max Single-Threaded CPU at Scale Matters

Anthropic企业AI采用首超OpenAI 300亿年化收入运行率确认

英伟达否认Kyber NVL144延期，但78层PCB工艺瓶颈暴露AI硬件物理极限

AWS上调Trainium 3出货量，自研AI芯片对NVIDIA GPU替代加速

NVIDIA Kyber NVL144延迟至2028年：PCB中板制造瓶颈暴露AI规模扩展隐形天花板

Anthropic启动自研AI芯片，三星2nm代工，算力自主战略加速

AMD亮出Zen 6/7与MI400/500路线图，以HBM4和2nm向NVIDIA Rubin发起总攻

Anthropic启动自研AI芯片：软硬一体化锁定推理成本控制权

OpenAI解除Azure独家锁定：模型交付控制权从微软转移至多云

NVIDIA Vera Rubin定档2026年7月出货，AI算力迭代但架构未变

英伟达RTX 5080公版显卡将在BW2026限量发售，售价8299元

OpenAI通过系统优化将推理成本砍半，数百GPU支撑ChatGPT海量请求

NVIDIA推AI计算合伙人计划：用信用兜底+收入分成锁定云厂商，转型算力央行

Towards Feature Complete Triton Support in JAX-Triton â ROCm Blogs