GPU - AI基础设施情报搜索

Google 其他 2026-07-09

Google Gemini 3.5 Pro架构重写：200万Token上下文引爆AI模型军备竞赛

Google DeepMind宣布7月17日发布Gemini 3.5 Pro，采用从头重建的预训练架构而非迭代升级，以解决数学推理、SVG生成和图像质量三大短板。模型将具备200万Token上下文窗口、Deep Think推理层和多步骤自主工作流能力，但官方规格尚未确认。

NVIDIA 其他 2026-07-09

SambaNova完成11亿美元融资估值110亿美元：推理芯片新格局确立

...

NVIDIA 其他 2026-07-08

NVIDIA发布Rigel CPU核心：单线程性能成Agentic AI新控制点

NVIDIA首次披露Rosa CPU架构，采用自研Rigel核心（Arm v9.2），专为Agentic AI工作负载优化单线程性能，配套Feynman GPU（1.6nm，50 PFLOPS）于2028年推出。该战略将CPU从核心数量竞赛转向串行延迟优化，直接威胁AMD EPYC和Intel至强数据中心基本盘。

NVIDIA 其他 2026-07-07

NVIDIA Vera CPU获Perplexity/OpenAI/Anthropic/Oracle采用 AI Agent性能验证1.5-1.9x加速

...

NVIDIA 其他 2026-07-07

NVIDIA发布Vera CPU：以最大单线程性能重构AI Agent生态

NVIDIA推出Vera CPU，专为AI Agent工作负载设计，采用Olympus核心，提供比x86高1.8倍的持续每核心性能。该CPU与NVIDIA GPU和BlueField统一架构，旨在构建AI工厂的统一计算平台，挑战现有x86 CPU生态。

NVIDIA 其他 2026-07-07

AI Innovators Adopt NVIDIA Vera — Why Max Single-Threaded CPU at Scale Matters

...

Cisco 其他 2026-07-07

思科用Silicon One与Hypershield锁死AI数据中心安全控制平面

思科发布面向AI数据中心的下一代安全方案，将Splunk SIEM与Silicon One 51.2Tbps芯片深度绑定，通过Hypershield架构将安全策略下沉至网络边缘。此举旨在将安全控制平面从独立设备转移至其专有ASIC与管理平台，形成硬件锁定。

MediaTek 其他 2026-07-07

MediaTek联手阿里云，天玑平台端侧部署通义千问小模型

MediaTek与阿里云合作，在天玑9300/8300移动平台上完成通义千问大模型小尺寸版本的端侧部署，支持离线多轮对话。此举旨在通过NPU优化和SDK整合，抢占端侧AI推理控制权，直面高通竞争。

Amazon 其他 2026-07-07

AWS上调Trainium3 ASIC出货量，加速自研芯片生态对抗NVIDIA

亚马逊AWS通知供应链上调2026年Q3基于自研Trainium3芯片的ASIC服务器出货量20-30%。此举显示AWS对其自研AI芯片信心增强，旨在降低对NVIDIA GPU依赖，并推动AI基础设施自主化。同时，AWS与OpenAI宣布合作开发Stateful Runtime Environment，通过Bedrock提供服务。

NVIDIA 其他 2026-07-07

英伟达否认Kyber NVL144延期，但78层PCB工艺瓶颈暴露AI硬件物理极限

英伟达官方否认Kyber NVL144机架延期至2028年的报道，但SemiAnalysis披露的78层超高密度PCB中板制造瓶颈及Rubin Ultra取消，揭示了下一代AI集群在信号完整性与物理制造上的硬性天花板，为AMD与Google留下战略窗口。

Amazon 其他 2026-07-06

AWS上调Trainium 3出货量，自研AI芯片对NVIDIA GPU替代加速

据供应链消息，亚马逊AWS通知供应商将2026年Q3的Trainium 3出货量上调20-30%。此举表明AWS对其自研AI芯片的信心，旨在降低对NVIDIA GPU的依赖，并凭借成本与能效优势抢占云端AI训练市场。

NVIDIA 其他 2026-07-06

NVIDIA Kyber NVL144延迟至2028年：PCB中板制造瓶颈暴露AI规模扩展隐形天花板

半导体研究机构SemiAnalysis披露，NVIDIA下一代机架级AI架构Kyber NVL144因78层正交背板（PCB中板）制造工艺挑战延迟超12个月至2028年。过渡方案NVL72x2因运维负担被取消，4芯片版Rubin Ultra也已取消，NVIDIA在规模扩展域出现产品空白期。

Anthropic 其他 2026-07-06

Anthropic启动自研AI芯片，三星2nm代工，算力自主战略加速

Anthropic正式启动自研AI芯片研发，并与三星洽谈2nm代工合作。此举旨在降低对NVIDIA GPU的依赖，优化推理成本，并在IPO前强化技术护城河。加入OpenAI、Google等自研芯片行列，标志AI算力从软件竞赛转向硬件圈地。

AMD 其他 2026-07-06

AMD亮出Zen 6/7与MI400/500路线图，以HBM4和2nm向NVIDIA Rubin发起总攻

AMD在2026年财务分析师日上公布Zen 6/7 CPU和MI400/500 GPU路线图，采用台积电2nm制程和HBM4内存。MI400系列内存容量达432GB，带宽19.6TB/s，FP4算力40PFLOPs，直接对标NVIDIA Vera Rubin架构，意图通过年度迭代和高性能指标打破AI市场垄断。

Google Cloud 其他 2026-07-06

Google Cloud推Blackwell GPU机密VM与开源Prompt加密SDK，重塑AI安全边界

Google Cloud升级机密计算产品线，推出基于Blackwell GPU的机密虚拟机（Confidential G4 VMs预览版）和开源Prompt Encryption SDK，同时升级Confidential Space，引入Intel Trust Authority认证和Hopper GPU支持，以应对TEE漏洞CVE-2026-33697，强化AI推理与跨机构联合训练的数据保护。

NVIDIA 其他 2026-07-04

英伟达RTX 5080公版显卡将在BW2026限量发售，售价8299元

...

Anthropic 其他 2026-07-04

Anthropic与三星洽谈2nm AI芯片代工，意在打破NVIDIA CUDA控制

Anthropic正在与三星洽谈采用2nm工艺及先进封装技术定制AI芯片，并已招募OpenAI芯片核心工程师。此举旨在减少对NVIDIA GPU的依赖，掌握底层基础设施主动权，标志着AI模型公司向芯片架构控制层发起冲击。

AMD 其他 2026-07-04

AMD通知AIB合作伙伴上调GPU核心与GDDR捆绑套料出货价约10%

...

OpenAI 其他 2026-07-03

OpenAI通过系统优化将推理成本砍半，数百GPU支撑ChatGPT海量请求

OpenAI通过模型量化（FP16→INT4/INT8）、KV-Cache优化、动态批处理与投机解码等系统底层技术，将AI推理成本降低50%以上，仅用数百张NVIDIA GPU支撑ChatGPT未登录用户流量。推理毛利率从38%跃升至65%，实现接近盈亏平衡。

NVIDIA 其他 2026-07-02

NVIDIA推AI计算合伙人计划：用信用兜底+收入分成锁定云厂商，转型算力央行

NVIDIA推出AI计算合伙人计划，通过收入分成与信用兜底机制，从硬件销售转向持续性服务收益。首批项目包括澳洲Sharon AI的4万张GB300芯片和印尼Firmus的17万张GPU，总规模二十万级高端芯片。NVIDIA正成为AI算力的“中央银行”，压缩云中间商空间。

情报

筛选

Google Gemini 3.5 Pro架构重写：200万Token上下文引爆AI模型军备竞赛

SambaNova完成11亿美元融资估值110亿美元：推理芯片新格局确立

NVIDIA发布Rigel CPU核心：单线程性能成Agentic AI新控制点

NVIDIA Vera CPU获Perplexity/OpenAI/Anthropic/Oracle采用 AI Agent性能验证1.5-1.9x加速

NVIDIA发布Vera CPU：以最大单线程性能重构AI Agent生态

AI Innovators Adopt NVIDIA Vera — Why Max Single-Threaded CPU at Scale Matters

思科用Silicon One与Hypershield锁死AI数据中心安全控制平面

MediaTek联手阿里云，天玑平台端侧部署通义千问小模型

AWS上调Trainium3 ASIC出货量，加速自研芯片生态对抗NVIDIA

英伟达否认Kyber NVL144延期，但78层PCB工艺瓶颈暴露AI硬件物理极限

AWS上调Trainium 3出货量，自研AI芯片对NVIDIA GPU替代加速

NVIDIA Kyber NVL144延迟至2028年：PCB中板制造瓶颈暴露AI规模扩展隐形天花板

Anthropic启动自研AI芯片，三星2nm代工，算力自主战略加速

AMD亮出Zen 6/7与MI400/500路线图，以HBM4和2nm向NVIDIA Rubin发起总攻

Google Cloud推Blackwell GPU机密VM与开源Prompt加密SDK，重塑AI安全边界

英伟达RTX 5080公版显卡将在BW2026限量发售，售价8299元

Anthropic与三星洽谈2nm AI芯片代工，意在打破NVIDIA CUDA控制

AMD通知AIB合作伙伴上调GPU核心与GDDR捆绑套料出货价约10%

OpenAI通过系统优化将推理成本砍半，数百GPU支撑ChatGPT海量请求

NVIDIA推AI计算合伙人计划：用信用兜底+收入分成锁定云厂商，转型算力央行