Compute - AI基础设施情报搜索

NVIDIA 其他 2026-07-16

NVIDIA推出Jetson Thor T3000/T2000，以Blackwell架构压降边缘AI推理成本壁垒

NVIDIA发布基于Thor架构的Jetson T3000和T2000模块。T3000集成Blackwell GPU、8核Neoverse CPU，以T5000一半的功耗提供865 FP4 TFLOPS算力，并搭配新的Jetson Agent Skills自动化内存优化工具，旨在推动人形机器人和边缘AI应用的大规模部署。

Google 其他 2026-07-15

Google BigQuery深度集成Gemini Enterprise，重塑AI治理控制权

Google Cloud推出方案，将Gemini Enterprise应用的遥测数据（用户提示、模型响应、活动日志）实时路由到BigQuery。利用BigQuery的AI分析能力（Conversational Analytics、自动Schema生成），实现大规模AI部署的自动化审计、合规治理和业务洞察，强化数据驱动的AI可观测性。

Intel 其他 2026-07-12

Intel押注3D堆叠AI芯片 18A-PT+Foveros Direct 3D+EMIB-T全栈整合

...

Meta 其他 2026-07-12

Meta斥资91.7亿美元建加拿大AI数据中心，自研芯片Iris量产启动MTIA四代路线图

Meta宣布在加拿大建设1GW AI数据中心，总投资91.7亿美元。同时披露首款自研AI芯片Iris将于9月量产，标志着MTIA四代路线图启动。Meta计划2027年达到14GW算力，自研芯片以6个月迭代节奏挑战NVIDIA年度更新，旨在削弱对GPU的依赖。

Anthropic 其他 2026-07-12

Anthropic锁定Broadcom 3.5GW定制TPU，AI算力从GPU转向专用ASIC

Broadcom Q2 FY2026财报披露与Anthropic的3.5GW TPU算力协议，2027年上线。该协议标志着Anthropic从依赖通用GPU转向大规模部署定制TPU（ASIC），同时OpenAI、Meta等也有类似GW级承诺，AI算力基础设施正经历从通用芯片向专用ASIC的根本性转变。

AMD 其他 2026-07-10

Towards Feature Complete Triton Support in JAX-Triton â ROCm Blogs

...

NVIDIA 其他 2026-07-09

SambaNova完成11亿美元融资估值110亿美元：推理芯片新格局确立

...

NVIDIA 其他 2026-07-07

NVIDIA Vera CPU获Perplexity/OpenAI/Anthropic/Oracle采用 AI Agent性能验证1.5-1.9x加速

...

NVIDIA 其他 2026-07-07

NVIDIA发布Vera CPU：以最大单线程性能重构AI Agent生态

NVIDIA推出Vera CPU，专为AI Agent工作负载设计，采用Olympus核心，提供比x86高1.8倍的持续每核心性能。该CPU与NVIDIA GPU和BlueField统一架构，旨在构建AI工厂的统一计算平台，挑战现有x86 CPU生态。

NVIDIA 其他 2026-07-07

AI Innovators Adopt NVIDIA Vera — Why Max Single-Threaded CPU at Scale Matters

...

Anthropic 其他 2026-07-06

Anthropic Australia 1.4GW data center

...

NVIDIA 其他 2026-07-02

NVIDIA推AI计算合伙人计划：用信用兜底+收入分成锁定云厂商，转型算力央行

NVIDIA推出AI计算合伙人计划，通过收入分成与信用兜底机制，从硬件销售转向持续性服务收益。首批项目包括澳洲Sharon AI的4万张GB300芯片和印尼Firmus的17万张GPU，总规模二十万级高端芯片。NVIDIA正成为AI算力的“中央银行”，压缩云中间商空间。

Qualcomm 其他 2026-07-02

高通携Dragonfly C1000与HBC技术杀入AI推理，直指Nvidia HBM壁垒

高通发布Dragonfly路线图，包括自研Oryon核心的C1000 CPU和搭载HBC近存计算技术的AI300推理加速器，Meta和Microsoft已签约。目标是通过降低TCO和突破memory wall，在AI推理市场形成差异化，避开与Nvidia在训练端的正面竞争。

Cloudflare 其他 2026-07-01

Announcing the Monetization Gateway: charge for any resource behind Cloudflare via x402

...

Huawei 其他 2026-06-25

华为MWC上海2026力推Token计费：从字节管道转向AI价值交付，运营商需重构网络架构

华为在MWC上海2026提出运营商应从基于字节的计费转向基于AI Token的计费，并展示了AI推理加速方案，将长序列推理吞吐量提升372%。同时强调U6 GHz频段对AI可穿戴设备上行链路的关键作用，推动5G-A网络成为AI计算交付基础设施。

Qualcomm 其他 2026-06-25

高通HBC Gen 1堆叠LPDDR实现133TB/s带宽，颠覆HBM生态

高通发布HBC Gen 1，通过3D堆叠LPDDR内存并集成计算die，实现133 TB/s带宽和6倍能效提升。该技术计划2027年中随AI250加速器出货，意图替代传统HBM，但供应链和物理实现仍存疑。

Anthropic 其他 2026-06-25

Anthropic指控阿里系发起史上最大AI蒸馏攻击，暴露API安全致命漏洞

Anthropic向美国参议员致信，指控与阿里相关的运营商通过约2.5万个欺诈账户发起2880万次模型交换，系统性地提取Claude前沿能力。此事件凸显AI模型API面临的新型大规模蒸馏威胁，迫使行业重新评估推理端点安全与使用监控。

OpenAI 其他 2026-06-25

Oracle国防生态第三批：离线AI边缘部署成为军事实战新范式

Oracle在布鲁塞尔国防科技峰会上宣布国防生态系统第三批成员，新增10家公司。同时，Whitespace的Saga AI系统已在英国皇家海军HIGHMAST行动中部署在Oracle Roving Edge Devices上，实现完全离线的分类AI工作负载处理，标志着主权边缘AI从概念走向实战。

Huawei 其他 2026-06-25

华为推AI原生网络架构：从字节计费转向Token货币化，UCM缓存突破长上下文瓶颈

华为在MWC上海2026发布AI原生网络架构，集成服务-网络-计算，实现从流量中心到智能中心的转变。核心是Unified Cache Manager（UCM）将KV缓存扩展至PB级外存，在GLM-5.1模型128K序列长度下实现372% token吞吐量提升。同时推出token货币化框架，允许运营商按AI推理容量计费，并引入agentic运营模式。

Google Cloud 其他 2026-06-25

Google Cloud推多代理自主运维，控制点从人类转向AI验证架构

Google Cloud提出“agent-scale data management”，通过多代理验证架构减少人工监督，并与Nokia部署6个Gemini代理实现网络自治。同时Amazon计划商业化Trainium芯片，加剧AI硬件竞争，挑战Google TPU和Nvidia GPU。

情报

筛选

NVIDIA推出Jetson Thor T3000/T2000，以Blackwell架构压降边缘AI推理成本壁垒

Google BigQuery深度集成Gemini Enterprise，重塑AI治理控制权

Intel押注3D堆叠AI芯片 18A-PT+Foveros Direct 3D+EMIB-T全栈整合

Meta斥资91.7亿美元建加拿大AI数据中心，自研芯片Iris量产启动MTIA四代路线图

Anthropic锁定Broadcom 3.5GW定制TPU，AI算力从GPU转向专用ASIC

Towards Feature Complete Triton Support in JAX-Triton â ROCm Blogs

SambaNova完成11亿美元融资估值110亿美元：推理芯片新格局确立

NVIDIA Vera CPU获Perplexity/OpenAI/Anthropic/Oracle采用 AI Agent性能验证1.5-1.9x加速

NVIDIA发布Vera CPU：以最大单线程性能重构AI Agent生态

AI Innovators Adopt NVIDIA Vera — Why Max Single-Threaded CPU at Scale Matters

Anthropic Australia 1.4GW data center

NVIDIA推AI计算合伙人计划：用信用兜底+收入分成锁定云厂商，转型算力央行

高通携Dragonfly C1000与HBC技术杀入AI推理，直指Nvidia HBM壁垒

Announcing the Monetization Gateway: charge for any resource behind Cloudflare via x402

华为MWC上海2026力推Token计费：从字节管道转向AI价值交付，运营商需重构网络架构

高通HBC Gen 1堆叠LPDDR实现133TB/s带宽，颠覆HBM生态

Anthropic指控阿里系发起史上最大AI蒸馏攻击，暴露API安全致命漏洞

Oracle国防生态第三批：离线AI边缘部署成为军事实战新范式

华为推AI原生网络架构：从字节计费转向Token货币化，UCM缓存突破长上下文瓶颈

Google Cloud推多代理自主运维，控制点从人类转向AI验证架构

Towards Feature Complete Triton Support in JAX-Triton â ROCm Blogs