TPU - AI基础设施情报搜索

NVIDIA 其他 2026-07-16

NVIDIA+Nokia联盟打破RAN生态：GPU加速AI RAN 2027年商用

NVIDIA与Nokia联合开发AI RAN技术，利用NVIDIA GPU加速基带处理，通过AI优化波束赋形和频谱管理，目标2028年频谱效率翻倍。该合作标志着电信RAN从专用硬件向GPU通用计算和AI软件定义的重大转型，预计2027年商用部署。

Intel 其他 2026-07-15

英特尔18A良率突破85% 获NVIDIA等大单挑战台积电代工地位

英特尔宣布其18A工艺良率从65%提升至85%，接近台积电N2水平，并已获得NVIDIA、AMD、OpenAI等多家巨头代工订单。其EMIB先进封装良率也达98%，用于NVIDIA Feynman GPU、谷歌TPU等产品。这标志着英特尔代工业务取得实质性突破，可能改变AI芯片制造格局。

Google 其他 2026-07-15

Google BigQuery深度集成Gemini Enterprise，重塑AI治理控制权

Google Cloud推出方案，将Gemini Enterprise应用的遥测数据（用户提示、模型响应、活动日志）实时路由到BigQuery。利用BigQuery的AI分析能力（Conversational Analytics、自动Schema生成），实现大规模AI部署的自动化审计、合规治理和业务洞察，强化数据驱动的AI可观测性。

Meta 其他 2026-07-14

Meta斥资500亿美元扩建5GW数据中心，以Local-First模式重构AI基础设施生态

Meta将路易斯安那州Hyperion数据中心扩建至5GW容量，总投资从100亿美元跃升至500亿美元。通过与Entergy合作自建10座发电设施和240英里输电线，并采用合资与融资模式，Meta正在开创AI基础设施的Local-First时代，彻底改变数据中心与能源、资本的协作方式。

TSMC 其他 2026-07-13

TSMC CoWoS产能2027年冲击20万片，从GPU专属转向CPU/ASIC三驱动

TSMC规划CoWoS月产能2027年达20万片，供需缺口从20%收敛至10%。客户结构从NVIDIA GPU独大转向GPU+AI服务器CPU+自研ASIC三驱动，MediaTek ARM服务器CPU封装量翻倍。CoPoS面板级封装2027年中试产，为后CoWoS时代铺垫。

Other 其他 2026-07-12

WhiteFiber联合DriveNets实现111.2Tbps跨DC AI Fabric，突破单点电力约束

WhiteFiber公布Project Redwood，联合DriveNets以太网AI fabric（FSE、VOQ、深缓冲）、WEKA存储和NVIDIA H200 GPU，实现跨83公里111.2 Tbps带宽、0.9ms延迟的AI集群，将地理分离的GPU集群视为单一逻辑超级集群，计划Q3 2026商业化。

Microsoft 其他 2026-07-12

微软接手OpenAI北极数据中心，AI算力基础设施控制权转移

微软租赁挪威北极圈数据中心，部署3万颗NVIDIA Vera Rubin芯片，填补OpenAI退出的算力空缺。OpenAI将2030年基建支出从$140B大幅下修至$60B，战略收缩。微软在AI算力军备竞赛中已超越OpenAI，并形成地理冗余优势。

Anthropic 其他 2026-07-12

Anthropic锁定Broadcom 3.5GW定制TPU，AI算力从GPU转向专用ASIC

Broadcom Q2 FY2026财报披露与Anthropic的3.5GW TPU算力协议，2027年上线。该协议标志着Anthropic从依赖通用GPU转向大规模部署定制TPU（ASIC），同时OpenAI、Meta等也有类似GW级承诺，AI算力基础设施正经历从通用芯片向专用ASIC的根本性转变。

Amazon 其他 2026-07-10

AWS Trainium 3对外销售：自研AI芯片挑战NVIDIA霸权

AWS正式对外销售第三代自研AI训练芯片Trainium 3，采用台积电3nm制程，单芯片算力达2.52 PFLOPS。Anthropic、Uber为首批客户，此举直接挑战NVIDIA主导地位，标志着AWS从云服务商向芯片供应商的战略延伸。

AMD 其他 2026-07-10

Towards Feature Complete Triton Support in JAX-Triton â ROCm Blogs

...

NVIDIA 其他 2026-07-07

英伟达否认Kyber NVL144延期，但78层PCB工艺瓶颈暴露AI硬件物理极限

英伟达官方否认Kyber NVL144机架延期至2028年的报道，但SemiAnalysis披露的78层超高密度PCB中板制造瓶颈及Rubin Ultra取消，揭示了下一代AI集群在信号完整性与物理制造上的硬性天花板，为AMD与Google留下战略窗口。

NVIDIA 其他 2026-07-06

NVIDIA Kyber NVL144延迟至2028年：PCB中板制造瓶颈暴露AI规模扩展隐形天花板

半导体研究机构SemiAnalysis披露，NVIDIA下一代机架级AI架构Kyber NVL144因78层正交背板（PCB中板）制造工艺挑战延迟超12个月至2028年。过渡方案NVL72x2因运维负担被取消，4芯片版Rubin Ultra也已取消，NVIDIA在规模扩展域出现产品空白期。

Anthropic 其他 2026-07-06

Anthropic启动自研AI芯片，三星2nm代工，算力自主战略加速

Anthropic正式启动自研AI芯片研发，并与三星洽谈2nm代工合作。此举旨在降低对NVIDIA GPU的依赖，优化推理成本，并在IPO前强化技术护城河。加入OpenAI、Google等自研芯片行列，标志AI算力从软件竞赛转向硬件圈地。

TSMC 其他 2026-07-01

Etched发布Transformer专用ASIC Sohu：推理性能声称达H100的20倍，正面冲击NVIDIA垄断

AI芯片初创公司Etched推出首款Transformer专用ASIC芯片Sohu，采用台积电N4P工艺，搭载144GB HBM3E。通过将注意力机制固化于电路，实现8卡服务器运行Llama 70B吞吐量达H100的20倍，每美元性能为140倍。累计融资8亿美元，首批机柜今夏出货，直接挑战NVIDIA推理市场地位。

Amazon 其他 2026-06-30

AWS与谷歌开放自研AI芯片，ASIC出货增速首超GPU，TCO拐点已至

2026年Q2，AWS Trainium与谷歌TPU首次对外商业化销售，定制ASIC芯片出货增速44.6%首超GPU的16.1%。大规模推理场景下ASIC TCO优势达40-65%，Midjourney迁移至TPU后月度成本从210万降至70万美元，标志着AI算力市场结构性拐点。

Google 其他 2026-06-29

谷歌限制Meta使用Gemini算力，暴露AI基础设施供给危机与生态壁垒

谷歌因算力不足限制Meta对Gemini大模型的API调用，导致Meta AI项目延迟。此举暴露即使拥有自研TPU和全球最大数据中心，谷歌仍无法满足激增需求，迫使行业重新审视AI算力分配与供应链韧性。

OpenAI 其他 2026-06-26

OpenAI联手博通9个月流片自研推理芯片Jalapeño，剑指NVIDIA生态

OpenAI与博通联合发布首款自研推理ASIC芯片Jalapeño，采用TSMC 3nm工艺，专为Transformer推理优化，目标推理成本降低50%。从设计到流片仅9个月，计划2026年底部署于千兆瓦级数据中心，标志着OpenAI向全栈AI基础设施提供商转型，直接挑战NVIDIA在推理市场的控制权。

Huawei 其他 2026-06-25

华为MWC上海2026力推Token计费：从字节管道转向AI价值交付，运营商需重构网络架构

华为在MWC上海2026提出运营商应从基于字节的计费转向基于AI Token的计费，并展示了AI推理加速方案，将长序列推理吞吐量提升372%。同时强调U6 GHz频段对AI可穿戴设备上行链路的关键作用，推动5G-A网络成为AI计算交付基础设施。

Anthropic 其他 2026-06-25

Anthropic指控阿里系发起史上最大AI蒸馏攻击，暴露API安全致命漏洞

Anthropic向美国参议员致信，指控与阿里相关的运营商通过约2.5万个欺诈账户发起2880万次模型交换，系统性地提取Claude前沿能力。此事件凸显AI模型API面临的新型大规模蒸馏威胁，迫使行业重新评估推理端点安全与使用监控。

Google Cloud 其他 2026-06-25

Google Cloud推多代理自主运维，控制点从人类转向AI验证架构

Google Cloud提出“agent-scale data management”，通过多代理验证架构减少人工监督，并与Nokia部署6个Gemini代理实现网络自治。同时Amazon计划商业化Trainium芯片，加剧AI硬件竞争，挑战Google TPU和Nvidia GPU。

情报

筛选