Memory - AI基础设施情报搜索

AMD 其他 2026-07-26

AMD发布Helios机架级AI平台，MI400系列主打推理密度与TCO优势

AMD在AAI 2026发布Helios机架级解决方案，集成72颗MI455X GPU与18颗Venice CPU，单机架提供2.9 Exaflops FP4推理算力与31TB HBM4内存。MI430X GPU提供288 TFLOPS FP64用于HPC。AMD宣称相比竞品每美元推理Token数提升30%。

NVIDIA 其他 2026-07-26

NVIDIA联手SK集团锁定HBM4供应链，主权AI工厂模式开启国家级投资

NVIDIA与SK集团宣布超5000亿美元AI合作，涵盖SK Telecom 2GW AI工厂（采用Vera Rubin+HBM4，2027年投运）、SK Hynix HBM4长期供应锁定，以及NVIDIA投资Naver 10亿美元（Brookfield追加90亿美元）。三星与博通另签2000亿美元协议。此举标志着AI基础设施投资进入国家级规模，并深度绑定供应链。

NVIDIA 其他 2026-07-16

NVIDIA推出Jetson Thor T3000/T2000，以Blackwell架构压降边缘AI推理成本壁垒

NVIDIA发布基于Thor架构的Jetson T3000和T2000模块。T3000集成Blackwell GPU、8核Neoverse CPU，以T5000一半的功耗提供865 FP4 TFLOPS算力，并搭配新的Jetson Agent Skills自动化内存优化工具，旨在推动人形机器人和边缘AI应用的大规模部署。

NVIDIA 其他 2026-07-16

NVIDIA CUDA 13.3新增clmad指令，硬件加速无进位乘法，加密性能跃升

NVIDIA在CUDA 13.3中为Ampere及以上GPU新增clmad硬件指令，实现无进位乘累加。GHASH吞吐量达6.3 TB/s（B200），较bitsliced方案提升18.8倍；零知识证明sum-check协议加速3-13倍。该指令还适用于CRC、Reed-Solomon等编码。

NVIDIA 其他 2026-07-14

NVIDIA推动HVDC电力架构，AI数据中心能效与供应链面临重构

NVIDIA正推动AI数据中心从传统交流(AC)向高压直流(HVDC)电力系统转变，旨在减少多次转换损耗，提升能效。此举将重构服务器制造、电力设备及冷却系统全链条，但面临直流电弧安全、标准缺失等挑战，可能加速HVDC在超大规模AI集群的部署。

Other 其他 2026-07-14

MemGhost攻击：单封邮件实现AI Agent持久性记忆污染

研究人员披露MemGhost攻击技术，利用AI Agent的持久记忆功能，通过一封邮件即可植入虚假记忆且不通知用户，实现持久性状态污染。此攻击凸显AI Agent记忆安全的设计缺陷，推动记忆审计与异常检测成为刚需。

Meta 其他 2026-07-13

Meta Iris芯片9月量产：6个月迭代周期颠覆NVIDIA GPU霸权

路透社确认Meta Iris AI芯片9月量产，2026年底达2.5GW，2027年目标14GW。Meta采用6个月一代的MTIA四代路线图，以自研ASIC节奏对抗NVIDIA年度更新，标志着超大规模厂商从GPU依赖向定制芯片自主的范式转移。

TSMC 其他 2026-07-13

TSMC涨价8-12%并延长交付，AI芯片成本通胀开启

台积电宣布对7nm及以下制程涨价8-12%，交付周期延长至26周，并发布v2.1指令要求EDA工具链通过验证。这将直接推高NVIDIA、AMD等AI芯片的TCO，延缓新品发布，强化台积电对AI供应链的控制权。

Intel 其他 2026-07-12

Intel押注3D堆叠AI芯片 18A-PT+Foveros Direct 3D+EMIB-T全栈整合

...

Samsung Electronics 其他 2026-07-10

三星GAIA芯片供样，存储中心型NPU能效提升40%挑战AI PC格局

三星发布GAIA AI PC处理器，采用4nm制程和存储中心型NPU设计，将LPDDR5X控制器与NPU紧耦合，实现近存计算，能效比提升40%，算力达50 TOPS，已获微软Copilot+认证，联想计划Q4搭载。

AMD 其他 2026-07-10

Towards Feature Complete Triton Support in JAX-Triton â ROCm Blogs

...

NVIDIA 其他 2026-07-07

NVIDIA发布Vera CPU：以最大单线程性能重构AI Agent生态

NVIDIA推出Vera CPU，专为AI Agent工作负载设计，采用Olympus核心，提供比x86高1.8倍的持续每核心性能。该CPU与NVIDIA GPU和BlueField统一架构，旨在构建AI工厂的统一计算平台，挑战现有x86 CPU生态。

NVIDIA 其他 2026-07-07

AI Innovators Adopt NVIDIA Vera — Why Max Single-Threaded CPU at Scale Matters

...

Qualcomm 其他 2026-07-02

高通携Dragonfly C1000与HBC技术杀入AI推理，直指Nvidia HBM壁垒

高通发布Dragonfly路线图，包括自研Oryon核心的C1000 CPU和搭载HBC近存计算技术的AI300推理加速器，Meta和Microsoft已签约。目标是通过降低TCO和突破memory wall，在AI推理市场形成差异化，避开与Nvidia在训练端的正面竞争。

Qualcomm 其他 2026-06-25

高通HBC Gen 1堆叠LPDDR实现133TB/s带宽，颠覆HBM生态

高通发布HBC Gen 1，通过3D堆叠LPDDR内存并集成计算die，实现133 TB/s带宽和6倍能效提升。该技术计划2027年中随AI250加速器出货，意图替代传统HBM，但供应链和物理实现仍存疑。

Huawei 其他 2026-06-25

华为推AI原生网络架构：从字节计费转向Token货币化，UCM缓存突破长上下文瓶颈

华为在MWC上海2026发布AI原生网络架构，集成服务-网络-计算，实现从流量中心到智能中心的转变。核心是Unified Cache Manager（UCM）将KV缓存扩展至PB级外存，在GLM-5.1模型128K序列长度下实现372% token吞吐量提升。同时推出token货币化框架，允许运营商按AI推理容量计费，并引入agentic运营模式。

Google Cloud 其他 2026-06-25

Google Cloud推多代理自主运维，控制点从人类转向AI验证架构

Google Cloud提出“agent-scale data management”，通过多代理验证架构减少人工监督，并与Nokia部署6个Gemini代理实现网络自治。同时Amazon计划商业化Trainium芯片，加剧AI硬件竞争，挑战Google TPU和Nvidia GPU。

NVIDIA 其他 2026-06-25

高通发布Dragonfly数据中心CPU与HBC内存，以推理优先架构挑战NVIDIA霸权

高通在投资者日公布完整数据中心路线图，包括250核Oryon CPU（Dragonfly C1000）、近内存计算HBC（声称133TB/s带宽）、AI300推理加速器（54x带宽提升），以及800G/1.6T互联。与Meta签署多年CPU供应协议，2028年商用，旨在以低功耗高带宽颠覆AI推理市场。

Cisco 其他 2026-06-25

Cisco推出AI故障排除代理，重塑工业网络运维控制权

Cisco发布面向工业网络的AI故障排除代理，作为Cisco AgenticOps和Cloud Control的一部分。该代理通过本地部署、全天候监控交换机系统消息，利用确定性逻辑诊断物理层和网络层故障，为OT技术人员提供可操作的修复步骤，旨在缩短MTTD和MTTR。

OpenAI 其他 2026-06-25

OpenAI联手Broadcom推出Jalapeno推理芯片，重塑AI硬件生态

OpenAI与Broadcom合作开发了名为Jalapeno的LLM推理加速芯片，采用多芯片模块、HBM3E内存，9个月完成流片。该芯片专为OpenAI模型栈优化，旨在降低推理成本并减少对NVIDIA GPU的依赖，计划2026年底部署。

情报

筛选