情报
AI 生成的结构化厂商动态简报
机密计算核心协议曝中继攻击漏洞,Intel TDX与AMD SEV-SNP双双沦陷
德累斯顿工大团队发现认证TLS协议存在严重架构缺陷,可被用于中继攻击,同时影响Intel TDX和AMD SEV-SNP两大硬件TEE平台。该漏洞CVSS评分高达7.5,超过近期多个知名机密计算漏洞,目前官方尚未发布补丁。
高通HBC Gen 1堆叠LPDDR实现133TB/s带宽,颠覆HBM生态
高通发布HBC Gen 1,通过3D堆叠LPDDR内存并集成计算die,实现133 TB/s带宽和6倍能效提升。该技术计划2027年中随AI250加速器出货,意图替代传统HBM,但供应链和物理实现仍存疑。
Google Cloud推多代理自主运维,控制点从人类转向AI验证架构
Google Cloud提出“agent-scale data management”,通过多代理验证架构减少人工监督,并与Nokia部署6个Gemini代理实现网络自治。同时Amazon计划商业化Trainium芯片,加剧AI硬件竞争,挑战Google TPU和Nvidia GPU。
高通发布Dragonfly数据中心CPU与HBC内存,以推理优先架构挑战NVIDIA霸权
高通在投资者日公布完整数据中心路线图,包括250核Oryon CPU(Dragonfly C1000)、近内存计算HBC(声称133TB/s带宽)、AI300推理加速器(54x带宽提升),以及800G/1.6T互联。与Meta签署多年CPU供应协议,2028年商用,旨在以低功耗高带宽颠覆AI推理市场。
OpenAI联手Broadcom推出Jalapeno推理芯片,重塑AI硬件生态
OpenAI与Broadcom合作开发了名为Jalapeno的LLM推理加速芯片,采用多芯片模块、HBM3E内存,9个月完成流片。该芯片专为OpenAI模型栈优化,旨在降低推理成本并减少对NVIDIA GPU的依赖,计划2026年底部署。
台积电全先进制程涨价5-10%,AI芯片成本压力加剧
台积电通知客户将对7nm及以上所有先进制程涨价5-10%,覆盖其74%的晶圆营收。苹果、英伟达、AMD等厂商面临更高制造成本,可能传导至终端AI基础设施价格。
中国LineShine超算登顶TOP500:纯CPU架构突破2 ExaFLOPS,ARMv9+HBM成新范式
LineShine超级计算机基于13.79百万个ARMv9核心、20480节点,实现2.198 ExaFLOPS FP64持续性能,成为全球首个突破2 ExaFLOPS的系统。它完全依赖CPU(无GPU加速),每个节点配备双LX2 CPU(304核)和32GB HBM,展示了CPU+HBM架构在HPC领域的潜力。
OpenAI GPT-5.6激进定价与150万上下文窗口,加速Agent化转型
OpenAI传闻发布GPT-5.6,上下文扩展至150万token,定价仅为Claude Fable 5的三分之一,并强化Agent可靠性。此举意在利用Anthropic被下线窗口期抢占市场,同时修复reward hacking事故。
美光与Anthropic战略合作:内存与AI模型深度绑定,重构供应链生态
美光与Anthropic达成战略协议,涵盖AI内存/存储架构联合设计、长期供应合同、内部采用Claude以及H轮投资。此举将前沿AI模型需求直接映射到基础设施设计,旨在优化token经济学与能效,但实质是供应锁定与生态重构。
戴尔XE8812服务器:NVIDIA Vera Rubin NVL4的液冷密度陷阱
戴尔发布PowerEdge XE8812服务器,采用NVIDIA Vera Rubin NVL4架构,每机架支持144颗GPU、300kW+功耗、100%直接液冷。该平台为HPC和AI大模型提供内存和计算密度代际跃升,但深度绑定Dell PowerRack、iDRAC和ORv3标准,形成从芯片到机架的全面锁定。
诺基亚MantaRay AutoPilot: 公有云AI控制面接管移动网络优化,15分钟闭环
NTT DOCOMO首次在日本部署诺基亚MantaRay AutoPilot,将AI驱动的网络优化系统运行在公有云上,实现从每日手动参数设计到15分钟全自动闭环的跃迁。系统通过意图驱动(Intent)自动分析基站性能并下发优化指令,目标达到TM Forum Level 4完全自主网络。
思科借NVIDIA Spectrum硅片与Nexus One统一管理,重塑AI网络控制层
思科发布N9100系列交换机,采用NVIDIA Spectrum-6/4硅片,支持102.4T吞吐量。同时推出Nexus One统一管理平面,整合NX-OS与SONiC,并通过BlueField DPU将安全策略下沉,实现AI工厂的端到端控制与安全卸载。
Google AI Studio Starter Tier:预配置无服务器堆栈,以生态锁定换取零门槛部署
Google推出AI Studio Starter Tier,提供预配置的Cloud Run、Firestore、Cloud SQL for PostgreSQL和Firebase Authentication堆栈,无需支付方式即可从原型到上线。该层锁定单区域、有限API和共享配额,但支持无缝升级到完整GCP项目,旨在降低AI应用部署门槛并强化生态绑定。
AMD悄然移除消费级Ryzen TSME:安全功能分化锁定企业客户
AMD在未公开声明的情况下,从基于Zen 5的消费级Ryzen处理器中移除了Transparent Secure Memory Encryption (TSME)功能,仅保留给Ryzen PRO系列。该变化始于AGESA 1.2.7.0固件,用户难以在Windows上察觉,但Linux系统可检测到缺失。此举旨在通过安全功能差异化,推动企业用户转向更高价格的PRO产品线。
AMD Threadripper 'Mustang Peak' 曝光:144核、PCIe 6.0、新TR6插槽,但功耗内存瓶颈暗藏
AMD Zen 6 Threadripper Pro 'Mustang Peak' 确认采用2nm工艺、DDR5、PCIe 6.0及全新TR6插槽。基于Powderhorn CCD,核心数最高可达144核(288线程),频率超6GHz。但功耗巨大,内存带宽可能依赖MRDIMM,平台升级成本高昂。
NVIDIA RTX Remix 1.5:用RTX IO压缩和AI Agent重塑游戏MOD生态,强化GPU锁定
NVIDIA发布RTX Remix 1.5更新,核心亮点是引入RTX IO技术,将《半条命2 RTX》文件大小从80GB压缩至50GB,并降低CPU开销。同时,新增AI Agent集成(RTX Remix Skills),允许AI编码代理自动执行复杂的MOD制作步骤,降低非程序员用户的入门门槛。
NVIDIA联合Coherent扩建6英寸InP晶圆厂,锁定AI光学互连供应链
Coherent在德州扩建全球首座6英寸磷化铟晶圆厂,NVIDIA投资20亿美元并承诺数十亿美元采购。该厂生产激光器、收发器和可插拔光学模块,支撑NVIDIA Vera Rubin Ultra NVL576等576-GPU集群的硅光子互连,标志着AI数据中心从铜缆向光通信的规模化转折。
Cisco AI Defense推出Agent Harness专项红队测试,填补Agent安全评估空白
Cisco在AI Defense: Explorer Edition中引入Agent Validation功能,专门针对Agent Harness的独特攻击面(工具路由、间接内容通道、跨会话持久状态)进行自动化红队测试。该功能通过自主侦察、结构化攻击与独立验证,填补了传统对话式安全评估在Agent场景下的空白。
OpenAI收购Ona:控制点从模型转向持久化AI智能体运行时
OpenAI收购云基础设施初创公司Ona,将其持久化执行环境整合进Codex,使AI智能体可在企业自有云中长时间独立运行。此举旨在解决企业级部署中的安全管控与合规审计问题,标志着OpenAI从模型提供商向全栈AI平台转型。
SiMa.ai推Palette Neat:用自然语言代理环境拆解英伟达GPU护城河
SiMa.ai发布开源Palette Neat开发环境,结合低功耗Modalix SoM(<10W),通过自然语言和代理工作流将Physical AI开发周期从数月缩短至数天。其pin-compatible设计直接替换NVIDIA SoM,无需重新设计载板,旨在打破GPU生态锁定。