AI - AI基础设施情报搜索

Huawei 其他 2026-06-25

华为MWC上海2026力推Token计费：从字节管道转向AI价值交付，运营商需重构网络架构

华为在MWC上海2026提出运营商应从基于字节的计费转向基于AI Token的计费，并展示了AI推理加速方案，将长序列推理吞吐量提升372%。同时强调U6 GHz频段对AI可穿戴设备上行链路的关键作用，推动5G-A网络成为AI计算交付基础设施。

Qualcomm 其他 2026-06-25

高通HBC Gen 1堆叠LPDDR实现133TB/s带宽，颠覆HBM生态

高通发布HBC Gen 1，通过3D堆叠LPDDR内存并集成计算die，实现133 TB/s带宽和6倍能效提升。该技术计划2027年中随AI250加速器出货，意图替代传统HBM，但供应链和物理实现仍存疑。

Anthropic 其他 2026-06-25

Anthropic指控阿里系发起史上最大AI蒸馏攻击，暴露API安全致命漏洞

Anthropic向美国参议员致信，指控与阿里相关的运营商通过约2.5万个欺诈账户发起2880万次模型交换，系统性地提取Claude前沿能力。此事件凸显AI模型API面临的新型大规模蒸馏威胁，迫使行业重新评估推理端点安全与使用监控。

OpenAI 其他 2026-06-25

Oracle国防生态第三批：离线AI边缘部署成为军事实战新范式

Oracle在布鲁塞尔国防科技峰会上宣布国防生态系统第三批成员，新增10家公司。同时，Whitespace的Saga AI系统已在英国皇家海军HIGHMAST行动中部署在Oracle Roving Edge Devices上，实现完全离线的分类AI工作负载处理，标志着主权边缘AI从概念走向实战。

Huawei 其他 2026-06-25

华为推AI原生网络架构：从字节计费转向Token货币化，UCM缓存突破长上下文瓶颈

华为在MWC上海2026发布AI原生网络架构，集成服务-网络-计算，实现从流量中心到智能中心的转变。核心是Unified Cache Manager（UCM）将KV缓存扩展至PB级外存，在GLM-5.1模型128K序列长度下实现372% token吞吐量提升。同时推出token货币化框架，允许运营商按AI推理容量计费，并引入agentic运营模式。

Google Cloud 其他 2026-06-25

Google Cloud推多代理自主运维，控制点从人类转向AI验证架构

Google Cloud提出“agent-scale data management”，通过多代理验证架构减少人工监督，并与Nokia部署6个Gemini代理实现网络自治。同时Amazon计划商业化Trainium芯片，加剧AI硬件竞争，挑战Google TPU和Nvidia GPU。

Anthropic 其他 2026-06-25

Anthropic指控阿里巴巴大规模蒸馏攻击，AI模型安全边界面临重划

Anthropic指控阿里巴巴关联方通过近2900万次交换，使用数千虚假账户对Claude模型进行工业规模蒸馏攻击，提取其长任务处理与决策能力。此举暴露了AI模型在API访问下的知识产权保护漏洞，推动行业重新定义模型安全边界。

NVIDIA 其他 2026-06-25

高通发布Dragonfly数据中心CPU与HBC内存，以推理优先架构挑战NVIDIA霸权

高通在投资者日公布完整数据中心路线图，包括250核Oryon CPU（Dragonfly C1000）、近内存计算HBC（声称133TB/s带宽）、AI300推理加速器（54x带宽提升），以及800G/1.6T互联。与Meta签署多年CPU供应协议，2028年商用，旨在以低功耗高带宽颠覆AI推理市场。

Cisco 其他 2026-06-25

Cisco推出AI故障排除代理，重塑工业网络运维控制权

Cisco发布面向工业网络的AI故障排除代理，作为Cisco AgenticOps和Cloud Control的一部分。该代理通过本地部署、全天候监控交换机系统消息，利用确定性逻辑诊断物理层和网络层故障，为OT技术人员提供可操作的修复步骤，旨在缩短MTTD和MTTR。

OpenAI 其他 2026-06-25

OpenAI联手Broadcom推出Jalapeno推理芯片，重塑AI硬件生态

OpenAI与Broadcom合作开发了名为Jalapeno的LLM推理加速芯片，采用多芯片模块、HBM3E内存，9个月完成流片。该芯片专为OpenAI模型栈优化，旨在降低推理成本并减少对NVIDIA GPU的依赖，计划2026年底部署。

AMD 其他 2026-06-24

台积电全先进制程涨价5-10%，AI芯片成本压力加剧

台积电通知客户将对7nm及以上所有先进制程涨价5-10%，覆盖其74%的晶圆营收。苹果、英伟达、AMD等厂商面临更高制造成本，可能传导至终端AI基础设施价格。

Huawei 其他 2026-06-24

华为联合湖北移动验证AI推理加速：外置存储KV Cache提升吞吐372%

华为与湖北移动完成全国首个运营商AI推理加速方案现网测试，基于OceanStor A800存储与昇腾A3超节点，通过UCM技术将KV Cache外置至PB级存储，实现长序列推理TPS最高提升372%。该方案针对GLM-5.1和MiniMax M2.5模型在8K-190K序列场景验证。

Cisco 其他 2026-06-24

Cisco Live US & InfoComm 2026 : la collaboration entre dans l’ère agentique

...

Google 其他 2026-06-24

Mandiant曝光Cisco SD-WAN Manager零日漏洞，控制平面成高级威胁突破口

Mandiant发现攻击者利用Cisco Catalyst SD-WAN Manager的CVE-2026-20245零日漏洞，通过恶意CSV上传实现权限提升至root。攻击链包括未授权对等连接、默认账户密码篡改及反取证清理。事件凸显SD-WAN集中控制平面作为高级持续性威胁的新攻击面。

NVIDIA 其他 2026-06-24

NVIDIA与AWS联手：cuVS默认化GPU加速向量搜索，G7实例4.6倍推理性能突破

NVIDIA与AWS深度整合，推出EC2 G7实例（基于RTX PRO 4500 Blackwell GPU），性能提升4.6倍；并在OpenSearch Serverless中默认启用cuVS进行GPU加速向量索引，速度提升10倍、成本降低75%。AWS获GB300 Exemplar Cloud认证。

ARM 其他 2026-06-24

中国LineShine超算登顶TOP500：纯CPU架构突破2 ExaFLOPS，ARMv9+HBM成新范式

LineShine超级计算机基于13.79百万个ARMv9核心、20480节点，实现2.198 ExaFLOPS FP64持续性能，成为全球首个突破2 ExaFLOPS的系统。它完全依赖CPU（无GPU加速），每个节点配备双LX2 CPU（304核）和32GB HBM，展示了CPU+HBM架构在HPC领域的潜力。

Nokia 其他 2026-06-24

Nokia, Amazon Web Services expand collaboration to deliver autonomous networks built for the AI era

...

Microsoft 其他 2026-06-23

微软推出Azure Copilot可观测性代理，将运维控制点锁定在自家平台

微软宣布Azure Copilot可观测性代理正式商用，基于Azure Monitor构建，可跨代理、应用、基础设施和服务关联信号，提供统一运维视图。此举旨在将AI驱动的故障诊断与修复工作流深度绑定在Azure生态内。

NVIDIA 其他 2026-06-23

NVIDIA发布45°C高温液冷系统，Rubin芯片承诺减少100%水耗

NVIDIA为Rubin GPU推出高温液冷系统，冷却液温度45°C（高于热水浴缸），利用室外干冷却器实现闭环运行，宣称可减少电耗并消除水蒸发（水耗减少100%）。但系统在炎热气候下仍需冷水机组备用，且电力来源和芯片寿命影响未明确。