情报
AI 生成的结构化厂商动态简报
爱立信深耕AI与6G双向发力,助力运营商决胜下一个十年
...
华邦电子加入台积电WoW先进封装内存供应链,打破三大DRAM厂垄断
...
华为MWC上海2026力推Token计费:从字节管道转向AI价值交付,运营商需重构网络架构
华为在MWC上海2026提出运营商应从基于字节的计费转向基于AI Token的计费,并展示了AI推理加速方案,将长序列推理吞吐量提升372%。同时强调U6 GHz频段对AI可穿戴设备上行链路的关键作用,推动5G-A网络成为AI计算交付基础设施。
NVIDIA与AWS联手:cuVS默认化GPU加速向量搜索,G7实例4.6倍推理性能突破
NVIDIA与AWS深度整合,推出EC2 G7实例(基于RTX PRO 4500 Blackwell GPU),性能提升4.6倍;并在OpenSearch Serverless中默认启用cuVS进行GPU加速向量索引,速度提升10倍、成本降低75%。AWS获GB300 Exemplar Cloud认证。
NVIDIA全栈统治超算TOP500:Grace CPU与InfiniBand锁定AI基础设施生态
NVIDIA宣布其技术驱动了81%的TOP500超算,其中Grace CPU部署增至26台,Quantum InfiniBand连接376台。全栈策略(GPU+CPU+网络)正在将超算采购从开放组件转向单一供应商锁定,Green500前八名均使用NVIDIA GPU。
NVIDIA借AI代理与数字孪生重塑电信网络控制平面
NVIDIA在DTW Ignite 2026展示其AI代理平台,集成NeMo合成数据、NemoClaw安全运行时、OpenShell沙箱及RTX PRO 6000加速的数字孪生,旨在实现电信网络自主运营。合作伙伴包括SoftBank、Amdocs、NTT DATA等,共同推动从任务自动化向自主网络转型。
NVIDIA JUPITER超算验证Grace Hopper平台:百亿亿次科学计算进入生产阶段
欧洲首台百亿亿次超算JUPITER基于NVIDIA Grace Hopper Superchips和Quantum-X800 InfiniBand,完成了人类大脑细胞级图谱、1公里分辨率气候模拟、6G AI模型训练和50量子比特量子计算模拟,标志着百亿亿次计算从研究走向生产。
AMD MLPerf 6.0:MI350系列用MXFP4实现3.5倍代际提升,多节点训练首秀
AMD在MLPerf Training 6.0中提交了最全面的结果,包括首次多节点训练(FLUX.1在512 GPU上)和MXFP4训练配方。MI355X相比MI300X在Llama 2-70B上实现3.5倍性能提升,且与NVIDIA B200的差距缩小至5%以内。10家生态伙伴验证了可复现性。
HBM成AI新瓶颈:亚洲内存厂商夺回供应链控制权,Nvidia成本占比升至90%
SK Hynix、Samsung和Micron凭借HBM3E/HBM4的独家供应能力,市值突破万亿美元,而Nvidia的GPU生产成本中亚洲供应商占比升至90%。AI基础设施的真正瓶颈从GPU算力转向高带宽内存和先进封装。
Google发布Lightning Engine:4.9x性能提升背后的生态锁定与架构隐忧
Google Cloud宣布Lightning Engine全面可用,基于开源Gluten和Velox实现向量化原生执行,声称性能提升4.9倍,价格性能比领先2倍。深度优化Cloud Storage和BigQuery连接器,但通过专有集成和premium tier强化生态锁定。
NVIDIA 借英国主权AI基金,从芯片商跃升为国家AI基础设施的幕后控制者
NVIDIA 与英国政府合作,通过 Isambard-AI(搭载 5,400 颗 GH200)及 Sovereign AI Fund,扶持本地初创(Cosine, Cursive, Doubleword)。此举表面是技术部署,实则是 NVIDIA 构建主权AI控制平面,将国家算力锁入其生态系统,削弱AWS/Azure等传统云厂商的地位。
Cisco Cloud Control统一平台:AgenticOps时代控制层向单一面板转移
Cisco Live 2026发布Cisco Cloud Control,统一网络、安全、计算、可观测性管理,支持AI代理协同操作。同时扩展Live Protect内核级安全补丁至N9000等,并公布量子安全路线图及新C9550/C8600硬件。
TrendForce预警:HBM利润率被DDR5反超,2027年合约价或将翻倍暴涨
TrendForce最新报告指出,HBM每晶圆收入在1Q26已被DDR5 64GB RDIMM反超,导致HBM利润率低于传统DRAM。供应商将据此调整产能分配,预计2027年HBM4合约价将大幅上涨。NVIDIA Rubin Ultra与AI ASIC需求将进一步加剧HBM供应紧张。
NVIDIA RTX Spark:以SoC形态夺取PC控制权,AI算力革命或锁定生态
NVIDIA发布RTX Spark SoC,集成Blackwell GPU与20核Grace CPU(MediaTek设计),通过NVLink-C2C实现600GB/s互联,最高128GB统一内存,1 petaflop FP4 AI算力,支持本地运行1200亿参数大模型。此举从GPU供应商跃升为整机方案商,直接挑战Apple M系列、Qualcomm及x86阵营。
谷歌通过Agent Platform展示AI原生应用架构范式
谷歌云客户案例展示了基于Gemini Enterprise Agent Platform构建的“流式意识转任务”应用。该架构利用原生音频流、主动工具调用和会话恢复等API,实现了从语音到结构化任务的无缝、低延迟转换,并设计了面向未来语音功能的提供商无关抽象层。
美国AI基础设施扩张遇冷:16GW产能30%-50%延期
美国今年规划新增约16吉瓦数据中心容量,预计30%-50%面临延期或取消,真正动工仅约5吉瓦。电力、供应链、人力三重瓶颈压制AI基础设施落地。
英特尔联合诺基亚与戴尔推出面向远边缘的UPF专用设备
英特尔、诺基亚与戴尔在MWC 2026上预展了一款基于英特尔至强6 SoC的远边缘UPF设备。该方案旨在为电信运营商在空间与功耗受限的远边缘环境提供高性能、低功耗的5G核心网用户面处理能力,并集成了AI功能。
诺基亚在芬兰奥卢开设研发制造园区,聚焦AI驱动网络
诺基亚在芬兰奥卢开设新的研发与制造园区,旨在设计、测试和交付为AI构建的下一代网络。该园区集成了研发、智能制造和合作伙伴生态系统,目标是推动5G/6G及专网发展,为AI超级周期提供必要的连接基础设施。
思科MWC 2026展示融合S/NOC与代理式AI,推进自主安全运营
思科在MWC 2026上运行了融合安全与网络运营中心,展示了其安全云、XDR与Splunk平台的无缝集成。核心是通过代理式AI生成“即时攻击故事板”,辅助分析师进行事件分级和调查,并将工作流程自动化桥接至Splunk Enterprise Security进行深度威胁狩猎。
诺基亚获英伟达投资,联合推出AI-RAN平台加速6G演进
诺基亚与英伟达达成战略合作,后者将投资10亿美元并联合推出基于英伟达计算平台的AI-RAN产品。该合作旨在将AI数据中心能力嵌入无线接入网,推动5G向AI原生6G网络转型,T-Mobile将成为首个部署客户。