情报
AI 生成的结构化厂商动态简报
爱立信深耕AI与6G双向发力,助力运营商决胜下一个十年
...
华为发布GigaUplink大上行解决方案,助力运营商构建Mobile AI基础网
...
华邦电子加入台积电WoW先进封装内存供应链,打破三大DRAM厂垄断
...
微软削减Azure中国研发:地缘政治迫使AI云战略收缩
微软裁减北京上海200-400名Azure中国研发岗位,2026年7月前完成。受美国AI芯片出口管制及中国数据安全法影响,前沿AI开发受阻。Azure中国通过世纪互联运营,份额已跌至5%以下,远落后于阿里云30%和华为云19%。
NVIDIA推Vera CPU+Rubin GPU,意图将AI控制权从x86转向自研架构
黄仁勋在股东大会上宣布Vera CPU为智能体设计,与Rubin GPU组成新平台,声称Blackwell推理token吞吐量比竞品高30倍,并强调CUDA生态是护城河。此举旨在将AI计算控制点从通用CPU转向NVIDIA自有架构。
华为联合湖北移动验证AI推理加速:外置存储KV Cache提升吞吐372%
华为与湖北移动完成全国首个运营商AI推理加速方案现网测试,基于OceanStor A800存储与昇腾A3超节点,通过UCM技术将KV Cache外置至PB级存储,实现长序列推理TPS最高提升372%。该方案针对GLM-5.1和MiniMax M2.5模型在8K-190K序列场景验证。
英特尔AI Box Ultra上车:PC级算力入车,锁定端侧AI生态,合围高通与英伟达
英特尔与长安汽车联合发布基于**酷睿Ultra**平台的**AI Box Ultra**座舱解决方案,将PC级算力与安卓应用生态引入汽车,主打端侧AI推理、隐私保护与弱网续航。此举意在合围高通与英伟达的座舱SoC,但隐藏着X86架构功耗与散热短板。
Arm自研AGI CPU需求翻倍,直指AI推理控制权争夺,x86阵营面临架构级威胁
Arm将其首款自研数据中心CPU——AGI CPU的需求预期翻倍,预计2027-2028财年收入超20亿美元。该芯片基于136核Neoverse V3平台,采用3nm工艺,专为智能体AI推理设计,声称每机架性能比x86高2倍以上。Meta为主要合作客户,OpenAI、Cloudflare等已确认采用。这标志着ARM从IP授权商向直接芯片供应商的战略转折。
微软Copilot Cowork转向按量计费,引入DeepSeek重构AI模型生态
微软宣布其企业Agentic AI工具Copilot Cowork从不限量订阅转向按使用量计费(Copilot Credits),并探索引入微调后的DeepSeek V4或开源模型作为低成本选项,托管于Azure。此举旨在应对用户高频任务带来的高成本,同时推动多模型路线。
美国政府勒令Anthropic封锁海外访问,AI模型出口管制进入强制时代
美国政府以国家安全为由,命令Anthropic阻止任何外国国民访问其最新模型Fable 5和Mythos 5,导致全球禁用。此举由亚马逊安全研究人员举报触发,并涉及中国团体曾获取Mythos访问权限的传闻。Anthropic被迫配合,IPO前遭遇重大合规冲击。
美国政府出口管制强制下线Claude Fable 5,AI监管进入地缘政治硬约束时代
Anthropic最新Claude Fable 5模型因美国政府出口管制仅上线4天下线,起因是亚马逊担忧其被用于网络攻击。Anthropic拒绝修复越狱漏洞,政府直接干预。中国智谱AI同日发布开源模型GLM-5.2,预示AI部署范式转向开源与主权化。
英特尔联手SambaNova推机架级AI,CPU重夺推理控制权
英特尔在Computex 2026发布机架级AI基础设施,结合至强6+处理器与SambaNova SN-50 RDU,并推出解耦推理云服务Vector Core Compute,由至强6+编排、Blackwell GPU预填充、SN40 RDU解码。此举旨在以CPU为中心应对Agentic AI推理需求,挑战NVIDIA的GPU主导地位。
NVIDIA三线并发:Vera CPU交付、N1X笔记本芯片与硅光子学投资,重构AI基础设施控制层
NVIDIA交付首款Agent专用Vera CPU(88核Arm v9.2, 1.2TB/s内存带宽),预告消费级N1X笔记本处理器,并累计投资65亿美元于硅光子学。此举将AI编排控制点从x86转向NVIDIA Arm生态,同时通过CPO技术解决内存墙问题,但量产挑战持续至2028年后。
华为韬定律:逻辑折叠绕开光刻限制,固定制程密度跃升55%
华为何庭波在ISCAS 2026提出韬定律,以特征时间常数tau为统一优化目标,替代传统几何缩放。核心技术逻辑折叠通过垂直堆叠有源层缩短关键路径,在固定制程(如N+2)下实现晶体管密度+55%、能效+41%的实测收益。麒麟2026首次突破3GHz,昇腾系列将引入逻辑折叠。该路线图预计到2031年等效1.4nm制程密度,从根本上挑战摩尔定律的物理极限。
NVIDIA GPU租金2个月上涨48%
NVIDIA Blackwell GPU租金达4.08美元/小时,2个月上涨48%。中国云厂商同步涨价,智谱API Q1累计上调83%。
华为Wi-Fi 7市场份额领先巩固企业网络竞争力
华为在2025年企业级Wi-Fi 7市场实现全球及中国市场份额与出货量双第一,其AirEngine系列产品凭借三频、16条空间流和10Gbps速率等技术优势获得市场认可。
爱立信联合中国移动推出智简RAN架构瞄准乡村网络
爱立信与中国移动联合展示面向乡村地区的智简无线接入网方案,通过高度集成硬件设计和AI自动化运维降低部署成本。该方案采用多频段多制式一体化设备,实现零接触运维,针对偏远地区网络覆盖痛点提供解决方案。
谷歌推出基于Lyria 3模型的节日AI音乐生成功能
谷歌在Gemini应用中推出限时AI音乐创作功能,基于Lyria 3模型生成个性化音乐贺卡。该功能支持多地区用户通过提示词生成30秒高保真音频和定制封面,并集成社交分享能力。
Intel携18A Xeon 6+与SambaNova RDU构建Rack Scale AI,正面挑战NVIDIA推理生态
Intel在Computex 2026推出基于18A制程的Xeon 6+处理器、与SambaNova合作的Rack Scale AI平台,以及全解耦推理服务Vector Core Compute,旨在通过CPU+RDU混合架构在智能体推理时代重新夺回数据中心核心地位,直接竞争NVIDIA的Vera Rubin NVL72。
NVIDIA RTX Spark与Nemotron-3 Ultra:端侧AI控制权从云端下沉至个人PC
NVIDIA在GTC Taipei 2026发布RTX Spark个人AI超级计算机(与联发科合作)及Nemotron-3 Ultra开源混合架构模型。RTX Spark搭载N1X芯片,提供1 PFLOPS本地AI算力,首次将大模型推理下沉至PC端,并重构软件生态。此举标志英伟达从云端GPU供应商转型为端侧AI基础设施垄断者。