AI 生成的结构化厂商动态简报
华为与湖北移动完成全国首个运营商AI推理加速方案现网测试,基于OceanStor A800存储与昇腾A3超节点,通过UCM技术将KV Cache外置至PB级存储,实现长序列推理TPS最高提升372%。该方案针对GLM-5.1和MiniMax M2.5模型在8K-190K序列场景验证。