情报
AI 生成的结构化厂商动态简报
NVIDIA
其他
2025-06-01
NVIDIA RTX Spark与Nemotron-3 Ultra:端侧AI控制权从云端下沉至个人PC
NVIDIA在GTC Taipei 2026发布RTX Spark个人AI超级计算机(与联发科合作)及Nemotron-3 Ultra开源混合架构模型。RTX Spark搭载N1X芯片,提供1 PFLOPS本地AI算力,首次将大模型推理下沉至PC端,并重构软件生态。此举标志英伟达从云端GPU供应商转型为端侧AI基础设施垄断者。
Research
其他
1970-01-01
智谱GLM-5.2开源:MIT协议744B MoE,以可下载模型对抗地缘政治禁运
智谱AI发布GLM-5.2,744B MoE仅40B激活参数,支持1M输入上下文和131K输出,采用MIT开源协议。时间点紧贴Anthropic Fable 5被美国政府强制下架,提供可下载、不可被禁的替代方案,兼容Anthropic API实现零代码迁移,旨在为企业提供技术主权选项。
NVIDIA
其他
1970-01-01
SGLang 0.5.13发布:MoE两阶段路由预判+稀疏缓存,推理性能跃升25倍
SGLang 0.5.13引入MoE模型专用路由预判(轻量代理网络预加载top-k expert权重)和稀疏KV缓存(按激活路径分组缓存),在NVIDIA GB300 NVL72平台实现25倍推理加速。A100实测吞吐+65%,延迟-40%,显存-10%,路由开销-62%,全面超越vLLM。