compression - AI基础设施情报搜索

MediaTek 其他 2026-06-17

Databricks毛利率骤降警示：AI Agent正在摧毁传统软件定价模型

Databricks年化收入达69亿美元，但毛利率从80%+降至74%，CEO预计继续下滑。罪魁祸首是AI Agent——它们产生远超人类的查询量，推高云和计算成本。这暴露了传统按人定价的软件模式在Agent时代的经济脆弱性。

NVIDIA 其他 2026-06-17

NVIDIA RTX Remix 1.5：用RTX IO压缩和AI Agent重塑游戏MOD生态，强化GPU锁定

NVIDIA发布RTX Remix 1.5更新，核心亮点是引入RTX IO技术，将《半条命2 RTX》文件大小从80GB压缩至50GB，并降低CPU开销。同时，新增AI Agent集成（RTX Remix Skills），允许AI编码代理自动执行复杂的MOD制作步骤，降低非程序员用户的入门门槛。

NVIDIA 其他 2026-06-15

NVIDIA力推World-Action模型：机器人控制权从语言转向视频基础模型

NVIDIA发表深度技术博客，提出World-Action Model（WAM）作为VLM-based VLA的替代路线。WAM利用预训练视频/世界模型骨干，同时预测未来状态和机器人动作，旨在克服VLA的语言-动作接地鸿沟。该范式可能重塑机器人基础模型训练格局，但面临推理成本和实时性挑战。

Research 其他 2026-06-15

Z.ai GLM-5.2推可用1M Token上下文，无基准测试下挑战长文本推理极限

Z.ai发布GLM-5.2，宣称支持可用的1M token上下文窗口，并引入两种思考努力级别（Thinking-Effort Levels）。但未提供任何标准基准测试结果，引发对其实际性能与可用性的质疑。该模型旨在直接替代传统RAG分块检索流程，实现端到端长文本推理。

Cloudflare 其他 2026-06-15

Cloudflare吸纳Ensemble团队：架构级模型压缩重塑边缘推理经济

Cloudflare宣布吸纳Ensemble AI核心团队，引入其架构级模型压缩技术NdLinear和NdLinear-LoRA。该技术通过保留多维激活结构而非扁平化处理，直接减少Transformer模型的参数量和计算开销。此举旨在显著降低Workers AI平台的推理成本，提升GPU利用率，并加速全球边缘AI部署。

NVIDIA 其他 2026-06-08

NVIDIA 借英国主权AI基金，从芯片商跃升为国家AI基础设施的幕后控制者

NVIDIA 与英国政府合作，通过 Isambard-AI（搭载 5,400 颗 GH200）及 Sovereign AI Fund，扶持本地初创（Cosine, Cursive, Doubleword）。此举表面是技术部署，实则是 NVIDIA 构建主权AI控制平面，将国家算力锁入其生态系统，削弱AWS/Azure等传统云厂商的地位。

NVIDIA 其他 2026-05-27

NVIDIA Vera CPU实测碾压x86：Agentic AI时代的内存带宽霸权

Phoronix基准测试显示，NVIDIA Vera CPU凭借88核自研Olympus核心（Armv9.2）、1.2TB/s LPDDR5X带宽及450W TDP，在Agentic AI工作负载中全面领先Intel/AMD x86。单核性能、内存带宽每瓦效率及并行一致性均实现代际跨越，Linux内核编译仅20秒。

Cisco 其他强信号 2026-04-30

思科发布AI模型溯源宪法，定义权重级衍生关系标准

思科发布《模型溯源宪法》，为AI模型供应链安全提供规范性定义。该标准严格基于模型权重的可验证衍生历史，明确区分了直接衍生、蒸馏等五种关联关系与独立复现等八种非关联模式，旨在解决当前行业在模型溯源定义上的不一致问题。

情报

筛选