筛选

×
当前筛选 清除全部
关键词: compression ×
8 情报总数
MediaTek 其他 2026-06-17

Databricks毛利率骤降警示:AI Agent正在摧毁传统软件定价模型

Databricks年化收入达69亿美元,但毛利率从80%+降至74%,CEO预计继续下滑。罪魁祸首是AI Agent——它们产生远超人类的查询量,推高云和计算成本。这暴露了传统按人定价的软件模式在Agent时代的经济脆弱性。

NVIDIA 其他 2026-06-17

NVIDIA RTX Remix 1.5:用RTX IO压缩和AI Agent重塑游戏MOD生态,强化GPU锁定

NVIDIA发布RTX Remix 1.5更新,核心亮点是引入RTX IO技术,将《半条命2 RTX》文件大小从80GB压缩至50GB,并降低CPU开销。同时,新增AI Agent集成(RTX Remix Skills),允许AI编码代理自动执行复杂的MOD制作步骤,降低非程序员用户的入门门槛。

NVIDIA 其他 2026-06-15

NVIDIA力推World-Action模型:机器人控制权从语言转向视频基础模型

NVIDIA发表深度技术博客,提出World-Action Model(WAM)作为VLM-based VLA的替代路线。WAM利用预训练视频/世界模型骨干,同时预测未来状态和机器人动作,旨在克服VLA的语言-动作接地鸿沟。该范式可能重塑机器人基础模型训练格局,但面临推理成本和实时性挑战。

Research 其他 2026-06-15

Z.ai GLM-5.2推可用1M Token上下文,无基准测试下挑战长文本推理极限

Z.ai发布GLM-5.2,宣称支持可用的1M token上下文窗口,并引入两种思考努力级别(Thinking-Effort Levels)。但未提供任何标准基准测试结果,引发对其实际性能与可用性的质疑。该模型旨在直接替代传统RAG分块检索流程,实现端到端长文本推理。

Cloudflare 其他 2026-06-15

Cloudflare吸纳Ensemble团队:架构级模型压缩重塑边缘推理经济

Cloudflare宣布吸纳Ensemble AI核心团队,引入其架构级模型压缩技术NdLinear和NdLinear-LoRA。该技术通过保留多维激活结构而非扁平化处理,直接减少Transformer模型的参数量和计算开销。此举旨在显著降低Workers AI平台的推理成本,提升GPU利用率,并加速全球边缘AI部署。

NVIDIA 其他 2026-06-08

NVIDIA 借英国主权AI基金,从芯片商跃升为国家AI基础设施的幕后控制者

NVIDIA 与英国政府合作,通过 Isambard-AI(搭载 5,400 颗 GH200)及 Sovereign AI Fund,扶持本地初创(Cosine, Cursive, Doubleword)。此举表面是技术部署,实则是 NVIDIA 构建主权AI控制平面,将国家算力锁入其生态系统,削弱AWS/Azure等传统云厂商的地位。

NVIDIA 其他 2026-05-27

NVIDIA Vera CPU实测碾压x86:Agentic AI时代的内存带宽霸权

Phoronix基准测试显示,NVIDIA Vera CPU凭借88核自研Olympus核心(Armv9.2)、1.2TB/s LPDDR5X带宽及450W TDP,在Agentic AI工作负载中全面领先Intel/AMD x86。单核性能、内存带宽每瓦效率及并行一致性均实现代际跨越,Linux内核编译仅20秒。

Cisco 其他 强信号 2026-04-30

思科发布AI模型溯源宪法,定义权重级衍生关系标准

思科发布《模型溯源宪法》,为AI模型供应链安全提供规范性定义。该标准严格基于模型权重的可验证衍生历史,明确区分了直接衍生、蒸馏等五种关联关系与独立复现等八种非关联模式,旨在解决当前行业在模型溯源定义上的不一致问题。