情报
AI 生成的结构化厂商动态简报
谷歌发布Gemma 4开源模型,瞄准边缘推理与AI代理架构
谷歌推出Gemma 4开源模型家族,包含从2B到31B的四个版本,强调单位参数性能突破,并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化,旨在将前沿推理能力扩展至移动与IoT场景。
Google发布Gemma 4开源模型系列
Google推出Gemma 4开源模型系列,包含四种规模变体,特别优化边缘计算和移动设备。该系列支持多模态处理、长上下文窗口和140多种语言,采用Apache 2.0许可。
AMD发布突破性MLPerf 6.0推理结果,展示多节点扩展与多模态能力
AMD在MLPerf Inference 6.0基准测试中,凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型(Wan-2.2-t2v)的快速启用,以及广泛的合作伙伴生态系统复现结果。
Cisco 披露 AI 编码助手内存污染攻击方法
Cisco 安全团队发现并验证了针对 Claude Code 等 AI 编码助手的持久性内存污染攻击方法,通过篡改 MEMORY.md 系统文件可长期操纵 AI 行为。该漏洞已促使 Anthropic 在 v2.1.50 版本中移除了用户记忆文件的系统提示权限。
英特尔在MLPerf推理测试中展示Xeon 6与Arc Pro GPU的AI性能
英特尔在MLPerf Inference v6.0基准测试中展示了其Xeon 6 CPU和Arc Pro B系列GPU的性能,特别是在处理大型语言模型(LLM)时的表现。测试结果显示,配备四块Arc Pro B70 GPU的系统能够处理120B参数的模型,并在多GPU设置中提供高达1.8倍的推理性能提升。
Arm首次推出自研AGI CPU,进军数据中心硅产品市场
Arm宣布其计算平台首次扩展至生产级硅产品,推出自研的Arm AGI CPU,专为AI数据中心和Agentic AI工作负载设计。该CPU旨在提供远超x86平台的每机架性能与能效,并已获得Meta、OpenAI等关键客户及广泛OEM/ODM生态支持。
NVIDIA推出物理AI数据工厂蓝图,将计算转化为合成数据
NVIDIA在GTC上发布物理AI数据工厂蓝图,这是一个将计算转化为大规模高质量合成训练数据的开放参考架构。它基于Cosmos世界模型和OSMO操作器,旨在解决真实世界数据难以规模化获取和处理的瓶颈,为下一代自主系统和机器人提供数据引擎。
ARM推出AGI CPU:AI Agent时代的硅基础
ARM宣布推出Arm AGI CPU,这是其首款自有硅产品,基于Neoverse平台,专为agentic AI时代设计。该CPU优化大规模并行工作负载,在1OU配置中支持272核心/刀片,全机架达8160核心,性能比x86系统提高两倍以上,提升AI基础设施效率。
ARM Neoverse重塑AI基础设施控制层
ARM推出Neoverse系列基础设施CPU核心,专为云计算、AI和高性能计算优化,被NVIDIA、AWS、Microsoft和Google等厂商采用于其AI平台,实现性能提升和能效改进。该架构推动AI工作负载在云和边缘的高密度部署,强化安全多租户支持。
NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区
NVIDIA将其GPU动态资源分配(DRA)驱动捐献给CNCF,使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区,并协同多家云厂商推动标准化。
NVIDIA IGX Thor边缘AI平台:8倍算力跃迁与ConnectX-7网络锁定
NVIDIA发布IGX Thor系列,基于Blackwell GPU和Arm Neoverse-V3AE CPU,提供最高5,581 FP4 TFLOPS算力、双200GbE RDMA网络及ISO 26262功能安全。通过Jetson/IGX引脚兼容和10年生命周期,构建从原型到生产的无缝迁移路径,但隐性锁定用户至NVIDIA专有硬件堆栈。
ARM与NVIDIA推动AI工作站本地化变革
ARM与NVIDIA联合推出基于GB10 Grace Blackwell芯片的DGX Spark AI工作站系列,八家主流OEM厂商同步发布产品。该方案采用统一内存架构支持2000亿参数模型本地运行,第三方测试显示较x86方案提升41%渲染性能与3.2倍AI处理速度,实现云端工具链向边缘端无缝迁移。
SK海力士HBM4E逻辑芯片跳级至TSMC 3nm,意在狙击三星4nm性能领先
SK海力士计划在第七代HBM4E中采用TSMC 3nm工艺制造逻辑芯片,较HBM4的12nm实现代际跨越。此举旨在扭转在HBM4上性能落后三星(三星采用4nm逻辑)的局面,为NVIDIA Vera Rubin Ultra等下一代AI芯片提供更高带宽与能效。
AMD与NAVER Cloud合作推进韩国主权AI基础设施建设
AMD与韩国NAVER Cloud宣布深化战略合作,旨在加速韩国主权AI基础设施建设。NAVER Cloud将扩大部署AMD EPYC“威尼斯”处理器,并获得下一代Instinct MI455X GPU的早期访问权限,双方将共同优化AI服务与软件栈。
AMD与三星深化合作,锁定HBM4供应并探索代工
AMD与三星签署谅解备忘录,将三星作为下一代Instinct MI455X GPU的HBM4主要供应商,并合作优化用于第六代EPYC CPU的DDR5内存。双方还将探讨三星为AMD提供先进制程代工服务的可能性。
NVIDIA Project Rheo:用仿真训练医院机器人,控制点从现实转向虚拟
NVIDIA发布Project Rheo蓝图,整合Isaac Sim、GR00T VLA模型和合成数据生成,用于医院机器人自动化。开发者可在数字孪生中训练物理AI策略,包括定位操作(如手术托盘拾取)和精密双手操作(如套管组装),并通过Cosmos Transfer 2.5跨场景泛化。
NVIDIA Warp:可微分物理模拟框架,打通AI训练与GPU加速
NVIDIA发布Warp框架,允许用Python编写GPU加速的物理模拟代码,并原生支持自动微分。通过2D Navier-Stokes求解器示例,展示了如何将模拟直接集成到AI优化流程中,降低物理AI训练数据生成成本。
NVIDIA将CUDA Tile编程模型扩展至Julia语言
NVIDIA通过cuTile.jl包将其CUDA Tile高级GPU编程模型引入Julia语言生态。此举旨在降低高性能GPU内核开发门槛,通过数据块抽象简化底层线程与内存管理,并保持与Python版本在语法和性能上的高度一致性。
Trend Micro发布AI安全报告,揭示AI供应链风险与模型攻击面
Trend Micro发布《AI生态系统断层线》报告,系统性地分析了AI供应链中的安全风险,包括模型训练数据污染、第三方插件漏洞以及模型窃取攻击。报告指出,企业AI应用的安全边界已从传统IT基础设施扩展至模型层和数据管道。
AMD推出游戏PC认证框架强化平台战略
AMD推出Advantage Gaming Desktops认证计划,要求OEM厂商采用AMD处理器、显卡和软件技术的3A平台组合。该计划设定了硬件性能标准,包括Ryzen 7/9处理器和Radeon RX 7000显卡,并整合软件优化技术。