情报
AI 生成的结构化厂商动态简报
惠普与OpenAI达成战略合作,全面部署Frontier平台
...
Anthropic指控阿里系发起史上最大AI蒸馏攻击,暴露API安全致命漏洞
Anthropic向美国参议员致信,指控与阿里相关的运营商通过约2.5万个欺诈账户发起2880万次模型交换,系统性地提取Claude前沿能力。此事件凸显AI模型API面临的新型大规模蒸馏威胁,迫使行业重新评估推理端点安全与使用监控。
Oracle国防生态第三批:离线AI边缘部署成为军事实战新范式
Oracle在布鲁塞尔国防科技峰会上宣布国防生态系统第三批成员,新增10家公司。同时,Whitespace的Saga AI系统已在英国皇家海军HIGHMAST行动中部署在Oracle Roving Edge Devices上,实现完全离线的分类AI工作负载处理,标志着主权边缘AI从概念走向实战。
中国LineShine超算登顶TOP500:纯CPU架构突破2 ExaFLOPS,ARMv9+HBM成新范式
LineShine超级计算机基于13.79百万个ARMv9核心、20480节点,实现2.198 ExaFLOPS FP64持续性能,成为全球首个突破2 ExaFLOPS的系统。它完全依赖CPU(无GPU加速),每个节点配备双LX2 CPU(304核)和32GB HBM,展示了CPU+HBM架构在HPC领域的潜力。
NVIDIA发布Agent Toolkit:以Nemotron模型和OpenShell运行时构建专用AI Agent生态
NVIDIA推出Agent Toolkit,包含Nemotron开源模型、NemoClaw安全蓝图和OpenShell运行时,为企业构建可定制、安全、低成本的专用AI Agent提供开放模块化基础。该工具包已应用于生命科学、网络安全、工业等领域,旨在将通用模型转化为领域专属的数字同事。
AMD MI430X以200+ TFLOPS原生FP64性能,重新定义HPC与AI融合算力基线
AMD在TOP500榜单中驱动4台前十超算,并预览MI430X GPU,承诺超过200 TFLOPS原生FP64性能。此举直接针对AI for Science场景,将双精度计算作为下一代HPC与AI融合基础设施的核心指标,对NVIDIA和Intel形成直接竞争压力。
Nvidia Vera Rubin CPU: 10-wide核心颠覆CPU设计,锁定代理计算生态
Nvidia在GTC Taipei 2026公布Vera Rubin CPU架构,采用完全自定义10-wide指令流水线核心,IPC和带宽远超现有CPU。该CPU专为代理计算设计,旨在与GPU协同,同时Nvidia宣布与Microsoft合作重新定义PC为Personal AI,并承诺50%自由现金流回报。
美光与Anthropic战略合作:内存与AI模型深度绑定,重构供应链生态
美光与Anthropic达成战略协议,涵盖AI内存/存储架构联合设计、长期供应合同、内部采用Claude以及H轮投资。此举将前沿AI模型需求直接映射到基础设施设计,旨在优化token经济学与能效,但实质是供应锁定与生态重构。
NVIDIA JUPITER超算验证Grace Hopper平台:百亿亿次科学计算进入生产阶段
欧洲首台百亿亿次超算JUPITER基于NVIDIA Grace Hopper Superchips和Quantum-X800 InfiniBand,完成了人类大脑细胞级图谱、1公里分辨率气候模拟、6G AI模型训练和50量子比特量子计算模拟,标志着百亿亿次计算从研究走向生产。
NVIDIA借法国AI基建合围欧洲:开放模型Nemotron背后的硬件锁定
NVIDIA联合法国政府、Mistral、Scaleway等部署GB200、Blackwell B300及Vera Rubin NVL72硬件,并通过Nemotron开放模型联盟吸引LINAGORA、H Company等,构建以NVIDIA为中心的AI基础设施生态,表面开放实则强化硬件依赖。
Nvidia ENPIRE框架:AI编码代理自主训练机器人安装GPU,实现99%成功率
Nvidia GEAR实验室与CMU、UC Berkeley联合发布ENPIRE框架,利用Codex、Claude Code等AI编码代理自主编写机器人训练代码、测试并迭代,在GPU安装等接触密集型任务上达到99%成功率。系统通过Git共享结果,无需人类干预,但token消耗随规模超线性增长,仿真到现实仍有差距。
AWS Trainium 以 80% MFU 突破世界模型训练性价比拐点
AWS 宣称其自研 AI 芯片 Trainium 在训练世界模型(world models)时达到 80% 模型算力利用率(MFU),近乎行业平均的两倍。通过通用指令集设计和持续高负载散热能力,Trainium 正在吸引 Odyssey、DeCart AI 等初创公司,挑战 Nvidia GPU 在 AI 训练领域的主导地位。
ASUS联手NVIDIA推出桌面级AI超算,企业AI控制权从云端向本地急剧转移
ASUS发布基于NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip的ExpertCenter Pro ET900N G3桌面系统,提供20 PFLOPS AI算力与748GB一致内存,可运行近万亿参数模型。同时,Coherent在德州扩建磷化铟工厂保障光互联供应,NVIDIA计划发行200-250亿美元债券筹资。
华为LogicFolding架构:以3D堆叠绕过制程封锁,重塑AI芯片竞争格局
华为提出Tau Scaling Law和LogicFolding架构,通过垂直堆叠逻辑单元实现晶体管密度提升55%、能效提升41%,并宣称2031年可达1.4nm等效。同时Ascend 920/910C芯片已用于训练DeepSeek V4-Pro模型,证明其AI芯片从理论走向实战,威胁Nvidia在华市场。
AMD MLPerf 6.0:MI350系列用MXFP4实现3.5倍代际提升,多节点训练首秀
AMD在MLPerf Training 6.0中提交了最全面的结果,包括首次多节点训练(FLUX.1在512 GPU上)和MXFP4训练配方。MI355X相比MI300X在Llama 2-70B上实现3.5倍性能提升,且与NVIDIA B200的差距缩小至5%以内。10家生态伙伴验证了可复现性。
NVIDIA联手HPE扩展AI Factory:Vera CPU专为代理AI设计,全栈集成锁定企业基础设施
NVIDIA与HPE宣布扩展AI Factory方案,推出首款代理AI专用CPU Vera(集成于HPE ProLiant DL394 Gen12),以及NVIDIA Agent Toolkit、Confidential Computing和全栈NVIDIA集成(Spectrum-X、BlueField、ConnectX)。该方案旨在将代理AI从概念验证推向生产,提供从训练到部署的完整基础设施。
Cloudflare One Stack:用AI Agent技能文件重构SASE迁移生态,直击Zscaler软肋
Cloudflare 发布 Cloudflare One Stack,一套供AI Agent加载的技能文件,能自动化零信任环境的评估、部署和迁移,尤其内置了从Zscaler和Palo Alto Networks迁移的专用逻辑。该工具通过MCP服务器与Cloudflare API深度绑定,意图大幅降低用户切换成本,加速竞争对手客户流失。
NVIDIA Blackwell MLPerf六连冠:NVLink与NVFP4定义AI训练新范式
NVIDIA在MLPerf Training 6.0中凭借Blackwell平台全面领先,首次提交所有7个基准测试,包括MoE模型。GB300 NVL72比GB200快1.6x,通过第五代NVLink实现72 GPU一体化,NVFP4低精度训练提升性能。展示了从单机到8192 GPU集群的线性扩展能力。
微软Agent 365控制平面:以管理锁替代模型锁,构筑AI时代的Entra帝国
微软发布Agent 365作为AI代理的统一控制平面,整合Entra、Defender、Purview、Intune及成本管理,同时推出Microsoft IQ语义平台。宣称模型多样化与开放,实则通过管理工具链锁定企业AI资产,将控制权从模型层转移到微软基础设施层。
CrowdStrike推出连续身份认证,重塑AI代理安全控制平面
CrowdStrike在Identiverse 2026发布Continuous Identity for AI Agents,作为Falcon Next-Gen Identity Security能力。基于SPIFFE标准实现可验证代理身份,通过实时风险信号动态授权,消除常驻权限,并与Falcon AIDR集成检测权限滥用,将身份安全控制平面从静态策略转向连续风险评估。