RAN - AI基础设施情报搜索

Amazon 其他 2026-06-17

AWS Trainium 以 80% MFU 突破世界模型训练性价比拐点

AWS 宣称其自研 AI 芯片 Trainium 在训练世界模型（world models）时达到 80% 模型算力利用率（MFU），近乎行业平均的两倍。通过通用指令集设计和持续高负载散热能力，Trainium 正在吸引 Odyssey、DeCart AI 等初创公司，挑战 Nvidia GPU 在 AI 训练领域的主导地位。

NVIDIA 其他 2026-06-17

NVIDIA RTX Remix 1.5：用RTX IO压缩和AI Agent重塑游戏MOD生态，强化GPU锁定

NVIDIA发布RTX Remix 1.5更新，核心亮点是引入RTX IO技术，将《半条命2 RTX》文件大小从80GB压缩至50GB，并降低CPU开销。同时，新增AI Agent集成（RTX Remix Skills），允许AI编码代理自动执行复杂的MOD制作步骤，降低非程序员用户的入门门槛。

Google Cloud 其他 2026-06-17

ASUS联手NVIDIA推出桌面级AI超算，企业AI控制权从云端向本地急剧转移

ASUS发布基于NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip的ExpertCenter Pro ET900N G3桌面系统，提供20 PFLOPS AI算力与748GB一致内存，可运行近万亿参数模型。同时，Coherent在德州扩建磷化铟工厂保障光互联供应，NVIDIA计划发行200-250亿美元债券筹资。

Google Cloud 其他 2026-06-17

Google Cloud 为 AI Agent 嵌入法律可验证身份，监管驱动架构重构

Google Cloud 为 Gemini Enterprise 和 Vertex AI Agent Engine 引入基于 SPIFFE 的 Agent Identity，并集成 Kakunin 的合规层，将内部 SPIFFE 标识映射为 AWS KMS 生成的 X.509 证书，所有状态变更写入 WORM 审计日志。此举将运行时安全升级为法律可审计的市场参与者身份，以应对 EU AI Act 和 MiCA 的问责要求。

NVIDIA 其他 2026-06-17

NVIDIA联合Coherent扩建6英寸InP晶圆厂，锁定AI光学互连供应链

Coherent在德州扩建全球首座6英寸磷化铟晶圆厂，NVIDIA投资20亿美元并承诺数十亿美元采购。该厂生产激光器、收发器和可插拔光学模块，支撑NVIDIA Vera Rubin Ultra NVL576等576-GPU集群的硅光子互连，标志着AI数据中心从铜缆向光通信的规模化转折。

Huawei 其他 2026-06-17

华为LogicFolding架构：以3D堆叠绕过制程封锁，重塑AI芯片竞争格局

华为提出Tau Scaling Law和LogicFolding架构，通过垂直堆叠逻辑单元实现晶体管密度提升55%、能效提升41%，并宣称2031年可达1.4nm等效。同时Ascend 920/910C芯片已用于训练DeepSeek V4-Pro模型，证明其AI芯片从理论走向实战，威胁Nvidia在华市场。

Cisco 其他 2026-06-17

Cisco AI Defense推出Agent Harness专项红队测试，填补Agent安全评估空白

Cisco在AI Defense: Explorer Edition中引入Agent Validation功能，专门针对Agent Harness的独特攻击面（工具路由、间接内容通道、跨会话持久状态）进行自动化红队测试。该功能通过自主侦察、结构化攻击与独立验证，填补了传统对话式安全评估在Agent场景下的空白。

Amazon 其他 2026-06-17

AWS S3推出Annotations：1GB可变元数据直接嵌入对象，重塑AI数据湖元数据范式

AWS发布S3 Annotations，允许为每个对象附加最多1,000个、每个1MB的注解，总计1GB，支持JSON/XML/YAML，可随时修改。注解自动索引到Apache Iceberg表，可通过Athena查询，无需恢复对象或支付检索费。此举将元数据管理从外部数据库内嵌到存储层，彻底改变AI代理和数据湖的元数据架构。

NVIDIA 其他 2026-06-17

NVIDIA联合Coherent扩建6英寸磷化铟晶圆厂，光互连成AI基础设施新瓶颈突破口

NVIDIA投资20亿美元并与Coherent签订数十亿美元采购协议，扩建全球首座6英寸磷化铟晶圆厂，规模化生产AI光互连所需的激光器和光模块。此举旨在解决大规模GPU集群（如Vera Rubin Ultra NVL576）中铜缆无法满足距离与功耗的问题，推动共封装光学从实验室走向量产。

Qualcomm 其他 2026-06-17

高通豪赌RISC-V：收购Tenstorrent，力推边缘AI与数据中心自主架构

高通宣布从ARM转向开源RISC-V架构，已收购Ventana Micro并计划以80-100亿美元收购Tenstorrent，打造基于RISC-V的AI加速器。同时推出‘Dragonfly’品牌，目标2031年数据中心收入超350亿美元，全面押注边缘AI和AI代理。

NVIDIA 其他 2026-06-17

NVIDIA ACE本地化：用RTX硬件锁定游戏AI，控制点从云端移至GPU

NVIDIA发布ACE Game Agent SDK（开源C/C++框架）和UE5插件（ASR/SLM/TTS），将AI NPC推理完全本地化至GeForce RTX。配套DLSS 4.5插件支持多帧生成。此举旨在将游戏AI控制权从云服务商转移到NVIDIA GPU生态，但隐藏了硬件锁定与模型性能折衷。

AMD 其他 2026-06-17

AMD MLPerf 6.0：MI350系列用MXFP4实现3.5倍代际提升，多节点训练首秀

AMD在MLPerf Training 6.0中提交了最全面的结果，包括首次多节点训练（FLUX.1在512 GPU上）和MXFP4训练配方。MI355X相比MI300X在Llama 2-70B上实现3.5倍性能提升，且与NVIDIA B200的差距缩小至5%以内。10家生态伙伴验证了可复现性。

NVIDIA 其他 2026-06-17

NVIDIA联手HPE扩展AI Factory：Vera CPU专为代理AI设计，全栈集成锁定企业基础设施

NVIDIA与HPE宣布扩展AI Factory方案，推出首款代理AI专用CPU Vera（集成于HPE ProLiant DL394 Gen12），以及NVIDIA Agent Toolkit、Confidential Computing和全栈NVIDIA集成（Spectrum-X、BlueField、ConnectX）。该方案旨在将代理AI从概念验证推向生产，提供从训练到部署的完整基础设施。

Cloudflare 其他 2026-06-17

Cloudflare One Stack：用AI Agent技能文件重构SASE迁移生态，直击Zscaler软肋

Cloudflare 发布 Cloudflare One Stack，一套供AI Agent加载的技能文件，能自动化零信任环境的评估、部署和迁移，尤其内置了从Zscaler和Palo Alto Networks迁移的专用逻辑。该工具通过MCP服务器与Cloudflare API深度绑定，意图大幅降低用户切换成本，加速竞争对手客户流失。

NVIDIA 其他 2026-06-16

SiMa.ai推Palette Neat：用自然语言代理环境拆解英伟达GPU护城河

SiMa.ai发布开源Palette Neat开发环境，结合低功耗Modalix SoM（<10W），通过自然语言和代理工作流将Physical AI开发周期从数月缩短至数天。其pin-compatible设计直接替换NVIDIA SoM，无需重新设计载板，旨在打破GPU生态锁定。

HPE 其他 2026-06-16

HPE Nonstop集成Lusis TANGO AIF：将Agentic AI嵌入交易处理，锁定反欺诈控制权

HPE将Lusis TANGO AIF完全集成到Nonstop Compute平台，引入Random Forest与深度学习模型，实现实时、自适应的自主反欺诈操作，具备自愈基础设施和线性扩展能力，旨在替代传统规则引擎，提升交易处理智能化水平。

HPE 其他 2026-06-16

HPE整合Juniper推自驱动网络：AI控制平面统一，锁定用户管理栈

HPE宣布将Juniper网络产品深度整合进其AI数据中心解决方案，扩展自驱动网络策略。新功能包括Mist平台支持CX交换机、Marvis AIOps引入Aruba Central、以及针对推理和扩展架构优化的QFX交换机。统一SASE平台强化零信任安全，旨在通过AI自动化简化跨边缘、园区、数据中心和AI工厂的运维。

NVIDIA 其他 2026-06-16

HBM成AI新瓶颈：亚洲内存厂商夺回供应链控制权，Nvidia成本占比升至90%

SK Hynix、Samsung和Micron凭借HBM3E/HBM4的独家供应能力，市值突破万亿美元，而Nvidia的GPU生产成本中亚洲供应商占比升至90%。AI基础设施的真正瓶颈从GPU算力转向高带宽内存和先进封装。

AMD 其他 2026-06-16

AMD与Rackspace共建30MW受管AI算力：从硅层到结果的生态重构

AMD与Rackspace签署协议，分阶段部署30MW基于AMD Instinct GPU（MI355X等）和EPYC CPU的AI计算，构建面向受监管企业的“受管AI堆栈”，提供从裸金属到推理的单一责任方服务，旨在替代传统多厂商集成模式。

AMD 其他 2026-06-16

AMD Ryzen 10000系列拟弃集成GPU换NPU：AI性能跃升但牺牲基本显示能力

据泄漏，AMD下一代Zen 6桌面CPU“Olympic Ridge”将不再集成GPU，转而集成NPU以提升本地AI算力（目标>40 TOPS以满足Copilot+认证）。同时升级cIOD支持CUDIMM/CAMM内存与EXPO 1.2超频标准。此举意在追赶Intel DDR5速度并抢占AI PC生态位，但迫使绝大多数用户必须搭配独立显卡。

情报

筛选

AWS Trainium 以 80% MFU 突破世界模型训练性价比拐点

NVIDIA RTX Remix 1.5：用RTX IO压缩和AI Agent重塑游戏MOD生态，强化GPU锁定

ASUS联手NVIDIA推出桌面级AI超算，企业AI控制权从云端向本地急剧转移

Google Cloud 为 AI Agent 嵌入法律可验证身份，监管驱动架构重构

NVIDIA联合Coherent扩建6英寸InP晶圆厂，锁定AI光学互连供应链

华为LogicFolding架构：以3D堆叠绕过制程封锁，重塑AI芯片竞争格局

Cisco AI Defense推出Agent Harness专项红队测试，填补Agent安全评估空白

AWS S3推出Annotations：1GB可变元数据直接嵌入对象，重塑AI数据湖元数据范式

NVIDIA联合Coherent扩建6英寸磷化铟晶圆厂，光互连成AI基础设施新瓶颈突破口

高通豪赌RISC-V：收购Tenstorrent，力推边缘AI与数据中心自主架构

NVIDIA ACE本地化：用RTX硬件锁定游戏AI，控制点从云端移至GPU

AMD MLPerf 6.0：MI350系列用MXFP4实现3.5倍代际提升，多节点训练首秀

NVIDIA联手HPE扩展AI Factory：Vera CPU专为代理AI设计，全栈集成锁定企业基础设施

Cloudflare One Stack：用AI Agent技能文件重构SASE迁移生态，直击Zscaler软肋

SiMa.ai推Palette Neat：用自然语言代理环境拆解英伟达GPU护城河

HPE Nonstop集成Lusis TANGO AIF：将Agentic AI嵌入交易处理，锁定反欺诈控制权

HPE整合Juniper推自驱动网络：AI控制平面统一，锁定用户管理栈

HBM成AI新瓶颈：亚洲内存厂商夺回供应链控制权，Nvidia成本占比升至90%

AMD与Rackspace共建30MW受管AI算力：从硅层到结果的生态重构

AMD Ryzen 10000系列拟弃集成GPU换NPU：AI性能跃升但牺牲基本显示能力