server - AI基础设施情报搜索

NVIDIA 其他 2026-06-23

Nvidia Vera Rubin CPU: 10-wide核心颠覆CPU设计，锁定代理计算生态

Nvidia在GTC Taipei 2026公布Vera Rubin CPU架构，采用完全自定义10-wide指令流水线核心，IPC和带宽远超现有CPU。该CPU专为代理计算设计，旨在与GPU协同，同时Nvidia宣布与Microsoft合作重新定义PC为Personal AI，并承诺50%自由现金流回报。

NVIDIA 其他 2026-06-22

戴尔XE8812服务器：NVIDIA Vera Rubin NVL4的液冷密度陷阱

戴尔发布PowerEdge XE8812服务器，采用NVIDIA Vera Rubin NVL4架构，每机架支持144颗GPU、300kW+功耗、100%直接液冷。该平台为HPC和AI大模型提供内存和计算密度代际跃升，但深度绑定Dell PowerRack、iDRAC和ORv3标准，形成从芯片到机架的全面锁定。

NVIDIA 其他 2026-06-22

NVIDIA Rubin全液冷突破45°C，冷却能耗骤降40%

NVIDIA Rubin代AI服务器实现100%液冷，冷却液温度高达45°C，无风扇、无冷热通道。DSX参考设计采用封闭循环干冷器，零水消耗，冷却能耗降低约40%。该架构使机架密度提升3倍，推动AI工厂冷却范式根本转变。

Amazon 其他 2026-06-21

AWS 推出 AgentCore 与 MCP 网关，夺取企业 AI 代理控制平面

AWS 发布 Bedrock AgentCore 托管 Web 搜索、Amazon Quick 自主代理、LangChain 子代理编排及 MCP 网关，将企业 AI 代理从实验原型转向可治理基础设施，核心控制点从模型转向云原生控制平面与执行隔离。

Cisco 其他 2026-06-18

思科借NVIDIA Spectrum硅片与Nexus One统一管理，重塑AI网络控制层

思科发布N9100系列交换机，采用NVIDIA Spectrum-6/4硅片，支持102.4T吞吐量。同时推出Nexus One统一管理平面，整合NX-OS与SONiC，并通过BlueField DPU将安全策略下沉，实现AI工厂的端到端控制与安全卸载。

Google 其他 2026-06-18

Google AI Studio Starter Tier：预配置无服务器堆栈，以生态锁定换取零门槛部署

Google推出AI Studio Starter Tier，提供预配置的Cloud Run、Firestore、Cloud SQL for PostgreSQL和Firebase Authentication堆栈，无需支付方式即可从原型到上线。该层锁定单区域、有限API和共享配额，但支持无缝升级到完整GCP项目，旨在降低AI应用部署门槛并强化生态绑定。

AMD 其他 2026-06-18

AMD收购MEXT实现NAND闪存模拟DRAM，AI推理内存成本腰斩

AMD完成对MEXT的收购，其技术使廉价NAND闪存模拟DRAM行为，将可用内存容量提升2-4倍同时成本减半。该能力被直接瞄准AI推理和代理型AI市场，解决内存带宽瓶颈。同时AMD与Rackspace签署30MW AI计算部署协议，2026-2028年落地。

Amazon 其他 2026-06-18

Tesco百亿英镑诉讼撕开Broadcom VMware订阅锁链，企业虚拟化生态面临重构

Tesco因Broadcom收购VMware后取消永久许可并涨价237%起诉，涉及约4万工作负载。此案动摇了企业软件许可信任，可能引发大规模迁移潮，Nutanix、Red Hat等替代方案迎来历史性机遇。

Amazon 其他 2026-06-17

Introducing Amazon Bedrock Managed Knowledge Base for faster, more accurate enterprise AI applications

...

NVIDIA 其他 2026-06-17

NVIDIA联合Coherent扩建6英寸InP晶圆厂，锁定AI光学互连供应链

Coherent在德州扩建全球首座6英寸磷化铟晶圆厂，NVIDIA投资20亿美元并承诺数十亿美元采购。该厂生产激光器、收发器和可插拔光学模块，支撑NVIDIA Vera Rubin Ultra NVL576等576-GPU集群的硅光子互连，标志着AI数据中心从铜缆向光通信的规模化转折。

Huawei 其他 2026-06-17

华为LogicFolding架构：以3D堆叠绕过制程封锁，重塑AI芯片竞争格局

华为提出Tau Scaling Law和LogicFolding架构，通过垂直堆叠逻辑单元实现晶体管密度提升55%、能效提升41%，并宣称2031年可达1.4nm等效。同时Ascend 920/910C芯片已用于训练DeepSeek V4-Pro模型，证明其AI芯片从理论走向实战，威胁Nvidia在华市场。

Amazon 其他 2026-06-17

AWS S3推出Annotations：1GB可变元数据直接嵌入对象，重塑AI数据湖元数据范式

AWS发布S3 Annotations，允许为每个对象附加最多1,000个、每个1MB的注解，总计1GB，支持JSON/XML/YAML，可随时修改。注解自动索引到Apache Iceberg表，可通过Athena查询，无需恢复对象或支付检索费。此举将元数据管理从外部数据库内嵌到存储层，彻底改变AI代理和数据湖的元数据架构。

NVIDIA 其他 2026-06-17

NVIDIA联合Coherent扩建6英寸磷化铟晶圆厂，光互连成AI基础设施新瓶颈突破口

NVIDIA投资20亿美元并与Coherent签订数十亿美元采购协议，扩建全球首座6英寸磷化铟晶圆厂，规模化生产AI光互连所需的激光器和光模块。此举旨在解决大规模GPU集群（如Vera Rubin Ultra NVL576）中铜缆无法满足距离与功耗的问题，推动共封装光学从实验室走向量产。

AMD 其他 2026-06-17

AMD MLPerf 6.0：MI350系列用MXFP4实现3.5倍代际提升，多节点训练首秀

AMD在MLPerf Training 6.0中提交了最全面的结果，包括首次多节点训练（FLUX.1在512 GPU上）和MXFP4训练配方。MI355X相比MI300X在Llama 2-70B上实现3.5倍性能提升，且与NVIDIA B200的差距缩小至5%以内。10家生态伙伴验证了可复现性。

NVIDIA 其他 2026-06-17

NVIDIA联手HPE扩展AI Factory：Vera CPU专为代理AI设计，全栈集成锁定企业基础设施

NVIDIA与HPE宣布扩展AI Factory方案，推出首款代理AI专用CPU Vera（集成于HPE ProLiant DL394 Gen12），以及NVIDIA Agent Toolkit、Confidential Computing和全栈NVIDIA集成（Spectrum-X、BlueField、ConnectX）。该方案旨在将代理AI从概念验证推向生产，提供从训练到部署的完整基础设施。

Cloudflare 其他 2026-06-17

Cloudflare One Stack：用AI Agent技能文件重构SASE迁移生态，直击Zscaler软肋

Cloudflare 发布 Cloudflare One Stack，一套供AI Agent加载的技能文件，能自动化零信任环境的评估、部署和迁移，尤其内置了从Zscaler和Palo Alto Networks迁移的专用逻辑。该工具通过MCP服务器与Cloudflare API深度绑定，意图大幅降低用户切换成本，加速竞争对手客户流失。

NVIDIA 其他 2026-06-16

NVIDIA Blackwell MLPerf六连冠：NVLink与NVFP4定义AI训练新范式

NVIDIA在MLPerf Training 6.0中凭借Blackwell平台全面领先，首次提交所有7个基准测试，包括MoE模型。GB300 NVL72比GB200快1.6x，通过第五代NVLink实现72 GPU一体化，NVFP4低精度训练提升性能。展示了从单机到8192 GPU集群的线性扩展能力。

HPE 其他 2026-06-16

HPE Nonstop集成Lusis TANGO AIF：将Agentic AI嵌入交易处理，锁定反欺诈控制权

HPE将Lusis TANGO AIF完全集成到Nonstop Compute平台，引入Random Forest与深度学习模型，实现实时、自适应的自主反欺诈操作，具备自愈基础设施和线性扩展能力，旨在替代传统规则引擎，提升交易处理智能化水平。

NVIDIA 其他 2026-06-16

HBM成AI新瓶颈：亚洲内存厂商夺回供应链控制权，Nvidia成本占比升至90%

SK Hynix、Samsung和Micron凭借HBM3E/HBM4的独家供应能力，市值突破万亿美元，而Nvidia的GPU生产成本中亚洲供应商占比升至90%。AI基础设施的真正瓶颈从GPU算力转向高带宽内存和先进封装。

AMD 其他 2026-06-16

AMD与Rackspace共建30MW受管AI算力：从硅层到结果的生态重构

AMD与Rackspace签署协议，分阶段部署30MW基于AMD Instinct GPU（MI355X等）和EPYC CPU的AI计算，构建面向受监管企业的“受管AI堆栈”，提供从裸金属到推理的单一责任方服务，旨在替代传统多厂商集成模式。

情报

筛选

Nvidia Vera Rubin CPU: 10-wide核心颠覆CPU设计，锁定代理计算生态

戴尔XE8812服务器：NVIDIA Vera Rubin NVL4的液冷密度陷阱

NVIDIA Rubin全液冷突破45°C，冷却能耗骤降40%

AWS 推出 AgentCore 与 MCP 网关，夺取企业 AI 代理控制平面

思科借NVIDIA Spectrum硅片与Nexus One统一管理，重塑AI网络控制层

Google AI Studio Starter Tier：预配置无服务器堆栈，以生态锁定换取零门槛部署

AMD收购MEXT实现NAND闪存模拟DRAM，AI推理内存成本腰斩

Tesco百亿英镑诉讼撕开Broadcom VMware订阅锁链，企业虚拟化生态面临重构

Introducing Amazon Bedrock Managed Knowledge Base for faster, more accurate enterprise AI applications

NVIDIA联合Coherent扩建6英寸InP晶圆厂，锁定AI光学互连供应链

华为LogicFolding架构：以3D堆叠绕过制程封锁，重塑AI芯片竞争格局

AWS S3推出Annotations：1GB可变元数据直接嵌入对象，重塑AI数据湖元数据范式

NVIDIA联合Coherent扩建6英寸磷化铟晶圆厂，光互连成AI基础设施新瓶颈突破口

AMD MLPerf 6.0：MI350系列用MXFP4实现3.5倍代际提升，多节点训练首秀

NVIDIA联手HPE扩展AI Factory：Vera CPU专为代理AI设计，全栈集成锁定企业基础设施

Cloudflare One Stack：用AI Agent技能文件重构SASE迁移生态，直击Zscaler软肋

NVIDIA Blackwell MLPerf六连冠：NVLink与NVFP4定义AI训练新范式

HPE Nonstop集成Lusis TANGO AIF：将Agentic AI嵌入交易处理，锁定反欺诈控制权

HBM成AI新瓶颈：亚洲内存厂商夺回供应链控制权，Nvidia成本占比升至90%

AMD与Rackspace共建30MW受管AI算力：从硅层到结果的生态重构