infrastructure - AI基础设施情报搜索

NVIDIA 其他 2026-06-17

NVIDIA联手HPE扩展AI Factory：Vera CPU专为代理AI设计，全栈集成锁定企业基础设施

NVIDIA与HPE宣布扩展AI Factory方案，推出首款代理AI专用CPU Vera（集成于HPE ProLiant DL394 Gen12），以及NVIDIA Agent Toolkit、Confidential Computing和全栈NVIDIA集成（Spectrum-X、BlueField、ConnectX）。该方案旨在将代理AI从概念验证推向生产，提供从训练到部署的完整基础设施。

NVIDIA 其他 2026-06-16

NVIDIA Blackwell MLPerf六连冠：NVLink与NVFP4定义AI训练新范式

NVIDIA在MLPerf Training 6.0中凭借Blackwell平台全面领先，首次提交所有7个基准测试，包括MoE模型。GB300 NVL72比GB200快1.6x，通过第五代NVLink实现72 GPU一体化，NVFP4低精度训练提升性能。展示了从单机到8192 GPU集群的线性扩展能力。

HPE 其他 2026-06-16

HPE整合Juniper推自驱动网络：AI控制平面统一，锁定用户管理栈

HPE宣布将Juniper网络产品深度整合进其AI数据中心解决方案，扩展自驱动网络策略。新功能包括Mist平台支持CX交换机、Marvis AIOps引入Aruba Central、以及针对推理和扩展架构优化的QFX交换机。统一SASE平台强化零信任安全，旨在通过AI自动化简化跨边缘、园区、数据中心和AI工厂的运维。

MediaTek 其他 2026-06-16

HBM成AI新瓶颈：亚洲内存厂商夺回供应链控制权，Nvidia成本占比升至90%

SK Hynix、Samsung和Micron凭借HBM3E/HBM4的独家供应能力，市值突破万亿美元，而Nvidia的GPU生产成本中亚洲供应商占比升至90%。AI基础设施的真正瓶颈从GPU算力转向高带宽内存和先进封装。

AMD 其他 2026-06-16

AMD与Rackspace共建30MW受管AI算力：从硅层到结果的生态重构

AMD与Rackspace签署协议，分阶段部署30MW基于AMD Instinct GPU（MI355X等）和EPYC CPU的AI计算，构建面向受监管企业的“受管AI堆栈”，提供从裸金属到推理的单一责任方服务，旨在替代传统多厂商集成模式。

Google Cloud 其他 2026-06-16

Apple联手Google Gemini重塑Siri：AI模型外包，硬件支持大幅收缩

Apple宣布基于Google Gemini技术重建Siri，推出五个新AFM 3基础模型，其中20B参数多模态模型为最强端侧选项。同时watchOS 27仅支持S9/S10芯片，大幅削减旧设备支持，加速AI功能与硬件绑定，标志着生态位从完全自研转向混合合作。

Google 其他 2026-06-16

Google开源Brazos液冷：风冷数据中心即插即用高密度冷却

Google发布Brazos模块化液冷系统，可在现有风冷数据中心中逐机架部署，支持60kW热负载。系统基于OCP ORv3标准，开源设计，降低液冷采纳门槛，无需大规模设施改造。

CrowdStrike 其他 2026-06-16

CrowdStrike用持续身份引擎控制AI代理：从静态策略到实时风险授权

CrowdStrike发布Continuous Identity for AI Agents，基于SPIFFE标准为AI代理提供加密验证身份，并通过Falcon平台实时评估所有者、调用者和设备风险，动态授予或撤销权限。该方案消除静态特权，结合AIDR检测权限滥用，将身份安全控制平面扩展到所有代理行为。

Cisco 其他 2026-06-16

Cisco安全组合全面迁入AWS Marketplace：生态绑定加速，多云中立性存疑

Cisco宣布将其全套SaaS安全产品（Duo、Secure Access、Identity Intelligence、Hybrid Mesh Firewall等）通过AWS Marketplace提供，并与Amazon Bedrock、SageMaker深度集成，强化AI安全与零信任代理管理。此举旨在简化采购、加速部署，但显著加深对AWS生态的依赖，可能牺牲多云灵活性。

Cloudflare 其他 2026-06-15

Cloudflare Announces Scheduled Maintenance and Global Infrastructure Expansion

...

Cisco 其他 2026-06-15

Cisco G300芯片：AI网络控制平面争夺的封闭锁链

Cisco发布Silicon One G300可编程AI网络芯片，针对AI数据中心和ML集群。该芯片是Cisco统一路由、交换和AI加速架构的延伸，但实质是通过专有控制平面和软件栈锁定用户，对抗Broadcom、Nvidia等开放生态。

AMD 其他 2026-06-15

AMD收购MEXT：用AI预测让Flash逼近DRAM，降低AI内存TCO

AMD宣布收购AI内存优化初创公司MEXT，其核心技术利用AI预测模型使NAND Flash在延迟和吞吐量上逼近DRAM，旨在扩展AI服务器的有效内存容量，降低总拥有成本（TCO）。该技术将被整合进AMD数据中心全线产品，包括EPYC CPU和Instinct GPU，以应对大模型对内存的饥渴。

AMD 其他 2026-06-15

AMD通过Vultr开源AI软件组件，向NVIDIA CUDA生态发起生态重构挑战

AMD通过Vultr Marketplace发布开源、模块化的企业AI软件组件，包括AMD Inference Microservices (AIMs)、AI Workbench、Resource Manager和Solution Blueprints。该组合旨在提供生产级AI基础设施，避免单一厂商锁定，直接挑战NVIDIA的CUDA生态。

NVIDIA 其他 2026-06-15

NVIDIA携ASUS推桌面级DGX Station：GB300芯片下放，控制点从云转向本地硬件生态

ASUS发布ExpertCenter Pro ET900N G3，基于NVIDIA DGX Station GB300架构，搭载GB300 Grace Blackwell Ultra芯片，提供748GB统一内存和20 PFLOPS AI性能。该桌面级AI超算支持本地LLM微调、推理及AI agent工作负载，通过NVLink-C2C实现高速互连，并集成NVIDIA AI软件栈与NemoClaw框架。

Research 其他 2026-06-15

Z.ai GLM-5.2推可用1M Token上下文，无基准测试下挑战长文本推理极限

Z.ai发布GLM-5.2，宣称支持可用的1M token上下文窗口，并引入两种思考努力级别（Thinking-Effort Levels）。但未提供任何标准基准测试结果，引发对其实际性能与可用性的质疑。该模型旨在直接替代传统RAG分块检索流程，实现端到端长文本推理。

MediaTek 其他 2026-06-15

Carmen Li推动GPU期货市场：算力金融化将颠覆AI基础设施采购模式

Carmen Li通过Silicon Data和Compute Exchange构建GPU价格指数和现货市场，目标推出计算期货。该计划获DRW支持，旨在解决GPU价格波动，标准化算力交易，可能创造万亿美元级新资产类别，彻底改变AI算力的定价与分配机制。

Cloudflare 其他 2026-06-15

Cloudflare吸纳Ensemble团队：架构级模型压缩重塑边缘推理经济

Cloudflare宣布吸纳Ensemble AI核心团队，引入其架构级模型压缩技术NdLinear和NdLinear-LoRA。该技术通过保留多维激活结构而非扁平化处理，直接减少Transformer模型的参数量和计算开销。此举旨在显著降低Workers AI平台的推理成本，提升GPU利用率，并加速全球边缘AI部署。

NVIDIA 其他 2026-06-14

NVIDIA借DSX平台与SK电讯共建千兆瓦级AI云，加速主权AI工厂生态锁定

SK电讯宣布采用NVIDIA DSX平台在韩国建设千兆瓦级AI云，首个AI工厂2027年上线。该平台整合NVIDIA加速计算、系统与软件，支持主权、物理及代理AI服务，旨在成为亚洲AI基础设施标杆。

NVIDIA 其他 2026-06-14

NVIDIA与SK海力士深度捆绑：定制内存重塑AI工厂生态，锁定Vera Rubin与Jetson Thor

NVIDIA与SK hynix宣布多年期技术合作，将共同开发面向Vera Rubin AI超级计算机、Vera CPU、RTX Spark PC及Jetson Thor机器人平台的下一代定制内存。SK hynix还将利用NVIDIA CUDA-X库和Omniverse平台加速半导体设计与制造，构建自主晶圆厂数字孪生。

NVIDIA 其他 2026-06-14

NVIDIA推出Vera CPU：从GPU加速迈向AI Agent控制平面自主化

NVIDIA发布专为AI Agent设计的Vera CPU，基于88核Olympus架构，配备1.2TB/s LPDDR5X内存，声称比x86 CPU任务完成速度提升1.8倍。客户包括Anthropic、OpenAI等，意在将AI工作负载的控制平面从传统CPU转移到NVIDIA定制平台。

情报

筛选

NVIDIA联手HPE扩展AI Factory：Vera CPU专为代理AI设计，全栈集成锁定企业基础设施

NVIDIA Blackwell MLPerf六连冠：NVLink与NVFP4定义AI训练新范式

HPE整合Juniper推自驱动网络：AI控制平面统一，锁定用户管理栈

HBM成AI新瓶颈：亚洲内存厂商夺回供应链控制权，Nvidia成本占比升至90%

AMD与Rackspace共建30MW受管AI算力：从硅层到结果的生态重构

Apple联手Google Gemini重塑Siri：AI模型外包，硬件支持大幅收缩

Google开源Brazos液冷：风冷数据中心即插即用高密度冷却

CrowdStrike用持续身份引擎控制AI代理：从静态策略到实时风险授权

Cisco安全组合全面迁入AWS Marketplace：生态绑定加速，多云中立性存疑

Cloudflare Announces Scheduled Maintenance and Global Infrastructure Expansion

Cisco G300芯片：AI网络控制平面争夺的封闭锁链

AMD收购MEXT：用AI预测让Flash逼近DRAM，降低AI内存TCO

AMD通过Vultr开源AI软件组件，向NVIDIA CUDA生态发起生态重构挑战

NVIDIA携ASUS推桌面级DGX Station：GB300芯片下放，控制点从云转向本地硬件生态

Z.ai GLM-5.2推可用1M Token上下文，无基准测试下挑战长文本推理极限

Carmen Li推动GPU期货市场：算力金融化将颠覆AI基础设施采购模式

Cloudflare吸纳Ensemble团队：架构级模型压缩重塑边缘推理经济

NVIDIA借DSX平台与SK电讯共建千兆瓦级AI云，加速主权AI工厂生态锁定

NVIDIA与SK海力士深度捆绑：定制内存重塑AI工厂生态，锁定Vera Rubin与Jetson Thor

NVIDIA推出Vera CPU：从GPU加速迈向AI Agent控制平面自主化