Scaling - AI基础设施情报搜索

NVIDIA 其他 2026-06-16

NVIDIA Blackwell MLPerf六连冠：NVLink与NVFP4定义AI训练新范式

NVIDIA在MLPerf Training 6.0中凭借Blackwell平台全面领先，首次提交所有7个基准测试，包括MoE模型。GB300 NVL72比GB200快1.6x，通过第五代NVLink实现72 GPU一体化，NVFP4低精度训练提升性能。展示了从单机到8192 GPU集群的线性扩展能力。

HPE 其他 2026-06-16

HPE Nonstop集成Lusis TANGO AIF：将Agentic AI嵌入交易处理，锁定反欺诈控制权

HPE将Lusis TANGO AIF完全集成到Nonstop Compute平台，引入Random Forest与深度学习模型，实现实时、自适应的自主反欺诈操作，具备自愈基础设施和线性扩展能力，旨在替代传统规则引擎，提升交易处理智能化水平。

HPE 其他 2026-06-16

HPE整合Juniper推自驱动网络：AI控制平面统一，锁定用户管理栈

HPE宣布将Juniper网络产品深度整合进其AI数据中心解决方案，扩展自驱动网络策略。新功能包括Mist平台支持CX交换机、Marvis AIOps引入Aruba Central、以及针对推理和扩展架构优化的QFX交换机。统一SASE平台强化零信任安全，旨在通过AI自动化简化跨边缘、园区、数据中心和AI工厂的运维。

Cisco 其他 2026-06-16

Cisco安全组合全面迁入AWS Marketplace：生态绑定加速，多云中立性存疑

Cisco宣布将其全套SaaS安全产品（Duo、Secure Access、Identity Intelligence、Hybrid Mesh Firewall等）通过AWS Marketplace提供，并与Amazon Bedrock、SageMaker深度集成，强化AI安全与零信任代理管理。此举旨在简化采购、加速部署，但显著加深对AWS生态的依赖，可能牺牲多云灵活性。

AMD 其他 2026-06-15

AMD通过Vultr开源AI软件组件，向NVIDIA CUDA生态发起生态重构挑战

AMD通过Vultr Marketplace发布开源、模块化的企业AI软件组件，包括AMD Inference Microservices (AIMs)、AI Workbench、Resource Manager和Solution Blueprints。该组合旨在提供生产级AI基础设施，避免单一厂商锁定，直接挑战NVIDIA的CUDA生态。

NVIDIA 其他 2026-06-15

NVIDIA力推World-Action模型：机器人控制权从语言转向视频基础模型

NVIDIA发表深度技术博客，提出World-Action Model（WAM）作为VLM-based VLA的替代路线。WAM利用预训练视频/世界模型骨干，同时预测未来状态和机器人动作，旨在克服VLA的语言-动作接地鸿沟。该范式可能重塑机器人基础模型训练格局，但面临推理成本和实时性挑战。

Anthropic 其他 2026-06-15

DXC与Anthropic深度绑定：用Claude认证工程师军团锁定关键任务AI部署

DXC与Anthropic宣布多年全球合作，DXC成为Claude Partner Network全球顶级合作伙伴。双方将培训数万名Claude认证工程师，通过DXC OASIS平台在银行、保险、制造等关键任务环境中部署Claude模型，采用“Customer Zero”内部验证模式。

Cloudflare 其他 2026-06-15

Cloudflare吸纳Ensemble团队：架构级模型压缩重塑边缘推理经济

Cloudflare宣布吸纳Ensemble AI核心团队，引入其架构级模型压缩技术NdLinear和NdLinear-LoRA。该技术通过保留多维激活结构而非扁平化处理，直接减少Transformer模型的参数量和计算开销。此举旨在显著降低Workers AI平台的推理成本，提升GPU利用率，并加速全球边缘AI部署。

NVIDIA 其他 2026-06-13

NVIDIA GB300 NVL72在Agentic AI基准测试中实现20倍能效跃升，定义新推理标准

NVIDIA在第三方AA-AgentPerf基准测试中，凭借GB300 NVL72的72 GPU NVLink域、MXFP4/MXFP8内核及MoE优化，实现每兆瓦并发agent数达H200的20倍。该基准首次标准化agentic推理性能度量，直接冲击数据中心容量规划。

Anthropic 其他 2026-06-11

Anthropic借DXC锁定受监管行业：Claude认证工程师与OASIS平台成新控制点

Anthropic与DXC Technology达成全球联盟，DXC将培训数万名Claude认证的前沿部署工程师，并将Claude深度集成到其管理的银行、航空等关键系统中。DXC的AI原生平台OASIS已默认使用Claude，且95%以上代码由Claude生成，形成深度依赖。

NVIDIA 其他 2026-06-11

NVIDIA发布Halos OS：以安全认证操作系统夺取自动驾驶控制权

NVIDIA推出Halos全栈安全系统，包括ASIL D认证的Halos Core操作系统、标准化传感器抽象层Halos SDK、AI安全护栏Halos Applications，以及云端安全评估框架SEF。该系统基于DRIVE Hyperion平台，旨在为L4级自动驾驶提供内建安全，而非事后补丁。

NVIDIA 其他 2026-06-11

NVIDIA联手Google DeepMind推出并行文本生成模型，吞吐量突破1000 tokens/sec

NVIDIA宣布与Google DeepMind合作优化DiffusionGemma，该模型基于扩散去噪实现每步并行生成256个token，在单个H100上达到1000 tokens/sec，并通过NIM和NeMo提供即用部署，显著降低推理成本和延迟。

AMD 其他 2026-06-11

AMD携手戴尔与剑桥大学，以开放ROCm生态撬动英国主权AI算力基建

AMD联合戴尔和剑桥大学宣布建立英国主权AI创新实验室（SAIL），部署基于第五代EPYC和Instinct MI355X GPU的Zenith超级计算机，以及用于聚变能源研究的Sunrise系统。该实验室旨在推动开放、可互操作的AI基础设施，以ROCm软件栈为核心，对抗NVIDIA的CUDA生态锁定，为英国政府和研究机构提供长期技术选择。

ARM 其他 2026-06-10

ARM以Neural Dawn演示移动神经图形：专用加速器将改写移动GPU架构

Arm联合Sumo Digital发布Neural Dawn，首款移动端支持Unreal Engine MegaLights的游戏。通过下一代Mali GPU内置神经加速器，实现桌面级实时光线追踪和动态照明，同时维持移动功耗预算。这标志着移动图形从传统渲染向AI原生管线的转折点。

Google 其他 2026-06-10

Google发布Lightning Engine：4.9x性能提升背后的生态锁定与架构隐忧

Google Cloud宣布Lightning Engine全面可用，基于开源Gluten和Velox实现向量化原生执行，声称性能提升4.9倍，价格性能比领先2倍。深度优化Cloud Storage和BigQuery连接器，但通过专有集成和premium tier强化生态锁定。

AMD 其他 2026-06-10

AMD EPYC以机架级密度宣战：Agentic AI的CPU控制权之争

AMD发布博客，宣称其EPYC处理器在机架级性能上领先NVIDIA Vera和Intel Xeon，专为Agentic AI的CPU密集型服务（如编排、缓存、数据库）设计。通过100kW机架模型，EPYC 9965（Turin）实现2.37倍于Vera的吞吐量，下一代“Venice”将扩展至3.30倍。强调现有x86平台即可部署，无需等待未来架构。

Microsoft 其他 2026-06-09

微软借KPMG全球部署Agent 365，锁定企业AI代理管理控制平面

KPMG宣布全球采用Microsoft Agent 365管理AI代理，并扩展Copilot部署。Agent 365成为KPMG Workbench的核心治理层，协调跨系统、数据与业务流程的AI代理。此举将微软的AI管理平台深度嵌入全球最大咨询公司的交付体系，形成对企业AI代理生命周期的集中控制。

NVIDIA 其他 2026-06-09

NVIDIA NVFP4：原生4位训练实现1.73倍吞吐跃升，锁定Blackwell生态

NVIDIA发布NVFP4格式，利用Blackwell原生硬件支持，在JAX/MaxText中实现4位混合精度预训练。相比FP8基线，Llama 3.1 405B在GB300上获得1.73倍吞吐提升，且精度无损失。该技术通过微块缩放、随机哈达玛变换等创新，显著降低训练成本，但深度绑定NVIDIA硬件生态。

NVIDIA 其他 2026-06-08

NVIDIA 借英国主权AI基金，从芯片商跃升为国家AI基础设施的幕后控制者

NVIDIA 与英国政府合作，通过 Isambard-AI（搭载 5,400 颗 GH200）及 Sovereign AI Fund，扶持本地初创（Cosine, Cursive, Doubleword）。此举表面是技术部署，实则是 NVIDIA 构建主权AI控制平面，将国家算力锁入其生态系统，削弱AWS/Azure等传统云厂商的地位。

Intel 其他 2026-06-02

Intel联合SambaNova推机架级AI推理，CPU重掌数据中心控制权

Intel在Computex 2026发布基于Xeon 6+与SambaNova SN-50 RDUs的机架级AI基础设施，并展示由Vector Core Compute运营的完全解耦推理云（预填充用NVIDIA Blackwell，解码用RDU）。此举旨在将CPU重新置于AI推理核心，改变训练时代的GPU主导格局。

情报

筛选