open source - AI基础设施情报搜索

Microsoft 其他 2026-06-23

微软推出Azure Copilot可观测性代理，将运维控制点锁定在自家平台

微软宣布Azure Copilot可观测性代理正式商用，基于Azure Monitor构建，可跨代理、应用、基础设施和服务关联信号，提供统一运维视图。此举旨在将AI驱动的故障诊断与修复工作流深度绑定在Azure生态内。

AMD 其他 2026-06-23

AMD MI430X以200+ TFLOPS原生FP64性能，重新定义HPC与AI融合算力基线

AMD在TOP500榜单中驱动4台前十超算，并预览MI430X GPU，承诺超过200 TFLOPS原生FP64性能。此举直接针对AI for Science场景，将双精度计算作为下一代HPC与AI融合基础设施的核心指标，对NVIDIA和Intel形成直接竞争压力。

Google 其他 2026-06-18

Google AI Studio Starter Tier：预配置无服务器堆栈，以生态锁定换取零门槛部署

Google推出AI Studio Starter Tier，提供预配置的Cloud Run、Firestore、Cloud SQL for PostgreSQL和Firebase Authentication堆栈，无需支付方式即可从原型到上线。该层锁定单区域、有限API和共享配额，但支持无缝升级到完整GCP项目，旨在降低AI应用部署门槛并强化生态绑定。

NVIDIA 其他 2026-06-18

NVIDIA借法国AI基建合围欧洲：开放模型Nemotron背后的硬件锁定

NVIDIA联合法国政府、Mistral、Scaleway等部署GB200、Blackwell B300及Vera Rubin NVL72硬件，并通过Nemotron开放模型联盟吸引LINAGORA、H Company等，构建以NVIDIA为中心的AI基础设施生态，表面开放实则强化硬件依赖。

Amazon 其他 2026-06-17

Introducing Amazon Bedrock Managed Knowledge Base for faster, more accurate enterprise AI applications

...

NVIDIA 其他 2026-06-17

NVIDIA ACE本地化：用RTX硬件锁定游戏AI，控制点从云端移至GPU

NVIDIA发布ACE Game Agent SDK（开源C/C++框架）和UE5插件（ASR/SLM/TTS），将AI NPC推理完全本地化至GeForce RTX。配套DLSS 4.5插件支持多帧生成。此举旨在将游戏AI控制权从云服务商转移到NVIDIA GPU生态，但隐藏了硬件锁定与模型性能折衷。

AMD 其他 2026-06-17

AMD MLPerf 6.0：MI350系列用MXFP4实现3.5倍代际提升，多节点训练首秀

AMD在MLPerf Training 6.0中提交了最全面的结果，包括首次多节点训练（FLUX.1在512 GPU上）和MXFP4训练配方。MI355X相比MI300X在Llama 2-70B上实现3.5倍性能提升，且与NVIDIA B200的差距缩小至5%以内。10家生态伙伴验证了可复现性。

NVIDIA 其他 2026-06-16

SiMa.ai推Palette Neat：用自然语言代理环境拆解英伟达GPU护城河

SiMa.ai发布开源Palette Neat开发环境，结合低功耗Modalix SoM（<10W），通过自然语言和代理工作流将Physical AI开发周期从数月缩短至数天。其pin-compatible设计直接替换NVIDIA SoM，无需重新设计载板，旨在打破GPU生态锁定。

AMD 其他 2026-06-16

AMD与Rackspace共建30MW受管AI算力：从硅层到结果的生态重构

AMD与Rackspace签署协议，分阶段部署30MW基于AMD Instinct GPU（MI355X等）和EPYC CPU的AI计算，构建面向受监管企业的“受管AI堆栈”，提供从裸金属到推理的单一责任方服务，旨在替代传统多厂商集成模式。

AMD 其他 2026-06-15

AMD收购MEXT：用AI预测让Flash逼近DRAM，降低AI内存TCO

AMD宣布收购AI内存优化初创公司MEXT，其核心技术利用AI预测模型使NAND Flash在延迟和吞吐量上逼近DRAM，旨在扩展AI服务器的有效内存容量，降低总拥有成本（TCO）。该技术将被整合进AMD数据中心全线产品，包括EPYC CPU和Instinct GPU，以应对大模型对内存的饥渴。

AMD 其他 2026-06-15

AMD通过Vultr开源AI软件组件，向NVIDIA CUDA生态发起生态重构挑战

AMD通过Vultr Marketplace发布开源、模块化的企业AI软件组件，包括AMD Inference Microservices (AIMs)、AI Workbench、Resource Manager和Solution Blueprints。该组合旨在提供生产级AI基础设施，避免单一厂商锁定，直接挑战NVIDIA的CUDA生态。

Cloudflare 其他 2026-06-15

Cloudflare吸纳Ensemble团队：架构级模型压缩重塑边缘推理经济

Cloudflare宣布吸纳Ensemble AI核心团队，引入其架构级模型压缩技术NdLinear和NdLinear-LoRA。该技术通过保留多维激活结构而非扁平化处理，直接减少Transformer模型的参数量和计算开销。此举旨在显著降低Workers AI平台的推理成本，提升GPU利用率，并加速全球边缘AI部署。

NVIDIA 其他 2026-06-13

NVIDIA推AgentPerf基准测试：Blackwell Ultra每瓦代理数较Hopper提升20倍

NVIDIA与Artificial Analysis联合发布首个Agentic AI基准测试AgentPerf，结果显示GB300 NVL72平台在运行DeepSeek V4 Pro等MoE模型时，每兆瓦可承载的并发代理数较HGX H200提升20倍。该基准模拟真实编码代理轨迹，测量端到端吞吐与响应延迟。

NVIDIA 其他 2026-06-11

NVIDIA发布Halos OS：以安全认证操作系统夺取自动驾驶控制权

NVIDIA推出Halos全栈安全系统，包括ASIL D认证的Halos Core操作系统、标准化传感器抽象层Halos SDK、AI安全护栏Halos Applications，以及云端安全评估框架SEF。该系统基于DRIVE Hyperion平台，旨在为L4级自动驾驶提供内建安全，而非事后补丁。

NVIDIA 其他 2026-06-11

NVIDIA联手Google DeepMind推出并行文本生成模型，吞吐量突破1000 tokens/sec

NVIDIA宣布与Google DeepMind合作优化DiffusionGemma，该模型基于扩散去噪实现每步并行生成256个token，在单个H100上达到1000 tokens/sec，并通过NIM和NeMo提供即用部署，显著降低推理成本和延迟。

NVIDIA 其他 2026-06-11

NVIDIA借DiffusionGemma并行生成，将本地AI推理控制权锁定于自家GPU

NVIDIA优化Google DeepMind的DiffusionGemma开源模型，该模型通过并行生成256 tokens（非逐token）实现4倍加速。在H100上达1000 tokens/sec，DGX Spark上150 tokens/sec，完全本地运行，无云成本。此举强化了NVIDIA GPU在计算密集型本地AI推理中的核心地位。

AMD 其他 2026-06-11

AMD携手戴尔与剑桥大学，以开放ROCm生态撬动英国主权AI算力基建

AMD联合戴尔和剑桥大学宣布建立英国主权AI创新实验室（SAIL），部署基于第五代EPYC和Instinct MI355X GPU的Zenith超级计算机，以及用于聚变能源研究的Sunrise系统。该实验室旨在推动开放、可互操作的AI基础设施，以ROCm软件栈为核心，对抗NVIDIA的CUDA生态锁定，为英国政府和研究机构提供长期技术选择。

AMD 其他 2026-06-10

AMD EPYC以机架级密度宣战：Agentic AI的CPU控制权之争

AMD发布博客，宣称其EPYC处理器在机架级性能上领先NVIDIA Vera和Intel Xeon，专为Agentic AI的CPU密集型服务（如编排、缓存、数据库）设计。通过100kW机架模型，EPYC 9965（Turin）实现2.37倍于Vera的吞吐量，下一代“Venice”将扩展至3.30倍。强调现有x86平台即可部署，无需等待未来架构。

NVIDIA 其他 2026-06-08

NVIDIA 借英国主权AI基金，从芯片商跃升为国家AI基础设施的幕后控制者

NVIDIA 与英国政府合作，通过 Isambard-AI（搭载 5,400 颗 GH200）及 Sovereign AI Fund，扶持本地初创（Cosine, Cursive, Doubleword）。此举表面是技术部署，实则是 NVIDIA 构建主权AI控制平面，将国家算力锁入其生态系统，削弱AWS/Azure等传统云厂商的地位。

NVIDIA 其他 2026-06-08

NVIDIA与LG共建AI工厂：以DSX平台锁定物理AI全栈生态

NVIDIA与LG集团联合建设AI工厂，基于NVIDIA DSX平台整合Isaac Sim/Lab、Cosmos、GR00T等框架，覆盖机器人、自动驾驶、数据中心及主权AI。LG各子公司分工明确，从冷却组件到机器人平台均深度绑定NVIDIA架构，形成排他性生态。

情报

筛选

微软推出Azure Copilot可观测性代理，将运维控制点锁定在自家平台

AMD MI430X以200+ TFLOPS原生FP64性能，重新定义HPC与AI融合算力基线

Google AI Studio Starter Tier：预配置无服务器堆栈，以生态锁定换取零门槛部署

NVIDIA借法国AI基建合围欧洲：开放模型Nemotron背后的硬件锁定

Introducing Amazon Bedrock Managed Knowledge Base for faster, more accurate enterprise AI applications

NVIDIA ACE本地化：用RTX硬件锁定游戏AI，控制点从云端移至GPU

AMD MLPerf 6.0：MI350系列用MXFP4实现3.5倍代际提升，多节点训练首秀

SiMa.ai推Palette Neat：用自然语言代理环境拆解英伟达GPU护城河

AMD与Rackspace共建30MW受管AI算力：从硅层到结果的生态重构

AMD收购MEXT：用AI预测让Flash逼近DRAM，降低AI内存TCO

AMD通过Vultr开源AI软件组件，向NVIDIA CUDA生态发起生态重构挑战

Cloudflare吸纳Ensemble团队：架构级模型压缩重塑边缘推理经济

NVIDIA推AgentPerf基准测试：Blackwell Ultra每瓦代理数较Hopper提升20倍

NVIDIA发布Halos OS：以安全认证操作系统夺取自动驾驶控制权

NVIDIA联手Google DeepMind推出并行文本生成模型，吞吐量突破1000 tokens/sec

NVIDIA借DiffusionGemma并行生成，将本地AI推理控制权锁定于自家GPU

AMD携手戴尔与剑桥大学，以开放ROCm生态撬动英国主权AI算力基建

AMD EPYC以机架级密度宣战：Agentic AI的CPU控制权之争

NVIDIA 借英国主权AI基金，从芯片商跃升为国家AI基础设施的幕后控制者

NVIDIA与LG共建AI工厂：以DSX平台锁定物理AI全栈生态