Generative AI - AI基础设施情报搜索

NVIDIA 其他 2026-06-25

高通发布Dragonfly数据中心CPU与HBC内存，以推理优先架构挑战NVIDIA霸权

高通在投资者日公布完整数据中心路线图，包括250核Oryon CPU（Dragonfly C1000）、近内存计算HBC（声称133TB/s带宽）、AI300推理加速器（54x带宽提升），以及800G/1.6T互联。与Meta签署多年CPU供应协议，2028年商用，旨在以低功耗高带宽颠覆AI推理市场。

Nokia 其他 2026-06-24

Nokia, Amazon Web Services expand collaboration to deliver autonomous networks built for the AI era

...

NVIDIA 其他 2026-06-23

NVIDIA借AI代理与数字孪生重塑电信网络控制平面

NVIDIA在DTW Ignite 2026展示其AI代理平台，集成NeMo合成数据、NemoClaw安全运行时、OpenShell沙箱及RTX PRO 6000加速的数字孪生，旨在实现电信网络自主运营。合作伙伴包括SoftBank、Amdocs、NTT DATA等，共同推动从任务自动化向自主网络转型。

NVIDIA 其他 2026-06-18

NVIDIA借法国AI基建合围欧洲：开放模型Nemotron背后的硬件锁定

NVIDIA联合法国政府、Mistral、Scaleway等部署GB200、Blackwell B300及Vera Rubin NVL72硬件，并通过Nemotron开放模型联盟吸引LINAGORA、H Company等，构建以NVIDIA为中心的AI基础设施生态，表面开放实则强化硬件依赖。

Amazon 其他 2026-06-17

Introducing Amazon Bedrock Managed Knowledge Base for faster, more accurate enterprise AI applications

...

NVIDIA 其他 2026-06-17

NVIDIA RTX Remix 1.5：用RTX IO压缩和AI Agent重塑游戏MOD生态，强化GPU锁定

NVIDIA发布RTX Remix 1.5更新，核心亮点是引入RTX IO技术，将《半条命2 RTX》文件大小从80GB压缩至50GB，并降低CPU开销。同时，新增AI Agent集成（RTX Remix Skills），允许AI编码代理自动执行复杂的MOD制作步骤，降低非程序员用户的入门门槛。

Google Cloud 其他 2026-06-17

ASUS联手NVIDIA推出桌面级AI超算，企业AI控制权从云端向本地急剧转移

ASUS发布基于NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip的ExpertCenter Pro ET900N G3桌面系统，提供20 PFLOPS AI算力与748GB一致内存，可运行近万亿参数模型。同时，Coherent在德州扩建磷化铟工厂保障光互联供应，NVIDIA计划发行200-250亿美元债券筹资。

Amazon 其他 2026-06-17

AWS S3推出Annotations：1GB可变元数据直接嵌入对象，重塑AI数据湖元数据范式

AWS发布S3 Annotations，允许为每个对象附加最多1,000个、每个1MB的注解，总计1GB，支持JSON/XML/YAML，可随时修改。注解自动索引到Apache Iceberg表，可通过Athena查询，无需恢复对象或支付检索费。此举将元数据管理从外部数据库内嵌到存储层，彻底改变AI代理和数据湖的元数据架构。

AMD 其他 2026-06-17

AMD MLPerf 6.0：MI350系列用MXFP4实现3.5倍代际提升，多节点训练首秀

AMD在MLPerf Training 6.0中提交了最全面的结果，包括首次多节点训练（FLUX.1在512 GPU上）和MXFP4训练配方。MI355X相比MI300X在Llama 2-70B上实现3.5倍性能提升，且与NVIDIA B200的差距缩小至5%以内。10家生态伙伴验证了可复现性。

NVIDIA 其他 2026-06-15

NVIDIA携ASUS推桌面级DGX Station：GB300芯片下放，控制点从云转向本地硬件生态

ASUS发布ExpertCenter Pro ET900N G3，基于NVIDIA DGX Station GB300架构，搭载GB300 Grace Blackwell Ultra芯片，提供748GB统一内存和20 PFLOPS AI性能。该桌面级AI超算支持本地LLM微调、推理及AI agent工作负载，通过NVLink-C2C实现高速互连，并集成NVIDIA AI软件栈与NemoClaw框架。

NVIDIA 其他 2026-06-11

NVIDIA联手Google DeepMind推出并行文本生成模型，吞吐量突破1000 tokens/sec

NVIDIA宣布与Google DeepMind合作优化DiffusionGemma，该模型基于扩散去噪实现每步并行生成256个token，在单个H100上达到1000 tokens/sec，并通过NIM和NeMo提供即用部署，显著降低推理成本和延迟。

Google 其他 2026-06-10

Google发布Lightning Engine：4.9x性能提升背后的生态锁定与架构隐忧

Google Cloud宣布Lightning Engine全面可用，基于开源Gluten和Velox实现向量化原生执行，声称性能提升4.9倍，价格性能比领先2倍。深度优化Cloud Storage和BigQuery连接器，但通过专有集成和premium tier强化生态锁定。

Google 其他 2026-06-09

GKE Inference Gateway前缀缓存：AI推理延迟降低92%，但锁定风险暗藏

Google Cloud推出GKE Inference Gateway，通过前缀缓存和模型感知路由，在Llama 3.1 8B模型上实现92.8%更短首令牌延迟和15.7%更高吞吐量。Snap实测缓存命中率达75-80%。但该技术深度绑定GKE Gateway API和Google生态，企业需警惕架构弹性损失。

Amazon 其他 2026-06-06

AWS Bedrock 推出兼容 OpenAI/Anthropic API 的新控制台，争夺 AI 推理控制权

AWS 发布 Bedrock 新控制台，基于 bedrock-mantle 端点，原生支持 OpenAI 和 Anthropic API 协议，允许用户无缝切换 GPT、Claude 及开源模型。此举将模型选择与 API 标准化，旨在通过统一推理平面锁定用户工作流，削弱单一模型提供商的 API 壁垒。

Cisco 其他 2026-06-02

思科借Isovalent与VXLAN ESG，将AI网络控制点从K8s移向统一光纤

思科通过整合Isovalent的eBPF技术至Nexus One，实现从Pod到光纤的端到端可视化，并推出基于VXLAN ESG的AI作业分段，将安全与租户隔离策略直接嵌入底层网络。此举旨在解决Kubernetes‘黑箱’导致的AI推理网络瓶颈与故障定位难题。

HPE 其他 2026-06-01

HPE推NVIDIA Vera CPU服务器，重构Agentic AI硬件生态

HPE发布ProLiant DL394 Gen12，搭载NVIDIA Vera CPU，专为Agentic AI与强化学习设计。强调极致单核性能与高内存带宽，集成iLO安全与Compute Ops Management，并联合Redpanda与NYSE探索金融场景应用。

Cisco 其他 2026-05-29

Cisco与微软合围：浏览器成为零信任新控制平面，SSE集成Edge定标

Cisco Secure Access与Microsoft Edge for Business深度集成，将零信任访问、DLP、AI威胁防护直接嵌入浏览器。通过统一策略引擎，浏览器取代VPN/客户端成为私有应用访问主入口，同时将Copilot等AI代理纳入安全管控，标志着安全控制点从网络层向浏览器层转移。

Cisco 其他 2026-05-28

Cisco Scale-Across架构：硅光融合定义AI跨数据中心网络新标准

Cisco发布Scale-Across方案，基于Silicon One P200路由系统（51.2Tbps）和400G/800G ZR/ZR+相干光模块，结合开放线路系统，旨在解决AI训练因功率限制需跨数据中心分布时的网络性能问题，实现类似单机房的低延迟无损连接。

Apple 其他 2026-05-25

Apple注册genai.apple.com域名，Siri独立App与Extensions系统开启第三方AI入口

Apple在WWDC 2026前注册genai.apple.com域名，预示生成式AI成为平台支柱。Siri将升级为独立App，支持个人上下文、屏幕理解和深度应用操作。底层由Google Gemini驱动并托管在Private Cloud Compute服务器。同时推出Extensions系统，允许Claude、Gemini等第三方AI助手接入，Apple抽成。

AMD 其他 2026-05-20

AMD Ryzen AI Halo与Max PRO 400系列：本地运行300B参数模型，但隐性锁定与工程短板并存

AMD发布Ryzen AI Halo开发者平台（128GB统一内存，支持200B参数模型）及Ryzen AI Max PRO 400系列处理器（首款x86客户端运行300B参数模型）。通过统一内存架构、ROCm优化和OEM合作，推动代理AI从云端走向本地，但实际性能受限于共享内存带宽与散热设计。

情报

筛选