筛选

×
当前筛选 清除全部
关键词: AI infrastructure ×
112 情报总数
2/6 当前页
Cisco 其他 强信号 2026-05-23

思科发布内部RAG平台DRIFT,展示企业AI基础设施蓝图

思科IT部门推出名为DRIFT的文档检索与摄取框架工具包,旨在标准化和规模化企业内部RAG应用开发流程。该平台基于云原生微服务架构,运行在思科自有的AI POD基础设施上,提供从文档预处理到检索重排的端到端流水线,并支持Agentic RAG等演进用例。

NVIDIA 其他 强信号 2026-05-22

NVIDIA开源GPU Usage Monitor,简化Kubernetes集群GPU监控

NVIDIA发布开源项目GPU Usage Monitor,通过一个预集成的Helm Chart,将DCGM Exporter、kube-state-metrics、Prometheus和Grafana打包部署,为Kubernetes集群中的GPU资源提供开箱即用的实时监控能力。此举旨在解决AI工作负载在K8s环境中GPU利用率不透明、资源调度盲点等运营难题。

NVIDIA 其他 强信号 2026-05-22

NVIDIA在COMPUTEX展示Vera Rubin NVL72等AI基础设施创新

NVIDIA在COMPUTEX 2026上获得多项最佳选择奖,其Vera Rubin NVL72机柜级AI超算、Jetson Thor边缘平台及Alpamayo自动驾驶开放平台获奖,展示了其在AI工厂、边缘推理和物理AI领域的基础设施布局。

Cisco 其他 强信号 2026-05-21

思科全面拥抱SONiC,提供从硬件到软件的全栈开放网络方案

思科宣布在其Cisco 8000和即将推出的N9000系列交换机上全面支持开放网络操作系统SONiC,并提供构建自有发行版和预构建镜像两种消费模式。此举旨在将思科硅芯片性能与SONiC的开放架构相结合,为AI和高性能工作负载提供可编程、可扩展的网络基础设施。

Cisco 其他 强信号 2026-05-20

思科通过芯片层智能包流重塑AI数据中心网络架构

思科推出基于Silicon One G300芯片的智能包流技术,将网络从高速传输层转变为具备感知、适应和优化能力的智能系统,以应对大规模AI工作负载。该技术通过硬件级遥测、自适应路由和拥塞管理,显著提升AI集群的集体完成时间和GPU利用率。

Intel 其他 强信号 2026-05-20

英特尔以集成SoC架构推动边缘AI机器人计算从独立GPU迁移

英特尔宣布其Core Ultra Series 3处理器正被多家机器人公司采用,以集成CPU、GPU、NPU的SoC架构替代昂贵、高功耗的独立GPU,用于边缘AI推理。这标志着机器人“大脑”向成本效益更高、更易部署的集成化异构计算架构转变。

AMD 其他 强信号 2026-05-20

AMD定义“智能代理计算机”新品类,推动AI推理本地化

AMD提出“智能代理计算机”概念,旨在通过本地化硬件(Ryzen™ AI Max处理器、Radeon™ AI PRO显卡)运行持续AI推理工作负载,以应对云API成本上升。其核心是推动AI从云端按需消费模式向本地固定成本、高吞吐量模式转移。

AMD 其他 强信号 2026-05-20

AMD发布AI Halo开发平台与Max PRO 400系列处理器,瞄准本地AI代理计算

AMD发布Ryzen AI Halo开发者平台和Ryzen AI Max PRO 400系列处理器,旨在为本地AI代理(Agent)应用提供开发与运行环境。新平台支持高达2000亿参数模型本地运行,并提供高达192GB统一内存,推动AI工作负载从云端向边缘设备迁移。

NVIDIA 其他 强信号 2026-05-20

NVIDIA与Google Cloud深化开发者生态融合,推进AI基础设施与应用栈整合

NVIDIA与Google Cloud联合开发者社区规模超10万人,提供从JAX优化、NVIDIA Dynamo推理优化到AI水印(SynthID)的全栈学习路径。此举旨在通过整合双方底层硬件(Blackwell/Rubin GPU)、云平台(GKE, AI Hypercomputer)与软件框架(Nemotron, Gemma),加速企业级AI应用从原型到生产的落地。

Microsoft 其他 强信号 2026-05-19

微软发布新一代Surface商用设备,强化端侧AI与安全集成

微软发布新一代Surface Pro和Surface Laptop商用版,搭载英特尔酷睿Ultra Series 3及后续骁龙X2处理器,强调端侧AI推理、安全设计和全栈管理。设备作为Windows AI API和Foundry平台参考硬件,旨在成为企业混合AI战略的硬件基础。

NVIDIA 其他 强信号 2026-05-19

NVIDIA与戴尔发布全栈AI工厂,加速企业级Agentic AI部署

NVIDIA与戴尔深化合作,推出更新版Dell AI Factory with NVIDIA,旨在为企业提供从工作站到数据中心的端到端Agentic AI推理与部署平台。该平台整合了NVIDIA Vera Rubin GPU、Vera CPU、Confidential Computing及Nemotron模型,强调安全、高性能的本地化AI基础设施,以应对激增的AI推理需求。

Google 其他 强信号 2026-05-18

谷歌分享数据中心基础设施大规模A/B实验方法论

谷歌公开其数据中心基础设施层进行大规模A/B实验的四大支柱方法,包括机器级实验、平衡设置、二进制密封性和性能指标选择,旨在安全、精准地验证系统级微小优化。

Cisco 其他 强信号 2026-05-15

思科与SūmerSports合作,将AI推理基础设施部署于客户本地环境

思科通过其AI POD解决方案,与体育分析平台SūmerSports合作,在NFL球队内部署了完整的本地AI基础设施。此举旨在解决体育行业对数据主权、低延迟和集成复杂性的核心关切,将AI推理能力直接带入数据所在环境。

Cisco 其他 强信号 2026-05-14

思科推动服务商将边缘基础设施转型为AI服务平台

思科通过其博客阐述了服务提供商在AI需求驱动下面临的边缘计算新机遇,即利用其大规模分布式网络基础设施,提供包含AI推理、本地数据处理在内的企业服务。思科统一边缘平台旨在解决跨数千个站点的规模化、自动化部署与管理挑战。

Cisco 其他 强信号 2026-05-14

思科借SRv6与MRC协议,强化其在AI基础设施网络层的核心地位

思科通过其博客强调,其主导的SRv6网络架构是支撑OpenAI等巨头发布的MRC协议的关键基础。这标志着AI超算网络正从传统ECMP向基于SRv6的确定性、应用驱动架构演进,思科试图将自身定位为这一变革的核心标准制定者和技术提供方。

Cisco 其他 强信号 2026-05-13

思科在ONUG 2026提出AI数据中心网络与安全融合架构

思科在ONUG 2026峰会上,围绕AI Agentic时代的数据中心,系统阐述了其融合网络与安全的AI原生基础设施蓝图。其核心是通过将安全策略(如防火墙、微分段)卸载至DPU,并利用AI驱动的运维模型,解决AI工作负载对网络性能与安全隔离的双重苛刻需求。

NVIDIA 其他 强信号 2026-05-13

英伟达联合Ineffable Intelligence,共同设计强化学习基础设施

英伟达与由AlphaGo架构师David Silver创立的Ineffable Intelligence达成工程级合作,旨在共同设计面向大规模强化学习(RL)的基础设施。双方将基于Grace Blackwell平台探索RL训练流水线,并计划适配下一代Vera Rubin平台,以应对RL对互连、内存带宽和实时服务带来的独特挑战。

NVIDIA 其他 强信号 2026-05-13

英伟达通过Hermes与Qwen 3.6推动本地AI Agent基础设施

英伟达联合Nous Research推广开源AI Agent框架Hermes,并适配阿里通义千问Qwen 3.6模型,旨在构建一个以RTX PC和DGX Spark为核心的、可靠的本地AI Agent运行环境。此举将高性能AI Agent的部署边界从云端扩展至企业边缘和个人设备。

Cisco 其他 强信号 2026-05-12

思科与红帽深化AI基础设施集成,推动核心到边缘的智能平台

思科在红帽峰会上展示其与红帽生态的深度集成,涵盖AI POD、统一边缘、网络即代码及安全AI工厂。通过将Ansible、Splunk、Isovalent eBPF能力嵌入OpenShift平台,旨在为企业提供从核心到边缘的、可编程且安全的AI基础设施统一控制平面。

NVIDIA 其他 强信号 2026-05-12

NVIDIA与SAP合作,将OpenShell嵌入企业AI平台,为AI Agent提供运行时安全层。

NVIDIA与SAP宣布深化合作,将NVIDIA开源的AI Agent运行时安全框架OpenShell嵌入SAP Business AI Platform,作为所有AI Agent的安全执行层。此举旨在通过基础设施级隔离、策略执行和审计追踪,解决企业部署自主AI Agent时的信任与治理难题。