筛选

×
当前筛选 清除全部
关键词: AI Inference ×
45 情报总数
1/3 当前页
Intel 其他 强信号 2026-06-02

英特尔发布Xeon 6+处理器并推动面向智能体AI的机架级基础设施

英特尔在Computex上发布基于18A工艺的Xeon 6+处理器,强调其高能效核心密度。同时,公司联合富士康、SambaNova等合作伙伴,推动为智能体(Agentic)AI推理工作负载优化的新型机架级(Rack-Scale)基础设施,并宣布与Perplexity合作实现混合AI计算。

AMD 其他 强信号 2026-06-02

AMD Silo AI 与 Delphyr AI 深度协作,共筑临床医疗 AI 垂直解决方案

AMD Silo AI 与医疗 AI 公司 Delphyr AI 宣布深度合作,旨在将 Delphyr 的 AI 助手平台规模化部署于临床环境。合作核心是双方工程师共同优化基于 AMD Instinct 加速器和 ROCm 软件栈的高性能 embedding pipeline,确保 AI 能力能无缝集成到现有电子健康记录系统和工作流中,满足医疗行业对速度、隐私和可靠性的严苛要求。

Intel 其他 强信号 2026-06-02

英特尔联合生态伙伴推出机架级AI基础设施,瞄准推理与智能体工作负载

英特尔在Computex宣布推出基于Xeon 6+处理器与SambaNova RDUs的机架级AI基础设施,并与富士康、Vector Core Compute等合作,提供面向推理和智能体工作负载的优化系统及解耦推理云服务。此举标志着英特尔从芯片供应商向AI系统解决方案提供商的战略延伸。

Google 其他 强信号 2026-06-02

Google Cloud 集成 GKE 多集群推理网关与托管 DRANET,定义 AI 服务网格新范式

Google Cloud 通过博客和代码实验室展示了一项实验:将 TPU v6e、GKE 托管 DRANET(动态资源分配网络)、多集群 GKE Inference Gateway 与 Cloud Storage FUSE 集成,构建跨区域、高可用的 AI 推理服务。该架构利用 Fleet 统一管理集群,并通过声明式策略实现基于硬件指标(如 KV cache 使用率)的智能流量路由与故障转移。

NVIDIA 其他 强信号 2026-06-02

NVIDIA通过JetPack 7.2与NemoClaw将Agentic AI控制力延伸至物理边缘

NVIDIA发布JetPack 7.2边缘AI软件栈并集成NemoClaw框架,构建了从底层Yocto OS、中间层Agent Skills到上层Agentic AI框架的三层栈。此举旨在将数据中心成熟的AI代理开发范式与编排能力系统性地下沉至Jetson边缘平台,加速物理AI代理在机器人、工业自动化等领域的规模化生产部署。

NVIDIA 其他 强信号 2026-06-01

NVIDIA开源DSX OS,定义AI工厂全栈运营软件层

NVIDIA发布其DSX平台的软件核心DSX OS,这是一套开源、模块化的软件组件,旨在协调从芯片、系统、软件到设施(电力、冷却)的整个AI工厂堆栈。它通过DSX Exchange(MQTT通信枢纽)、MaxLPS(动态功耗管理)、Infra Controller(裸金属生命周期管理)等组件,实现IT/OT深度融合,目标是提升“每瓦特token产出”并降低token成本。

Intel 其他 强信号 2026-06-01

英特尔以Xeon 6+与E835强化CPU在AI基础设施中的控制平面地位

英特尔发布Xeon 6+处理器与Ethernet E835网络适配器,系统性阐述其AI平台战略。核心是将CPU(Xeon)定位为现代AI基础设施的“控制平面”,负责智能体(Agentic)AI工作负载的编排、并发与数据移动,而网络与加速器则作为高效数据平面。此举旨在通过提升能效与系统级协同,应对规模化AI部署的瓶颈。

NVIDIA 其他 强信号 2026-05-29

NVIDIA将Step 3.7 Flash多模态模型深度整合至其企业AI全栈

NVIDIA宣布在其加速平台上全面支持StepFun的Step 3.7 Flash模型,这是一个1980亿参数的MoE多模态模型。通过TensorRT-LLM、vLLM进行优化推理,并通过NVIDIA NIM提供生产就绪的容器化微服务部署,同时支持基于NeMo框架的Day 0微调。

Google 其他 强信号 2026-05-27

Google Cloud 系统解构无服务器AI冷启动,定义生产级部署新范式

Google Cloud 发布深度指南,将AI模型在Cloud Run上的冷启动分解为四个技术阶段,并针对每阶段提出具体优化策略,包括模型4-bit量化、镜像流传输、启动CPU Boost、专用网络路径及精细的并发度调优公式。此举旨在将无服务器平台从支持AI升级为为AI深度优化的一级生产环境。

Amazon 其他 强信号 2026-05-26

AWS SageMaker 通过 OpenAI 兼容 API 争夺 AI 推理控制权

AWS 宣布其 Amazon SageMaker AI 推理端点现支持 OpenAI 兼容的 API 接口。此举使开发者无需修改代码即可将基于 OpenAI API 构建的 AI 应用迁移至 SageMaker 平台,显著降低了从 OpenAI 向 AWS AI 基础设施迁移的技术与锁定门槛。

Google 其他 强信号 2026-05-19

谷歌发布统一AI Agent开发工具包,整合本地与云端部署

谷歌在I/O大会上发布统一AI Agent开发工具包,包含Antigravity 2.0和Managed Agents API,旨在通过共享的A2A协议层,为开发者提供从本地快速原型到安全合规云部署的完整路径。该举措将Gemini Enterprise Agent Platform能力延伸至本地开发工具,提供从低代码到完全代码控制的多层次选择。

NVIDIA 其他 强信号 2026-05-19

NVIDIA与戴尔发布全栈AI工厂,加速企业级Agentic AI部署

NVIDIA与戴尔深化合作,推出更新版Dell AI Factory with NVIDIA,旨在为企业提供从工作站到数据中心的端到端Agentic AI推理与部署平台。该平台整合了NVIDIA Vera Rubin GPU、Vera CPU、Confidential Computing及Nemotron模型,强调安全、高性能的本地化AI基础设施,以应对激增的AI推理需求。

Cisco 其他 强信号 2026-05-14

思科推动服务商将边缘基础设施转型为AI服务平台

思科通过其博客阐述了服务提供商在AI需求驱动下面临的边缘计算新机遇,即利用其大规模分布式网络基础设施,提供包含AI推理、本地数据处理在内的企业服务。思科统一边缘平台旨在解决跨数千个站点的规模化、自动化部署与管理挑战。

NVIDIA 其他 强信号 2026-05-13

英伟达通过Hermes与Qwen 3.6推动本地AI Agent基础设施

英伟达联合Nous Research推广开源AI Agent框架Hermes,并适配阿里通义千问Qwen 3.6模型,旨在构建一个以RTX PC和DGX Spark为核心的、可靠的本地AI Agent运行环境。此举将高性能AI Agent的部署边界从云端扩展至企业边缘和个人设备。

NVIDIA 其他 强信号 2026-05-13

英伟达发布AI模型部署最佳实践,强调TensorRT与Dynamo-Triton集成

英伟达通过官方博客详细阐述了消除AI模型服务“流水线摩擦”的系统性方法,核心是推广其TensorRT优化工具与Dynamo-Triton服务平台的深度集成,旨在将模型从训练到部署的流程标准化和高效化。

Cisco 其他 强信号 2026-05-12

思科与红帽深化AI基础设施集成,推动核心到边缘的智能平台

思科在红帽峰会上展示其与红帽生态的深度集成,涵盖AI POD、统一边缘、网络即代码及安全AI工厂。通过将Ansible、Splunk、Isovalent eBPF能力嵌入OpenShift平台,旨在为企业提供从核心到边缘的、可编程且安全的AI基础设施统一控制平面。

Cisco 其他 强信号 2026-05-07

思科联合AMD发布AI网络性能基准,验证以太网承载大规模AI训练能力

思科与AMD合作,通过发布基于N9000交换机与Pensando Pollara 400 NIC的详细性能基准测试,验证了以太网架构在承载大规模AI训练(如128个GPU集群)时的确定性性能。测试覆盖了多种拓扑和极端拥塞场景,旨在将网络从瓶颈转变为高性能AI基础设施的核心引擎。

ARM 其他 强信号 2026-05-07

Arm发布创纪录财报,AGI CPU成为AI基础设施新焦点

Arm发布2026财年创纪录业绩,年收入达49.2亿美元,连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU,其数据中心市场获得超20亿美元客户需求,并获Meta、AWS、Google等巨头支持。

Intel 其他 中信号 2026-05-06

英特尔在Computex 2026强调CPU在AI计算中的关键角色

英特尔将在Computex 2026上阐述其对AI驱动计算时代的愿景,核心论点是CPU作为AI计算关键引擎的复兴,强调其与GPU/加速器协同,在x86广泛生态基础上构建高效、可扩展的AI系统。

NVIDIA 其他 强信号 2026-05-06

NVIDIA推出车载AI Box架构,将高级LLM推理作为独立ECU模块

NVIDIA发布车载AI Box架构,基于DRIVE AGX平台提供模块化AI计算单元,可将高级LLM/VLM推理能力作为独立ECU添加至现有座舱系统。该方案旨在解决车载AI对实时性、隐私和算力的严苛要求,并支持与云端AI的混合编排。