Filter

×
当前筛选 清除全部
关键词: AI Inference ×
36 情报总数
1/2 当前页
Amazon Other 强信号 2026-05-26

AWS SageMaker 通过 OpenAI 兼容 API 争夺 AI 推理控制权

AWS 宣布其 Amazon SageMaker AI 推理端点现支持 OpenAI 兼容的 API 接口。此举使开发者无需修改代码即可将基于 OpenAI API 构建的 AI 应用迁移至 SageMaker 平台,显著降低了从 OpenAI 向 AWS AI 基础设施迁移的技术与锁定门槛。

Google Other 强信号 2026-05-19

谷歌发布统一AI Agent开发工具包,整合本地与云端部署

谷歌在I/O大会上发布统一AI Agent开发工具包,包含Antigravity 2.0和Managed Agents API,旨在通过共享的A2A协议层,为开发者提供从本地快速原型到安全合规云部署的完整路径。该举措将Gemini Enterprise Agent Platform能力延伸至本地开发工具,提供从低代码到完全代码控制的多层次选择。

NVIDIA Other 强信号 2026-05-19

NVIDIA与戴尔发布全栈AI工厂,加速企业级Agentic AI部署

NVIDIA与戴尔深化合作,推出更新版Dell AI Factory with NVIDIA,旨在为企业提供从工作站到数据中心的端到端Agentic AI推理与部署平台。该平台整合了NVIDIA Vera Rubin GPU、Vera CPU、Confidential Computing及Nemotron模型,强调安全、高性能的本地化AI基础设施,以应对激增的AI推理需求。

Cisco Other 强信号 2026-05-14

思科推动服务商将边缘基础设施转型为AI服务平台

思科通过其博客阐述了服务提供商在AI需求驱动下面临的边缘计算新机遇,即利用其大规模分布式网络基础设施,提供包含AI推理、本地数据处理在内的企业服务。思科统一边缘平台旨在解决跨数千个站点的规模化、自动化部署与管理挑战。

NVIDIA Other 强信号 2026-05-13

英伟达通过Hermes与Qwen 3.6推动本地AI Agent基础设施

英伟达联合Nous Research推广开源AI Agent框架Hermes,并适配阿里通义千问Qwen 3.6模型,旨在构建一个以RTX PC和DGX Spark为核心的、可靠的本地AI Agent运行环境。此举将高性能AI Agent的部署边界从云端扩展至企业边缘和个人设备。

NVIDIA Other 强信号 2026-05-13

英伟达发布AI模型部署最佳实践,强调TensorRT与Dynamo-Triton集成

英伟达通过官方博客详细阐述了消除AI模型服务“流水线摩擦”的系统性方法,核心是推广其TensorRT优化工具与Dynamo-Triton服务平台的深度集成,旨在将模型从训练到部署的流程标准化和高效化。

Cisco Other 强信号 2026-05-12

思科与红帽深化AI基础设施集成,推动核心到边缘的智能平台

思科在红帽峰会上展示其与红帽生态的深度集成,涵盖AI POD、统一边缘、网络即代码及安全AI工厂。通过将Ansible、Splunk、Isovalent eBPF能力嵌入OpenShift平台,旨在为企业提供从核心到边缘的、可编程且安全的AI基础设施统一控制平面。

Cisco Other 强信号 2026-05-07

思科联合AMD发布AI网络性能基准,验证以太网承载大规模AI训练能力

思科与AMD合作,通过发布基于N9000交换机与Pensando Pollara 400 NIC的详细性能基准测试,验证了以太网架构在承载大规模AI训练(如128个GPU集群)时的确定性性能。测试覆盖了多种拓扑和极端拥塞场景,旨在将网络从瓶颈转变为高性能AI基础设施的核心引擎。

ARM Other 强信号 2026-05-07

Arm发布创纪录财报,AGI CPU成为AI基础设施新焦点

Arm发布2026财年创纪录业绩,年收入达49.2亿美元,连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU,其数据中心市场获得超20亿美元客户需求,并获Meta、AWS、Google等巨头支持。

Intel Other 中信号 2026-05-06

英特尔在Computex 2026强调CPU在AI计算中的关键角色

英特尔将在Computex 2026上阐述其对AI驱动计算时代的愿景,核心论点是CPU作为AI计算关键引擎的复兴,强调其与GPU/加速器协同,在x86广泛生态基础上构建高效、可扩展的AI系统。

NVIDIA Other 强信号 2026-05-06

NVIDIA推出车载AI Box架构,将高级LLM推理作为独立ECU模块

NVIDIA发布车载AI Box架构,基于DRIVE AGX平台提供模块化AI计算单元,可将高级LLM/VLM推理能力作为独立ECU添加至现有座舱系统。该方案旨在解决车载AI对实时性、隐私和算力的严苛要求,并支持与云端AI的混合编排。

Intel Other 中信号 2026-05-04

英特尔任命新领导层,整合客户端计算与物理AI业务

英特尔任命Alex Katouzian为客户端计算与物理AI业务总经理,并任命Pushkar Ranade为CTO。此举旨在将传统PC业务与机器人、自主机器等物理AI系统对齐,并推动量子计算等前沿技术研发。

Cisco Other 强信号 2026-05-01

思科发布AI网络流量报告,揭示智能体AI对广域网的根本性影响

思科基于真实网络流量数据发布研究报告,首次量化分析智能体AI对广域网流量模式、对称性及关键路径的颠覆性影响,并预测到2035年AI推理流量将占网络总流量的25%。

Intel Other 强信号 2026-04-30

英特尔与ChatPPT合作推出混合AI PC版,推动AI工作负载本地化

英特尔与AI应用ChatPPT合作,利用其AI Super Builder技术推出混合AI PC版。该版本将部分AI工作负载(如格式调整)从云端卸载至本地PC处理,降低了50%的云成本并提升了32%的用户使用时长,同时增强了数据隐私。

NVIDIA Other 强信号 2026-04-30

英伟达发布企业级AI工厂参考架构,推动本地AI基础设施标准化

英伟达发布企业级AI工厂参考架构,为本地部署提供从RTX PRO到NVL72的三种标准化配置。该架构整合了计算、网络、存储及软件,旨在将AI基础设施从实验性部署转变为可预测、可扩展的工业化运营平台。

AMD Other 强信号 2026-04-29

AMD与Liquid AI探讨从芯片到系统的高效AI架构

AMD CTO与Liquid AI CEO探讨AI架构演进,强调效率是AI从云端向边缘和终端设备扩展的关键。双方认为,通过从芯片到系统的协同设计,可实现低功耗、高响应性的AI推理,支持持续运行的智能体与多模型协同。

Cisco Other 强信号 2026-04-28

思科借硬件更新周期推动AI就绪数据中心架构

思科通过博客指出,企业AI战略受阻的核心在于数据中心基础设施。其主张将AI就绪性融入常规硬件更新周期,强调通过统一运营、网络内嵌安全、端到端可观测性及高性能网络来构建AI基础设施。

Microsoft Other 强信号 2026-04-28

微软发布Azure Local大规模扩展,支持主权私有云部署数千节点

微软宣布Azure Local平台现可支持在单一主权边界内部署数千台服务器,为大规模主权私有云提供基础设施。该平台支持在连接、间歇连接或完全断开的环境下运行,并集成了英特尔Xeon 6处理器等硬件,旨在满足国家基础设施、受监管工作负载和本地AI推理对规模、控制与合规性的综合需求。

Google Other 强信号 2026-04-22

Google发布Gemini企业级代理平台,定义AI代理时代技术栈

Google在Next '26上发布Gemini企业级代理平台,提供构建、扩展、治理和优化AI代理的端到端解决方案。该平台整合了新的AI基础设施、数据云、安全防御和任务执行能力,旨在将企业流程统一为单一智能工作流。

Cisco Other 强信号 2026-04-16

思科携手英伟达,将网络升级为AI媒体处理的控制平面

思科与英伟达深化合作,推出基于开放标准MXL的验证设计方案。该方案将思科IP媒体架构与英伟达Holoscan平台整合,使网络从传输层演变为支持实时AI推理的主动处理层,为广电行业实现低延迟、多语言的实时AI媒体生产。