筛选

×
当前筛选 清除全部
关键词: inference ×
142 情报总数
4/8 当前页
ARM 其他 强信号 2026-05-07

Arm发布创纪录财报,AGI CPU成为AI基础设施新焦点

Arm发布2026财年创纪录业绩,年收入达49.2亿美元,连续三年增长超20%。财报核心亮点是专为智能体AI设计的Arm AGI CPU,其数据中心市场获得超20亿美元客户需求,并获Meta、AWS、Google等巨头支持。

AMD 其他 中信号 2026-05-07

AMD支持SPEC CPU 2026基准测试,强调开放可信性能评估

AMD发表博客支持即将发布的SPEC CPU 2026行业基准测试,强调在AI时代,开放、可复现的CPU性能评估标准对客户进行基础设施决策至关重要。该新基准更新了应用套件,并加强了对裸金属云环境和并行计算的支持。

AMD 其他 强信号 2026-05-06

AMD与OpenAI将MRC网络协议贡献给OCP,推进AI网络规模化

AMD与OpenAI、微软等合作,将专为大规模AI训练设计的网络协议MRC(多路径可靠连接)贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者,其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证,旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。

AMD 其他 强信号 2026-05-06

AMD联合OpenAI发布下一代AI训练网络传输协议MRC

AMD联合OpenAI、微软等行业领导者发布Multipath Reliable Connection(MRC)协议规范,旨在解决RoCEv2在超大规模AI训练集群中的性能瓶颈。该协议通过智能包喷洒、选择性重传和网络信号拥塞控制等机制,提升网络带宽利用率和训练任务弹性。

Anthropic 其他 强信号 2026-05-06

Anthropic与SpaceX达成算力协议,大幅提升Claude服务容量

Anthropic宣布与SpaceX达成协议,将使用其Colossus 1数据中心全部算力,获得超过300兆瓦新容量。此举旨在直接提升Claude Pro和Max订阅者的服务能力,并已立即提高Claude Code和API的使用限制。

Intel 其他 中信号 2026-05-06

英特尔在Computex 2026强调CPU在AI计算中的关键角色

英特尔将在Computex 2026上阐述其对AI驱动计算时代的愿景,核心论点是CPU作为AI计算关键引擎的复兴,强调其与GPU/加速器协同,在x86广泛生态基础上构建高效、可扩展的AI系统。

NVIDIA 其他 强信号 2026-05-06

NVIDIA推出车载AI Box架构,将高级LLM推理作为独立ECU模块

NVIDIA发布车载AI Box架构,基于DRIVE AGX平台提供模块化AI计算单元,可将高级LLM/VLM推理能力作为独立ECU添加至现有座舱系统。该方案旨在解决车载AI对实时性、隐私和算力的严苛要求,并支持与云端AI的混合编排。

NVIDIA 其他 强信号 2026-05-05

NVIDIA提出面向智能体系统的“极端协同设计”基础设施栈

NVIDIA发布技术博客,系统阐述AI智能体(Agent)工作负载对基础设施的颠覆性需求,并提出其‘极端协同设计’(Extreme Co-Design)技术栈与Vera Rubin平台作为解决方案。核心观点是传统单处理器架构无法满足智能体在长上下文、高缓存命中率和低延迟交互方面的苛刻要求,必须通过计算、网络、存储的跨层优化来重塑AI基础设施。

Google 其他 中信号 2026-05-05

谷歌通过线下工作坊推动企业AI Agent基础设施实践

谷歌在北美启动针对平台/安全工程师和数据从业者的系列线下工作坊,聚焦于在GKE和BigQuery上安全构建、部署和治理AI Agent。工作坊强调动手实践,涵盖硬件隔离、自然语言集群运维和知识图谱驱动Agent等具体技术栈。

Cisco 其他 强信号 2026-05-04

思科推动网络从承载带宽向智能平台演进

思科在服务提供商领域提出,AI驱动的流量模式正在从根本上重塑网络架构,要求网络从静态、被动响应转变为预测性、自适应的智能系统。思科正通过其全栈解决方案组合,帮助运营商实现网络设计、运营和货币化模式的转变。

Intel 其他 中信号 2026-05-04

英特尔任命新领导层,整合客户端计算与物理AI业务

英特尔任命Alex Katouzian为客户端计算与物理AI业务总经理,并任命Pushkar Ranade为CTO。此举旨在将传统PC业务与机器人、自主机器等物理AI系统对齐,并推动量子计算等前沿技术研发。

AMD 其他 中信号 2026-05-04

AMD联合戴尔展示企业AI异构计算战略

AMD在戴尔技术世界大会上强调其异构计算产品组合,旨在为不同企业AI负载匹配合适的算力,并突出硬件安全与可管理性。此举标志着AI基础设施正从通用方案转向针对具体场景的精细化部署。

Cisco 其他 强信号 2026-05-01

思科发布AI网络流量报告,揭示智能体AI对广域网的根本性影响

思科基于真实网络流量数据发布研究报告,首次量化分析智能体AI对广域网流量模式、对称性及关键路径的颠覆性影响,并预测到2035年AI推理流量将占网络总流量的25%。

NVIDIA 其他 强信号 2026-05-01

英伟达通过NemoClaw与OpenClaw合作,推动企业级自主AI代理安全部署

英伟达通过NemoClaw参考实现,整合OpenShell安全运行时与Nemotron开源模型,为企业提供安全部署“长时运行自主AI代理”的蓝图。此举旨在应对自主AI代理带来的千倍推理需求增长与安全治理挑战,将AI基础设施控制点向本地、安全、可审计的架构迁移。

NVIDIA 其他 中信号 2026-05-01

英伟达发布TensorRT for RTX插件,优化虚幻引擎AI推理性能

英伟达发布针对虚幻引擎5(UE5)的TensorRT for RTX插件,作为其Neural Network Engine(NNE)的新运行时选项。该插件通过即时编译优化,在RTX GPU上为AI后处理(如超分、去噪)任务提供比DirectML等运行时更高的推理吞吐量,展示了英伟达将高效AI推理能力嵌入主流实时图形引擎工作流的努力。

AMD 其他 强信号 2026-04-30

AMD提出AI基础设施网络架构新范式:从无损网络转向智能端点

AMD发布博客,提出构建大规模AI基础设施的七个关键问题,核心观点是传统无损以太网或InfiniBand架构存在成本与复杂性瓶颈。其主张将网络智能和可靠性功能从昂贵的专用交换机转移到智能网卡(NIC)上,在标准(可能有损)以太网上实现可靠传输,以降低总拥有成本并简化运营。

Intel 其他 强信号 2026-04-30

英特尔与ChatPPT合作推出混合AI PC版,推动AI工作负载本地化

英特尔与AI应用ChatPPT合作,利用其AI Super Builder技术推出混合AI PC版。该版本将部分AI工作负载(如格式调整)从云端卸载至本地PC处理,降低了50%的云成本并提升了32%的用户使用时长,同时增强了数据隐私。

NVIDIA 其他 强信号 2026-04-30

英伟达发布企业级AI工厂参考架构,推动本地AI基础设施标准化

英伟达发布企业级AI工厂参考架构,为本地部署提供从RTX PRO到NVL72的三种标准化配置。该架构整合了计算、网络、存储及软件,旨在将AI基础设施从实验性部署转变为可预测、可扩展的工业化运营平台。

AMD 其他 强信号 2026-04-29

AMD与Liquid AI探讨从芯片到系统的高效AI架构

AMD CTO与Liquid AI CEO探讨AI架构演进,强调效率是AI从云端向边缘和终端设备扩展的关键。双方认为,通过从芯片到系统的协同设计,可实现低功耗、高响应性的AI推理,支持持续运行的智能体与多模型协同。

Amazon 其他 强信号 2026-04-29

AWS将AI Agent平台化,并深化与OpenAI的云集成

AWS在年度活动上宣布将AI Agent能力全面产品化,推出面向工作的个人AI助手Amazon Quick,并将Amazon Connect扩展为四个垂直领域的Agentic AI解决方案。同时,AWS与OpenAI扩大合作,将最新模型、Codex及托管代理服务深度集成至Amazon Bedrock平台。