筛选

×
当前筛选 清除全部
关键词: compute ×
246 情报总数
2/13 当前页
Microsoft 其他 强信号 2026-06-01

微软与英伟达共推基于Arm架构RTX Spark的Windows平台,瞄准本地AI智能体与工作站

微软与英伟达宣布深度整合,推出基于全新Arm架构RTX Spark芯片的Windows PC与工作站。该平台通过高达128GB统一内存、1 petaflop AI算力及Windows系统层优化,旨在将前沿AI模型与智能体(agent)工作负载从云端迁移至本地设备运行。

NVIDIA 其他 强信号 2026-06-01

NVIDIA发布Vera CPU,为AI代理工作负载定义新设计标准

NVIDIA推出基于自研Olympus核心的Vera CPU,针对AI代理和强化学习工作负载中的‘工具调用-执行’循环进行架构优化。该CPU通过高单核性能、高并发及高效LPDDR5X内存子系统,旨在提升AI工厂中CPU关键路径的性能,从而增加整体AI输出吞吐量和能效。

NVIDIA 其他 强信号 2026-06-01

NVIDIA开源DSX OS,定义AI工厂全栈运营软件层

NVIDIA发布其DSX平台的软件核心DSX OS,这是一套开源、模块化的软件组件,旨在协调从芯片、系统、软件到设施(电力、冷却)的整个AI工厂堆栈。它通过DSX Exchange(MQTT通信枢纽)、MaxLPS(动态功耗管理)、Infra Controller(裸金属生命周期管理)等组件,实现IT/OT深度融合,目标是提升“每瓦特token产出”并降低token成本。

Intel 其他 强信号 2026-06-01

英特尔以Xeon 6+与E835强化CPU在AI基础设施中的控制平面地位

英特尔发布Xeon 6+处理器与Ethernet E835网络适配器,系统性阐述其AI平台战略。核心是将CPU(Xeon)定位为现代AI基础设施的“控制平面”,负责智能体(Agentic)AI工作负载的编排、并发与数据移动,而网络与加速器则作为高效数据平面。此举旨在通过提升能效与系统级协同,应对规模化AI部署的瓶颈。

Intel 其他 强信号 2026-06-01

英特尔推出统一硬件-软件堆栈,瞄准物理AI机器人规模化部署

英特尔宣布其Series 3处理器已获得130多个边缘AI与机器人设计项目,并推出开源框架OpenVINO Physical AI。该组合旨在解决机器人从实验模型到规模化生产部署的碎片化挑战,通过统一的硬件-软件堆栈降低总拥有成本。

NVIDIA 其他 强信号 2026-06-01

NVIDIA RTX Spark发布:AI PC时代的开启

NVIDIA在Computex 2026正式发布RTX Spark——首款面向AI Agent时代的Windows PC超级芯片。该芯片基于TSMC 3nm工艺,整合Blackwell架构GPU(6144 CUDA核心+第五代Tensor Core,FP4精度)与20核Grace CPU,通过NVLink-C2C互联(600GB/s),提供1 petaflop AI算力和最高128GB统一LPDDR5X内存(300GB/s带宽)。笔记本最薄14mm、最轻3磅,支持本地运行1200亿参数大模型。NVIDIA与微软合作推出OpenShell运行时和Windows安全原语,Adobe正在为RTX Spark重新架构Photoshop和Premiere。首批设备秋季上市,来自ASUS、Dell、HP、Lenovo、Microsoft Surface、MSI,Acer和GIGABYTE随后跟进。预计售价$3000-4000。RTX Spark路线图延伸至2030年:2027年升级Vera CPU+Rubin GPU+LPDDR6,2029-2030年Rosa CPU+Feynman GPU。这是继2020年Apple M1之后PC行业最大的架构变革信号。

NVIDIA 其他 强信号 2026-05-30

NVIDIA 发布 DynoSim 仿真框架,将 AI 服务栈优化从硬件试错转向模拟优先

NVIDIA 推出 DynoSim,这是一个基于 Rust 的、全栈离散事件仿真框架,用于对 NVIDIA Dynamo AI 服务栈进行原子级模拟。它通过虚拟时钟和组件化事件队列,将配置搜索和算法研究从昂贵的 GPU 硬件实验转变为快速模拟验证循环,旨在高效探索服务部署的帕累托前沿。

NVIDIA 其他 强信号 2026-05-29

NVIDIA将Step 3.7 Flash多模态模型深度整合至其企业AI全栈

NVIDIA宣布在其加速平台上全面支持StepFun的Step 3.7 Flash模型,这是一个1980亿参数的MoE多模态模型。通过TensorRT-LLM、vLLM进行优化推理,并通过NVIDIA NIM提供生产就绪的容器化微服务部署,同时支持基于NeMo框架的Day 0微调。

Anthropic 其他 强信号 2026-05-29

Anthropic完成650亿美元H轮融资,估值逼近万亿并锁定海量算力

Anthropic宣布完成650亿美元H轮融资,投后估值达9650亿美元。资金将用于安全研究、扩展算力以满足Claude需求,并深化与亚马逊、谷歌、SpaceX等基础设施伙伴的合作,锁定高达10吉瓦的下一代TPU和GPU产能。

Intel 其他 强信号 2026-05-29

Intel将先进封装定位为AI时代性能基石,驱动控制层向系统集成转移

Intel Foundry封装技术负责人阐述EMIB技术起源与价值,强调先进封装已从辅助角色变为系统性能核心驱动力。这标志着行业性能提升路径正从单一芯片微缩转向多芯片异构集成,以应对AI工作负载对带宽与能效的极限需求。

NVIDIA 产品发布 强信号 2026-05-29

NVIDIA Vera CPU交付四大AI实验室,Computex前夕N1X+硅光子学三线并发

NVIDIA于5月18日宣布Vera CPU首批交付Anthropic、OpenAI、SpaceX AI和Oracle Cloud Infrastructure,由超大规模计算副总裁Ian Buck亲自送货。Vera是NVIDIA首款专为Agent式AI设计的CPU,88颗自研Olympus核心(Arm v9.2),LPDDR5X带宽1.2TB/s,Phoronix基准测试单核超越AMD EPYC 9575F和Intel Xeon 6980P,Linux内核编译仅20秒。同日NVIDIA+微软+Arm联合发布神秘海报预告N1X笔记本处理器(Blackwell GPU+20核联发科Arm CPU+128GB统一内存),Dell/Lenovo/ASUS已准备设备。此外NVIDIA三个月内向硅光子学投资至少$65亿(Lumentum/Coherent/Marvell各$20亿+Corning $5亿+Ayer Labs E轮$5亿),黄仁勋称硅光产能需求远超全球供给,CPO 2026渗透率0.5%→2030年35%。

Cisco 其他 强信号 2026-05-28

思科定义“跨域扩展”网络新范式,以硅光协同应对AI集群地理分散化

思科发布博客,系统阐述其应对AI训练集群地理分散化挑战的“跨域扩展”网络架构。该架构以Cisco Silicon One P200路由系统与800G ZR/ZR+相干可插拔光模块为核心,通过硅与光的协同设计,旨在为跨数十至数百公里数据中心的GPU集群提供确定性、低延迟、无损的连接。

Anthropic 其他 强信号 2026-05-28

Anthropic发布Claude Opus 4.8,以诚实度与代理可靠性重塑企业AI协作模式

Anthropic推出Claude Opus 4.8模型,核心提升在于代理任务(agentic tasks)的端到端可靠性、诚实度及判断力。同步引入‘动态工作流’功能,支持单会话内运行数百并行子代理处理超大规模任务,并提供用户可调的‘努力程度控制’,实现速度、成本与输出质量的精细权衡。

Cisco 其他 强信号 2026-05-28

Cisco Live 2026议程揭示网络设备向可编程计算平台演进

Cisco在其2026年Cisco Live大会上,系统展示了将企业网络从静态基础设施转变为AI就绪动态平台的五大技术路径。核心动作包括在Catalyst C9350交换机上原生支持应用容器化,推广基于NETCONF/YANG的原子化配置替换(ACR),以及用模型驱动遥测(MDT)全面替代SNMP。

Intel 其他 中信号 2026-05-28

英特尔发布Arc G系列处理器,专为手持游戏PC打造

英特尔推出专为手持游戏PC设计的Arc G系列处理器,基于Panther Lake架构和Intel 18A工艺,集成Xe3架构GPU,并支持Wi-Fi 7、Thunderbolt 4等先进连接技术。该系列旨在通过优化的核心配置、电源管理和软件驱动,在性能和能效间取得平衡。

NVIDIA 其他 中信号 2026-05-28

NVIDIA以游戏捆绑订阅深化云游戏市场,凸显AI基础设施复用策略

NVIDIA通过GeForce NOW平台发布新游戏《007 First Light》,并将其与12个月Ultimate会员订阅捆绑销售。此举旨在利用其强大的云端RTX GPU算力(包括RTX 50系列)吸引并锁定用户,同时展示了其底层AI基础设施向消费级云游戏服务的能力复用。

Cloudflare 其他 强信号 2026-05-28

Cloudflare 披露其统一数据平台与 AI 代理架构,展示云原生数据栈闭环

Cloudflare 详细介绍了其内部统一数据平台 Town Lake 与 AI 数据代理 Skipper 的构建。该平台基于 Apache Trino、R2 (Iceberg)、DataHub 等组件,实现了对分散数据的统一 SQL 访问。Skipper 作为 AI 代理,允许用户通过自然语言查询数据,并深度集成于 Cloudflare 自身的产品生态(Workers AI、R2 等)。

AMD 其他 强信号 2026-05-27

AMD发布面积优化型Versal Prime Gen 2自适应SoC,推动边缘计算硬件小型化

AMD宣布扩展其Versal Prime Series Gen 2自适应SoC产品线,新增三款面积优化型器件(2VM3454/3254/3104)。这些器件采用4核Arm Cortex-A78AE应用处理器配置,提供最小23x23mm封装,并在单位面积内提供更高的可编程逻辑密度,旨在为专业音视频、工业物联网等嵌入式应用平衡性能、尺寸与功耗。

AMD 其他 强信号 2026-05-27

AMD 以 EPYC 4005 与紧凑型系统重塑零售边缘基础设施

AMD 通过其 EPYC 4005 系列 CPU,与 Supermicro 等合作伙伴推出专为零售边缘设计的紧凑型服务器平台。这些系统强调在有限空间和功耗下的高性能(DDR5, PCIe Gen5)、远程管理(BMC)与硬件安全(TPM),旨在将数据中心级能力下沉至门店,实现工作负载整合与集中化运维。

Google 其他 强信号 2026-05-27

Google Cloud 系统解构无服务器AI冷启动,定义生产级部署新范式

Google Cloud 发布深度指南,将AI模型在Cloud Run上的冷启动分解为四个技术阶段,并针对每阶段提出具体优化策略,包括模型4-bit量化、镜像流传输、启动CPU Boost、专用网络路径及精细的并发度调优公式。此举旨在将无服务器平台从支持AI升级为为AI深度优化的一级生产环境。