筛选

×
当前筛选 清除全部
关键词: CPU ×
144 情报总数
2/8 当前页
NVIDIA 其他 强信号 2026-06-01

NVIDIA RTX Spark发布:AI PC时代的开启

NVIDIA在Computex 2026正式发布RTX Spark——首款面向AI Agent时代的Windows PC超级芯片。该芯片基于TSMC 3nm工艺,整合Blackwell架构GPU(6144 CUDA核心+第五代Tensor Core,FP4精度)与20核Grace CPU,通过NVLink-C2C互联(600GB/s),提供1 petaflop AI算力和最高128GB统一LPDDR5X内存(300GB/s带宽)。笔记本最薄14mm、最轻3磅,支持本地运行1200亿参数大模型。NVIDIA与微软合作推出OpenShell运行时和Windows安全原语,Adobe正在为RTX Spark重新架构Photoshop和Premiere。首批设备秋季上市,来自ASUS、Dell、HP、Lenovo、Microsoft Surface、MSI,Acer和GIGABYTE随后跟进。预计售价$3000-4000。RTX Spark路线图延伸至2030年:2027年升级Vera CPU+Rubin GPU+LPDDR6,2029-2030年Rosa CPU+Feynman GPU。这是继2020年Apple M1之后PC行业最大的架构变革信号。

NVIDIA 产品发布 强信号 2026-05-29

NVIDIA Vera CPU交付四大AI实验室,Computex前夕N1X+硅光子学三线并发

NVIDIA于5月18日宣布Vera CPU首批交付Anthropic、OpenAI、SpaceX AI和Oracle Cloud Infrastructure,由超大规模计算副总裁Ian Buck亲自送货。Vera是NVIDIA首款专为Agent式AI设计的CPU,88颗自研Olympus核心(Arm v9.2),LPDDR5X带宽1.2TB/s,Phoronix基准测试单核超越AMD EPYC 9575F和Intel Xeon 6980P,Linux内核编译仅20秒。同日NVIDIA+微软+Arm联合发布神秘海报预告N1X笔记本处理器(Blackwell GPU+20核联发科Arm CPU+128GB统一内存),Dell/Lenovo/ASUS已准备设备。此外NVIDIA三个月内向硅光子学投资至少$65亿(Lumentum/Coherent/Marvell各$20亿+Corning $5亿+Ayer Labs E轮$5亿),黄仁勋称硅光产能需求远超全球供给,CPO 2026渗透率0.5%→2030年35%。

Cisco 其他 强信号 2026-05-28

思科定义“跨域扩展”网络新范式,以硅光协同应对AI集群地理分散化

思科发布博客,系统阐述其应对AI训练集群地理分散化挑战的“跨域扩展”网络架构。该架构以Cisco Silicon One P200路由系统与800G ZR/ZR+相干可插拔光模块为核心,通过硅与光的协同设计,旨在为跨数十至数百公里数据中心的GPU集群提供确定性、低延迟、无损的连接。

NVIDIA 其他 中信号 2026-05-28

NVIDIA以游戏捆绑订阅深化云游戏市场,凸显AI基础设施复用策略

NVIDIA通过GeForce NOW平台发布新游戏《007 First Light》,并将其与12个月Ultimate会员订阅捆绑销售。此举旨在利用其强大的云端RTX GPU算力(包括RTX 50系列)吸引并锁定用户,同时展示了其底层AI基础设施向消费级云游戏服务的能力复用。

AMD 其他 强信号 2026-05-27

AMD发布面积优化型Versal Prime Gen 2自适应SoC,推动边缘计算硬件小型化

AMD宣布扩展其Versal Prime Series Gen 2自适应SoC产品线,新增三款面积优化型器件(2VM3454/3254/3104)。这些器件采用4核Arm Cortex-A78AE应用处理器配置,提供最小23x23mm封装,并在单位面积内提供更高的可编程逻辑密度,旨在为专业音视频、工业物联网等嵌入式应用平衡性能、尺寸与功耗。

AMD 其他 强信号 2026-05-27

AMD 以 EPYC 4005 与紧凑型系统重塑零售边缘基础设施

AMD 通过其 EPYC 4005 系列 CPU,与 Supermicro 等合作伙伴推出专为零售边缘设计的紧凑型服务器平台。这些系统强调在有限空间和功耗下的高性能(DDR5, PCIe Gen5)、远程管理(BMC)与硬件安全(TPM),旨在将数据中心级能力下沉至门店,实现工作负载整合与集中化运维。

Google 其他 强信号 2026-05-27

Google Cloud 系统解构无服务器AI冷启动,定义生产级部署新范式

Google Cloud 发布深度指南,将AI模型在Cloud Run上的冷启动分解为四个技术阶段,并针对每阶段提出具体优化策略,包括模型4-bit量化、镜像流传输、启动CPU Boost、专用网络路径及精细的并发度调优公式。此举旨在将无服务器平台从支持AI升级为为AI深度优化的一级生产环境。

NVIDIA 其他 强信号 2026-05-27

NVIDIA CUDA 13.3 通过 Tile C++、编译器自动调优与 Python 生态巩固软件栈控制权

NVIDIA 发布 CUDA 13.3,核心动作包括将高级 CUDA Tile 编程模型扩展至 C++、正式发布稳定的 CUDA Python 1.0 并引入进程检查点等功能,以及推出 CompileIQ 编译器自动调优框架。此举旨在通过更高层级的抽象和自动化工具,进一步降低 GPU 编程门槛并提升性能。

NVIDIA 其他 强信号 2026-05-27

NVIDIA发布Vera CPU基准测试,专为智能体AI工厂优化

NVIDIA公布了其专为智能体AI设计的Vera CPU的第三方基准测试结果。该CPU集成了88个定制Olympus核心与第二代LPDDR5X内存子系统,在特定功耗下实现了显著的性能与内存带宽提升,标志着NVIDIA在数据中心CPU市场对x86架构发起实质性挑战。

NVIDIA 其他 强信号 2026-05-27

NVIDIA发布RTX PRO 4500 Blackwell加速基因组与蛋白质折叠计算

NVIDIA推出基于Blackwell架构的RTX PRO 4500服务器GPU,通过集成Parabricks、Openfold3等软件,在基因组序列比对、变异检测和蛋白质结构预测等关键生命科学工作负载上实现2倍以上性能提升,显著降低计算时间与能耗。

Huawei 其他 强信号 2026-05-25

华为发表韬定律:时间缩微替代几何缩微,逻辑折叠技术突破摩尔定律困局

华为何庭波在ISCAS 2026发表韬定律,以时间缩微替代几何缩微。逻辑折叠技术固定制程下单代密度+55%、能效+41%、主频+13%。6年381款芯片验证,麒麟2026秋季首发,2031年等效1.4nm密度。

Intel 其他 强信号 2026-05-25

Intel CEO:AI推理时代CPU/GPU配比从1:8向1:1演进,Multi-Agent三大刚性需求

Intel CEO指出AI推理时代CPU/GPU配比从1:8向1:1演进,驱动因素为Multi-Agent三大刚性需求:Agent编排与调度、工具调用与API网关、推理卸载与本地执行。Intel三路CPU同时量产(Granite Rapids-D边缘/Aerial嵌入式/Xeon 6主流),非巧合而是系统性应对。Agent编排/工具调用/推理卸载构成CPU新增长极。企业AI基础设施团队需立即重新评估CPU/GPU配比,服务器采购需适配Agent工作负载特征。

AMD 其他 强信号 2026-05-25

AMD EPYC Venice业界首款量产2nm HPC CPU,$100亿封装生态投资

AMD发布EPYC Venice,业界首款量产2nm HPC CPU。同时宣布$100亿封装生态投资,与台积电、三星深度绑定先进封装产能。Venice采用2nm GAA工艺,核心数和性能未正式公布,但GF Securities预测将大幅领先当前Genoa/Bergamo。Venice+Helios(GPU)组合剑指AI推理服务器市场。2nm量产领先Intel一代,封装投资锁定供应链产能,形成工艺+产能双重护城河。

NVIDIA 其他 强信号 2026-05-25

NVIDIA Vera CPU Computex前哨:1.5x x86性能,FY2027出货120万台

NVIDIA将在Computex 2026展示Vera自研x86 CPU。GF Securities预测:1.5倍x86速度、2倍吞吐量、4倍机架密度提升,FY2027出货目标120万台。Vera+Grace双线并行,NVIDIA从GPU独占扩展为GPU+CPU全栈供应商。AI推理时代CPU/GPU配比从1:8向1:1重构,直接冲击Intel/AMD服务器CPU基本盘。关键数据:Vera采用台积电4nm工艺,支持PCIe 6.0和CXL 3.0,定位AI推理与通用计算融合场景。

Google 产品发布 强信号 2026-05-22

Google I/O 2026全面押注Agentic AI:Gemini 3.5 Flash/Omni/Antigravity 2.0/Gemini Spark密集发布

Google I/O 2026发布Gemini 3.5 Flash(4倍输出速度+前沿智能)、Gemini Omni Flash(原生多模态视频生成)、Antigravity 2.0(Agent编排桌面平台+CLI+SDK)、Gemini Spark(24/7个人AI助手)。Gemini MAU从4亿增至9亿;资本开支2026年预计1800-1900亿美元(2022年的6倍)。

NVIDIA 其他 强信号 2026-05-22

NVIDIA开源GPU Usage Monitor,简化Kubernetes集群GPU监控

NVIDIA发布开源项目GPU Usage Monitor,通过一个预集成的Helm Chart,将DCGM Exporter、kube-state-metrics、Prometheus和Grafana打包部署,为Kubernetes集群中的GPU资源提供开箱即用的实时监控能力。此举旨在解决AI工作负载在K8s环境中GPU利用率不透明、资源调度盲点等运营难题。

NVIDIA 其他 强信号 2026-05-22

NVIDIA在COMPUTEX展示Vera Rubin NVL72等AI基础设施创新

NVIDIA在COMPUTEX 2026上获得多项最佳选择奖,其Vera Rubin NVL72机柜级AI超算、Jetson Thor边缘平台及Alpamayo自动驾驶开放平台获奖,展示了其在AI工厂、边缘推理和物理AI领域的基础设施布局。

Intel 其他 强信号 2026-05-20

英特尔以集成SoC架构推动边缘AI机器人计算从独立GPU迁移

英特尔宣布其Core Ultra Series 3处理器正被多家机器人公司采用,以集成CPU、GPU、NPU的SoC架构替代昂贵、高功耗的独立GPU,用于边缘AI推理。这标志着机器人“大脑”向成本效益更高、更易部署的集成化异构计算架构转变。

AMD 其他 强信号 2026-05-20

AMD定义“智能代理计算机”新品类,推动AI推理本地化

AMD提出“智能代理计算机”概念,旨在通过本地化硬件(Ryzen™ AI Max处理器、Radeon™ AI PRO显卡)运行持续AI推理工作负载,以应对云API成本上升。其核心是推动AI从云端按需消费模式向本地固定成本、高吞吐量模式转移。

AMD 其他 强信号 2026-05-20

AMD发布AI Halo开发平台与Max PRO 400系列处理器,瞄准本地AI代理计算

AMD发布Ryzen AI Halo开发者平台和Ryzen AI Max PRO 400系列处理器,旨在为本地AI代理(Agent)应用提供开发与运行环境。新平台支持高达2000亿参数模型本地运行,并提供高达192GB统一内存,推动AI工作负载从云端向边缘设备迁移。