筛选

×
当前筛选 清除全部
关键词: compute ×
246 情报总数
3/13 当前页
NVIDIA 其他 强信号 2026-05-27

NVIDIA CUDA 13.3为C++引入Tile编程模型,抽象GPU并行与内存管理

NVIDIA在CUDA 13.3中为C++添加了CUDA Tile编程模型支持,允许开发者在现有C++代码库中使用基于tile的抽象编写GPU内核。该模型通过tensor_span和partition_view操作固定大小的数组块,自动处理块内并行性、内存移动和硬件特性利用,无需显式线程管理,并支持Nsight Compute性能剖析。

NVIDIA 其他 强信号 2026-05-27

NVIDIA CUDA 13.3 通过 Tile C++、编译器自动调优与 Python 生态巩固软件栈控制权

NVIDIA 发布 CUDA 13.3,核心动作包括将高级 CUDA Tile 编程模型扩展至 C++、正式发布稳定的 CUDA Python 1.0 并引入进程检查点等功能,以及推出 CompileIQ 编译器自动调优框架。此举旨在通过更高层级的抽象和自动化工具,进一步降低 GPU 编程门槛并提升性能。

NVIDIA 其他 强信号 2026-05-27

NVIDIA发布Vera CPU基准测试,专为智能体AI工厂优化

NVIDIA公布了其专为智能体AI设计的Vera CPU的第三方基准测试结果。该CPU集成了88个定制Olympus核心与第二代LPDDR5X内存子系统,在特定功耗下实现了显著的性能与内存带宽提升,标志着NVIDIA在数据中心CPU市场对x86架构发起实质性挑战。

NVIDIA 其他 强信号 2026-05-27

NVIDIA发布RTX PRO 4500 Blackwell加速基因组与蛋白质折叠计算

NVIDIA推出基于Blackwell架构的RTX PRO 4500服务器GPU,通过集成Parabricks、Openfold3等软件,在基因组序列比对、变异检测和蛋白质结构预测等关键生命科学工作负载上实现2倍以上性能提升,显著降低计算时间与能耗。

Cisco 其他 强信号 2026-05-26

思科发布全栈后量子密码架构,将量子安全能力嵌入C9000交换机硬件

思科在其官方博客中宣布,为应对‘现在收集,以后解密’的量子威胁,在其C9000智能交换机中实现了全栈后量子密码(PQC)架构。该架构将NIST批准的PQC算法从硬件安全启动(Secure Boot)层延伸至数据传输协议(如SSH、MACsec、IPsec),通过嵌入FPGA的信任锚模块(TAm)和基于格的ML-KEM算法,旨在为园区和分支网络提供端到端的量子抵抗保护。

Amazon 其他 强信号 2026-05-26

AWS SageMaker 通过 OpenAI 兼容 API 争夺 AI 推理控制权

AWS 宣布其 Amazon SageMaker AI 推理端点现支持 OpenAI 兼容的 API 接口。此举使开发者无需修改代码即可将基于 OpenAI API 构建的 AI 应用迁移至 SageMaker 平台,显著降低了从 OpenAI 向 AWS AI 基础设施迁移的技术与锁定门槛。

Anthropic 其他 强信号 2026-05-26

Anthropic联合创始人借教宗通谕呼吁外部力量制衡AI发展

Anthropic联合创始人Chris Olah受邀在梵蒂冈对教宗方济各关于AI的通谕发表评论。他坦承前沿AI实验室面临商业、地缘政治等多重压力,可能导致行为偏离,因此强调需要不受这些利益驱动的外部力量(如宗教、哲学、社会)进行审视、批评和引导。

Apple 其他 强信号 2026-05-25

Apple注册genai.apple.com域名,WWDC 2026将发布Siri独立App与生成式AI战略独立化

Apple在WWDC 2026前注册genai.apple.com域名,暗示生成式AI战略独立化。预计6月8日发布Siri重大升级:个人上下文感知、屏幕理解、深度应用操作,底层由Gemini驱动。iOS 27将带来Siri专属App、文字对话和第三方AI Extensions。

NVIDIA 其他 强信号 2026-05-25

NVIDIA Vera CPU Computex前哨:1.5x x86性能,FY2027出货120万台

NVIDIA将在Computex 2026展示Vera自研x86 CPU。GF Securities预测:1.5倍x86速度、2倍吞吐量、4倍机架密度提升,FY2027出货目标120万台。Vera+Grace双线并行,NVIDIA从GPU独占扩展为GPU+CPU全栈供应商。AI推理时代CPU/GPU配比从1:8向1:1重构,直接冲击Intel/AMD服务器CPU基本盘。关键数据:Vera采用台积电4nm工艺,支持PCIe 6.0和CXL 3.0,定位AI推理与通用计算融合场景。

Microsoft 其他 强信号 2026-05-23

微软发布Fara1.5浏览器Agent模型,72%任务成功率超OpenAI/Google

...

Cisco 其他 强信号 2026-05-23

思科发布内部RAG平台DRIFT,展示企业AI基础设施蓝图

思科IT部门推出名为DRIFT的文档检索与摄取框架工具包,旨在标准化和规模化企业内部RAG应用开发流程。该平台基于云原生微服务架构,运行在思科自有的AI POD基础设施上,提供从文档预处理到检索重排的端到端流水线,并支持Agentic RAG等演进用例。

NVIDIA 其他 强信号 2026-05-23

NVIDIA 开源医学图像生成框架,推动 3D 医疗 AI 数据瓶颈突破

NVIDIA 发布并开源了基于 MAISI-v2 (Latent Rectified Flow) 架构的 NV-Generate-CTMR 框架及其新模型 NV-Generate-MR-Brain。该框架旨在规模化生成高质量的 3D CT 和 MRI 合成数据,并配套发布了大规模开源多模态 MRI 数据集 MR-RATE,以解决医疗 AI 开发中的数据稀缺和隐私限制问题。

Google 其他 2026-05-22

Google Cloud展示垂直行业AI Agent架构,强调混合集成能力

Google Cloud通过客户案例Movix,展示了为牙科制造业构建的端到端AI Agent解决方案。该方案基于Google Cloud基础设施,利用定制模型和Gemini Enterprise Agent Platform,并重点设计了连接本地遗留系统的混合架构,以进入保守市场。

NVIDIA 其他 强信号 2026-05-22

NVIDIA开源GPU Usage Monitor,简化Kubernetes集群GPU监控

NVIDIA发布开源项目GPU Usage Monitor,通过一个预集成的Helm Chart,将DCGM Exporter、kube-state-metrics、Prometheus和Grafana打包部署,为Kubernetes集群中的GPU资源提供开箱即用的实时监控能力。此举旨在解决AI工作负载在K8s环境中GPU利用率不透明、资源调度盲点等运营难题。

Cisco 其他 中信号 2026-05-22

思科与Qumulo验证统一数据平台架构,瞄准AI与混合负载

思科通过博客与白皮书,验证了其UCS M8机架服务器与Qumulo数据平台的集成方案。该方案旨在为AI、企业应用等混合工作负载提供统一、可扩展的文件与对象存储,并通过Cisco Intersight实现集中管理,以应对数据碎片化挑战。

NVIDIA 其他 强信号 2026-05-22

NVIDIA在COMPUTEX展示Vera Rubin NVL72等AI基础设施创新

NVIDIA在COMPUTEX 2026上获得多项最佳选择奖,其Vera Rubin NVL72机柜级AI超算、Jetson Thor边缘平台及Alpamayo自动驾驶开放平台获奖,展示了其在AI工厂、边缘推理和物理AI领域的基础设施布局。

Google 其他 强信号 2026-05-21

谷歌发布Antigravity 2.0,定义AI Agent本地开发控制平面

谷歌在I/O 2026上推出Antigravity 2.0,这是一个独立的桌面应用,旨在成为构建、测试和编排复杂AI工作流的“Agent-First”本地控制平面。它通过CLI/SDK、动态子代理和与企业云安全环境的直接集成,将AI Agent的开发与部署流程从云端延伸至本地环境,试图统一AI应用生命周期管理。

Cisco 其他 强信号 2026-05-20

思科通过芯片层智能包流重塑AI数据中心网络架构

思科推出基于Silicon One G300芯片的智能包流技术,将网络从高速传输层转变为具备感知、适应和优化能力的智能系统,以应对大规模AI工作负载。该技术通过硬件级遥测、自适应路由和拥塞管理,显著提升AI集群的集体完成时间和GPU利用率。

Intel 其他 强信号 2026-05-20

英特尔以集成SoC架构推动边缘AI机器人计算从独立GPU迁移

英特尔宣布其Core Ultra Series 3处理器正被多家机器人公司采用,以集成CPU、GPU、NPU的SoC架构替代昂贵、高功耗的独立GPU,用于边缘AI推理。这标志着机器人“大脑”向成本效益更高、更易部署的集成化异构计算架构转变。

AMD 其他 强信号 2026-05-20

AMD定义“智能代理计算机”新品类,推动AI推理本地化

AMD提出“智能代理计算机”概念,旨在通过本地化硬件(Ryzen™ AI Max处理器、Radeon™ AI PRO显卡)运行持续AI推理工作负载,以应对云API成本上升。其核心是推动AI从云端按需消费模式向本地固定成本、高吞吐量模式转移。