AI 基础设施情报
信号优先级展示 · 行业洞察 · 厂商战略追踪
全部情报流
Intel
架构转变
Jun 03, 2026
英特尔发布E835以太网控制器与适配器,主打200GbE带宽与硬件安全根
英特尔推出Ethernet E835系列控制器与网络适配器,提供高达200GbE带宽及灵活端口配置。产品集成硬件安全根、支持SPDM 1.2认证与FIPS 140-3,并优化RDMA与PCIe 5.0性能,旨在满足AI、数据中心及边缘的高密度与安全需求。
Microsoft
架构转变
Jun 03, 2026
微软构建前沿智能生态系统,统一IQ层与治理框架
微软CEO在Build大会上宣布构建“前沿智能生态系统”战略,核心是创建统一的“IQ层”,整合Microsoft Foundry、Fabric和M365以形成持续更新的组织理解。同时,通过Microsoft Commercial Marketplace发布OPAS Authority OS等确定性治理工具,降低企业AI采纳门槛。
Microsoft
架构转变
Jun 02, 2026
微软构建端到端智能体栈,从芯片到云重构AI应用生态
微软在Build大会上发布了一系列围绕“智能体时代”的基础设施与平台更新,核心在于构建一个从芯片参考设计(Project Solara)、操作系统安全层(MXC/OpenClaw)、数据智能基础(Microsoft IQ)、专用数据库(Azure HorizonDB)到开发与部署平台(Foundry, Copilot app)的完整、集成化智能体技术栈。此举旨在将智能体应用的全生命周期管理收拢至微软生态内部。
Cisco
厂商战略
Jun 02, 2026
思科转向预定节奏发布安全加固软件以应对AI加速漏洞发现
思科宣布自7月起,将其安全漏洞披露与补丁发布模式从随机、应急式转变为预定的、每月两次的节奏,并提前7天公布受影响的技术平台列表。核心网络操作系统(如IOS XE, IOS XR, NX-OS)将按季度发布加固版本,并采用捆绑式CVE(按CWE类别归类)而非为每个漏洞单独分配CVE。此举旨在将补丁管理从‘消防演习’转变为可计划的运维活动。
Cisco
架构转变
Jun 02, 2026
思科整合安全堆栈,将网络升级为AI代理时代的核心控制平面
思科在Cisco Live上发布多项安全更新,核心是将网络、身份与安全深度整合以应对AI代理带来的新威胁模型。其动作包括:为基础设施提供运行时补丁防护(Live Protect)、将开源代理安全工具DefenseClaw企业化并集成至Secure Client、扩展Secure Access SSE以跨代理工作流执行零信任控制,并推动基于Cisco Cloud Control的AgenticOps。
Cisco
架构转变
Jun 02, 2026
思科整合身份、网络与应用上下文于Cloud Control,推动身份驱动安全
思科在Cisco Cloud Control平台推出统一身份功能,将Duo、Cisco Identity Intelligence (CII)、Cisco Identity Services Engine (ISE)及第三方来源的身份、设备、网络策略与应用活动上下文整合于单一操作视图。此举旨在缩短从身份风险信号检测到跨安全与网络域执行的闭环周期,并扩展对AI代理等非人身份的监控与响应能力。
Cisco
架构转变
Jun 02, 2026
思科将安全运营整合至云控制平台,推动AI代理协作新模型
思科宣布在Cisco Cloud Control平台中深度集成安全能力,推出AI Canvas工作空间。该方案旨在通过统一上下文、受管控的行动以及人与AI代理的协作,解决安全工具碎片化带来的运营挑战,重塑安全工作的执行方式。
Meta
产品发布
Jun 02, 2026
Build 2026:Office 365 Agent Mode发布,多Agent跨文档协作
微软在Build 2026发布Office 365 Copilot Agent Mode,6月下旬向M365订阅用户推出。多个持久化AI Agent同时运行在Word、Excel、Teams和Outlook,每个agent维护独立上下文、权限和记忆。Multi-agent canvas拖拽串联agent。Agent以命名参与者身份加入Teams频道。底层混合GPT-5.5-turbo和Phi-4-mini。自定义Agent Store Q4 2026开放。
NVIDIA
产品发布
Jun 02, 2026
GTC台北2026:Vera 88核CPU专为智能体设计,1.8倍x86性能
NVIDIA在GTC台北2026发布首款独立数据中心微处理器Vera,首次以自有CPU直接对标Intel Xeon和AMD EPYC。Vera采用88个定制Olympus Arm核心,单片mesh网络(非chiplet),核心间通信比传统CPU快50%。LPDDR5X带宽1.2TB/s,PCIe Gen6,内外带宽为同类最高性能CPU的2-3倍。智能体沙箱性能1.8倍x86。首批客户:OpenAI、Anthropic、SpaceX。Q3 2026投产,FY CPU收入目标200亿美元。标志着NVIDIA从GPU加速器厂商向全栈数据中心平台厂商的战略跃迁。
Meta
架构转变
Jun 02, 2026
Build 2026:Project Polaris自研模型替代GPT-4 Turbo,GitHub Copilot开启去OpenAI化
微软在Build 2026开发者大会发布Project Polaris自研编码模型,计划2026年8月起替代OpenAI GPT-4 Turbo成为GitHub Copilot默认推理引擎,3个月过渡期可选保留旧模型。这标志着微软首次从模型层正式脱离对OpenAI的依赖。同时Anthropic Claude已集成进Copilot,支持多模型draft+review协同工作流。微软首次公开将Claude列为主要追赶目标,战略信号:模型层自立,分发和运行时才是持久护城河。
Intel
架构转变
Jun 02, 2026
英特尔联合生态伙伴推出机架级AI基础设施,瞄准推理与智能体工作负载
英特尔在Computex宣布推出基于Xeon 6+处理器与SambaNova RDUs的机架级AI基础设施,并与富士康、Vector Core Compute等合作,提供面向推理和智能体工作负载的优化系统及解耦推理云服务。此举标志着英特尔从芯片供应商向AI系统解决方案提供商的战略延伸。
Google
架构转变
Jun 02, 2026
Google Cloud 集成 GKE 多集群推理网关与托管 DRANET,定义 AI 服务网格新范式
Google Cloud 通过博客和代码实验室展示了一项实验:将 TPU v6e、GKE 托管 DRANET(动态资源分配网络)、多集群 GKE Inference Gateway 与 Cloud Storage FUSE 集成,构建跨区域、高可用的 AI 推理服务。该架构利用 Fleet 统一管理集群,并通过声明式策略实现基于硬件指标(如 KV cache 使用率)的智能流量路由与故障转移。
NVIDIA
架构转变
Jun 02, 2026
NVIDIA联合金融巨头推动交易基础模型,重构AI架构范式
NVIDIA联合Revolut、Mastercard、Stripe等金融机构,基于其全栈AI平台(Hopper GPU, Nemotron, NeMo)推出“构建您自己的交易基础模型”开发者示例。该模型旨在通过单一Transformer架构统一处理海量交易数据,替代传统针对单一业务(如欺诈、信用评分)的孤立模型,并已通过AWS、Nebius等云平台及多家服务商进行生态化部署。
ARM
架构转变
Jun 02, 2026
Arm与NVIDIA推出RTX Spark,定义智能体AI PC硬件新标准
Arm联合NVIDIA发布基于Arm Grace CPU与Blackwell RTX GPU的RTX Spark平台,旨在为Windows on Arm生态提供高性能本地AI推理能力。该平台采用统一内存架构,目标直指支持下一代自主AI工作流(如agentic RAG),标志着PC从以应用为中心向以智能体为中心的根本性转变。
ARM
架构转变
Jun 02, 2026
Oracle Cloud加入Arm AGI CPU生态,Arm架构加速夺取AI基础设施控制层
Oracle Cloud Infrastructure宣布加入Arm AGI CPU生态系统,将基于Arm架构的优化CPU引入其云平台以支持Agentic AI工作负载。这一动作进一步验证了Arm Neoverse平台在云数据中心,特别是AI基础设施中替代传统x86架构的趋势。
NVIDIA
架构转变
Jun 02, 2026
NVIDIA通过JetPack 7.2与NemoClaw将Agentic AI控制力延伸至物理边缘
NVIDIA发布JetPack 7.2边缘AI软件栈并集成NemoClaw框架,构建了从底层Yocto OS、中间层Agent Skills到上层Agentic AI框架的三层栈。此举旨在将数据中心成熟的AI代理开发范式与编排能力系统性地下沉至Jetson边缘平台,加速物理AI代理在机器人、工业自动化等领域的规模化生产部署。
Anthropic
架构转变
Jun 02, 2026
Anthropic扩展‘玻璃翼项目’,以分层治理重塑AI安全能力交付
Anthropic将其AI安全协作项目‘玻璃翼(Project Glasswing)’的合作伙伴从约50家扩展至约200家,新增150家组织需满足其安全要求方可访问Claude Mythos Preview模型。项目重点覆盖全球关键基础设施供应商及核心开源软件维护者,并计划将支持从漏洞发现扩展至披露、修复和部署补丁的全生命周期。
Amazon
架构转变
Jun 02, 2026
AWS通过Bedrock集成OpenAI GPT-5.5与Codex,重塑AI模型分发控制点
AWS宣布在Amazon Bedrock平台上全面开放OpenAI的GPT-5.5、GPT-5.4模型及Codex编码代理的访问。企业可通过Bedrock的下一代推理引擎与统一的Responses API调用这些前沿模型,同时满足数据驻留要求并按Token付费。此举将OpenAI的模型能力深度嵌入AWS的AI基础设施层。
Cisco
架构转变
Jun 02, 2026
思科AI Defense升级,推出针对AI Agent的个性化上下文安全
思科宣布其AI Defense平台重大更新,核心转向为AI Agent提供深度个性化安全。新功能包括基于自然语言的自适应红队测试与策略制定、自动化的Agent供应链漏洞扫描,以及跨主流云平台和Agent开发框架(如Amazon Bedrock AgentCore、LangChain)的原生集成。
Cisco
架构转变
Jun 01, 2026
思科将SSE与企业浏览器深度集成,推动零信任向数据使用层延伸
思科将其云交付的Security Service Edge (SSE)平台Cisco Secure Access与Island Enterprise Browser深度集成。该方案旨在为未托管设备提供安全应用访问,将零信任策略执行点从网络访问层延伸至浏览器内的用户会话,实现对数据复制、粘贴等操作的原生控制。
Cisco
架构转变
Jun 01, 2026
思科将Talos威胁情报能力服务化,推出跨产品线主动威胁狩猎
思科宣布将其全球顶级威胁情报团队Talos的能力直接转化为面向客户的服务。该威胁狩猎项目从端点扩展到网络(Firewall)和身份(Duo, Identity Intelligence)领域,利用对自家产品遥测的深度理解,由分析师提出假设,AI引擎24/7执行,旨在发现传统告警阈值下的隐匿攻击。
Google
架构转变
Jun 01, 2026
Google客户案例揭示:企业从LLM API消费转向自有微调开源模型
Trustpilot与Google合作,通过微调Gemma开源模型,在Dataflow和Gemini Enterprise Agent Platform上构建高吞吐量实时数据处理流水线,替代传统ML方案并实现成本可控。此举标志着企业AI策略从依赖闭源API向拥有模型所有权和优化基础设施的范式转变。
NVIDIA
产品发布
Jun 01, 2026
NVIDIA GTC台北2026:Vera 88核CPU专为智能体设计,1.8倍x86性能,OpenAI/Anthropic首批部署
NVIDIA在GTC台北2026发布首款独立数据中心微处理器Vera,首次以自有CPU直接对标Intel Xeon和AMD EPYC。Vera采用88个定制Olympus Arm核心,单片mesh网络(非chiplet),核心间通信比传统CPU快50%。LPDDR5X带宽1.2TB/s,PCIe Gen6,内外带宽为同类最高性能CPU的2-3倍。智能体沙箱性能1.8倍x86。首批客户:OpenAI、Anthropic、SpaceX。Q3 2026投产,FY CPU收入目标200亿美元。标志着NVIDIA从GPU加速器厂商向全栈数据中心平台厂商的战略跃迁。
Microsoft
技术整合
Jun 01, 2026
微软与英伟达联合推出RTX Spark,将企业级AI算力引入轻薄PC
微软CEO Satya Nadella宣布,将在Windows生态中深度集成NVIDIA RTX Spark架构,旨在为轻薄型PC设备提供本地化、高性能的AI算力(达到petaflop级)和统一内存支持,推动AI工作负载从云端向终端设备迁移。此举标志着个人计算向“AI原生”设备演进的关键一步。
NVIDIA
架构转变
Jun 01, 2026
NVIDIA借DSX平台与全球伙伴构建全栈AI云生态,定义AI工厂经济性
NVIDIA正通过其DSX平台与全球云伙伴(如CoreWeave、Firmus、Nebius)深度合作,共同构建由NVIDIA全栈技术定义的‘AI Cloud’生态系统。该生态旨在将‘AI工厂’基础设施贴近数据与用户,并引入‘每Token成本’作为核心经济性指标,以优化从训练、推理到智能体(agentic AI)的全周期工作负载。
NVIDIA
架构转变
Jun 01, 2026
NVIDIA发布工厂运营蓝图,定义自主工厂管理器代理架构
NVIDIA发布Factory Operations Blueprint (FOX)参考设计,用于构建基于AI的自主工厂管理器代理。该蓝图整合NemoClaw、AI-Q Blueprint及Nemotron开放模型,旨在连接工厂异构系统、自动化AI模型训练并协调各类专业代理,实现工厂级智能决策。
NVIDIA
架构转变
Jun 01, 2026
NVIDIA联合台系制造巨头,以AI平台重构制造业运营与控制层
NVIDIA联合台积电、富士康、广达等超过500家生态伙伴,在其Vera Rubin NVL72 AI基础设施生产过程中,深度应用CUDA-X、Omniverse、AI代理及物理AI技术,优化从芯片设计、工厂规划到产线运营的全流程。此举将NVIDIA的技术栈从计算加速延伸至制造运营的核心控制层。
Microsoft
架构转变
Jun 01, 2026
微软与英伟达共推基于Arm架构RTX Spark的Windows平台,瞄准本地AI智能体与工作站
微软与英伟达宣布深度整合,推出基于全新Arm架构RTX Spark芯片的Windows PC与工作站。该平台通过高达128GB统一内存、1 petaflop AI算力及Windows系统层优化,旨在将前沿AI模型与智能体(agent)工作负载从云端迁移至本地设备运行。
NVIDIA
架构转变
Jun 01, 2026
NVIDIA发布Vera CPU,为AI代理工作负载定义新设计标准
NVIDIA推出基于自研Olympus核心的Vera CPU,针对AI代理和强化学习工作负载中的‘工具调用-执行’循环进行架构优化。该CPU通过高单核性能、高并发及高效LPDDR5X内存子系统,旨在提升AI工厂中CPU关键路径的性能,从而增加整体AI输出吞吐量和能效。
NVIDIA
架构转变
Jun 01, 2026
NVIDIA开源DSX OS,定义AI工厂全栈运营软件层
NVIDIA发布其DSX平台的软件核心DSX OS,这是一套开源、模块化的软件组件,旨在协调从芯片、系统、软件到设施(电力、冷却)的整个AI工厂堆栈。它通过DSX Exchange(MQTT通信枢纽)、MaxLPS(动态功耗管理)、Infra Controller(裸金属生命周期管理)等组件,实现IT/OT深度融合,目标是提升“每瓦特token产出”并降低token成本。
Intel
架构转变
Jun 01, 2026
英特尔推出统一硬件-软件堆栈,瞄准物理AI机器人规模化部署
英特尔宣布其Series 3处理器已获得130多个边缘AI与机器人设计项目,并推出开源框架OpenVINO Physical AI。该组合旨在解决机器人从实验模型到规模化生产部署的碎片化挑战,通过统一的硬件-软件堆栈降低总拥有成本。
NVIDIA
产品发布
Jun 01, 2026
NVIDIA RTX Spark发布:AI PC时代的开启
NVIDIA在Computex 2026正式发布RTX Spark——首款面向AI Agent时代的Windows PC超级芯片。该芯片基于TSMC 3nm工艺,整合Blackwell架构GPU(6144 CUDA核心+第五代Tensor Core,FP4精度)与20核Grace CPU,通过NVLink-C2C互联(600GB/s),提供1 petaflop AI算力和最高128GB统一LPDDR5X内存(300GB/s带宽)。笔记本最薄14mm、最轻3磅,支持本地运行1200亿参数大模型。NVIDIA与微软合作推出OpenShell运行时和Windows安全原语,Adobe正在为RTX Spark重新架构Photoshop和Premiere。首批设备秋季上市,来自ASUS、Dell、HP、Lenovo、Microsoft Surface、MSI,Acer和GIGABYTE随后跟进。预计售价$3000-4000。RTX Spark路线图延伸至2030年:2027年升级Vera CPU+Rubin GPU+LPDDR6,2029-2030年Rosa CPU+Feynman GPU。这是继2020年Apple M1之后PC行业最大的架构变革信号。
Cisco
架构转变
Jun 01, 2026
思科将AI深度整合入CCNA/CCIE认证,重塑网络工程师核心技能栈
思科在Cisco Live 2026上宣布,其核心认证体系将全面拥抱AI。CCNA v2.0蓝图更新,CCIE实践考试集成AI工具,并推出大量关于AI网络运维(如LangChain代理、Agentic Operations)的新培训路径。这标志着网络专业人才的能力模型正从传统协议配置转向AI驱动运维。
NVIDIA
技术整合
May 30, 2026
NVIDIA 发布容器化 AI 模型文档自动生成工具包,集成 RAG 与 NIM 应对监管
NVIDIA 推出 Model Card Generator (MCG) 工具包,一个容器化流水线,可在一分钟内自动从源代码生成符合 Model Card++ 标准的 AI 模型文档。该工具利用 NVIDIA Nemotron RAG 进行高精度信息检索,并由大语言模型(如 GPT-OSS-120B)提取和格式化内容,旨在应对欧盟 AI 法案等法规要求。
Nokia
架构转变
May 29, 2026
诺基亚发布多轨集成光放大系统,瞄准AI集群跨数据中心带宽扩展瓶颈
诺基亚推出1830 GX多轨开放线路系统(Multi-rail OLS),其核心是1RU机架空间内集成支持四个光纤轨道(rail)的放大器模块。该设计旨在解决AI工作负载激增下,跨数据中心互联所需的多轨道部署面临的空间、功耗和运营复杂性挑战,通过硬件集成显著提升光传输基础设施的密度和能效。
NVIDIA
架构转变
May 29, 2026
NVIDIA将Step 3.7 Flash多模态模型深度整合至其企业AI全栈
NVIDIA宣布在其加速平台上全面支持StepFun的Step 3.7 Flash模型,这是一个1980亿参数的MoE多模态模型。通过TensorRT-LLM、vLLM进行优化推理,并通过NVIDIA NIM提供生产就绪的容器化微服务部署,同时支持基于NeMo框架的Day 0微调。
Cisco
架构转变
May 29, 2026
思科将安全深度嵌入网络架构,作为AI时代防御核心
思科IT与安全团队阐述其内部安全架构,将安全能力直接内嵌于网络基础设施各层,从园区到数据中心。该策略通过软件定义分段、统一策略和自动化运营,旨在遏制AI驱动的横向移动威胁,并推动网络与安全团队的深度协同。
Amazon
厂商战略
May 29, 2026
AWS推出新一代Resilience Hub,集成生成式AI重构SRE弹性管理
AWS宣布其Resilience Hub平台的重大升级,引入基于业务路径的新应用模型、生成式AI驱动的故障模式分析、自动依赖发现以及模块化弹性策略。该平台深度集成AWS Organizations,旨在为企业SRE和开发团队提供从策略定义、评估到合规证明的端到端结构化弹性管理能力。
Anthropic
厂商战略
May 29, 2026
Anthropic完成650亿美元H轮融资,估值逼近万亿并锁定海量算力
Anthropic宣布完成650亿美元H轮融资,投后估值达9650亿美元。资金将用于安全研究、扩展算力以满足Claude需求,并深化与亚马逊、谷歌、SpaceX等基础设施伙伴的合作,锁定高达10吉瓦的下一代TPU和GPU产能。
Intel
架构转变
May 29, 2026
Intel将先进封装定位为AI时代性能基石,驱动控制层向系统集成转移
Intel Foundry封装技术负责人阐述EMIB技术起源与价值,强调先进封装已从辅助角色变为系统性能核心驱动力。这标志着行业性能提升路径正从单一芯片微缩转向多芯片异构集成,以应对AI工作负载对带宽与能效的极限需求。
NVIDIA
产品发布
May 29, 2026
NVIDIA Vera CPU交付四大AI实验室,Computex前夕N1X+硅光子学三线并发
NVIDIA于5月18日宣布Vera CPU首批交付Anthropic、OpenAI、SpaceX AI和Oracle Cloud Infrastructure,由超大规模计算副总裁Ian Buck亲自送货。Vera是NVIDIA首款专为Agent式AI设计的CPU,88颗自研Olympus核心(Arm v9.2),LPDDR5X带宽1.2TB/s,Phoronix基准测试单核超越AMD EPYC 9575F和Intel Xeon 6980P,Linux内核编译仅20秒。同日NVIDIA+微软+Arm联合发布神秘海报预告N1X笔记本处理器(Blackwell GPU+20核联发科Arm CPU+128GB统一内存),Dell/Lenovo/ASUS已准备设备。此外NVIDIA三个月内向硅光子学投资至少$65亿(Lumentum/Coherent/Marvell各$20亿+Corning $5亿+Ayer Labs E轮$5亿),黄仁勋称硅光产能需求远超全球供给,CPO 2026渗透率0.5%→2030年35%。
Cisco
架构转变
May 28, 2026
思科定义“跨域扩展”网络新范式,以硅光协同应对AI集群地理分散化
思科发布博客,系统阐述其应对AI训练集群地理分散化挑战的“跨域扩展”网络架构。该架构以Cisco Silicon One P200路由系统与800G ZR/ZR+相干可插拔光模块为核心,通过硅与光的协同设计,旨在为跨数十至数百公里数据中心的GPU集群提供确定性、低延迟、无损的连接。
Cisco
技术整合
May 28, 2026
Cisco Live 2026议程揭示网络设备向可编程计算平台演进
Cisco在其2026年Cisco Live大会上,系统展示了将企业网络从静态基础设施转变为AI就绪动态平台的五大技术路径。核心动作包括在Catalyst C9350交换机上原生支持应用容器化,推广基于NETCONF/YANG的原子化配置替换(ACR),以及用模型驱动遥测(MDT)全面替代SNMP。
Cloudflare
架构转变
May 28, 2026
Cloudflare 披露其统一数据平台与 AI 代理架构,展示云原生数据栈闭环
Cloudflare 详细介绍了其内部统一数据平台 Town Lake 与 AI 数据代理 Skipper 的构建。该平台基于 Apache Trino、R2 (Iceberg)、DataHub 等组件,实现了对分散数据的统一 SQL 访问。Skipper 作为 AI 代理,允许用户通过自然语言查询数据,并深度集成于 Cloudflare 自身的产品生态(Workers AI、R2 等)。
AMD
架构转变
May 27, 2026
AMD发布面积优化型Versal Prime Gen 2自适应SoC,推动边缘计算硬件小型化
AMD宣布扩展其Versal Prime Series Gen 2自适应SoC产品线,新增三款面积优化型器件(2VM3454/3254/3104)。这些器件采用4核Arm Cortex-A78AE应用处理器配置,提供最小23x23mm封装,并在单位面积内提供更高的可编程逻辑密度,旨在为专业音视频、工业物联网等嵌入式应用平衡性能、尺寸与功耗。
AMD
架构转变
May 27, 2026
AMD 以 EPYC 4005 与紧凑型系统重塑零售边缘基础设施
AMD 通过其 EPYC 4005 系列 CPU,与 Supermicro 等合作伙伴推出专为零售边缘设计的紧凑型服务器平台。这些系统强调在有限空间和功耗下的高性能(DDR5, PCIe Gen5)、远程管理(BMC)与硬件安全(TPM),旨在将数据中心级能力下沉至门店,实现工作负载整合与集中化运维。
Google
架构转变
May 27, 2026
Google Cloud 系统解构无服务器AI冷启动,定义生产级部署新范式
Google Cloud 发布深度指南,将AI模型在Cloud Run上的冷启动分解为四个技术阶段,并针对每阶段提出具体优化策略,包括模型4-bit量化、镜像流传输、启动CPU Boost、专用网络路径及精细的并发度调优公式。此举旨在将无服务器平台从支持AI升级为为AI深度优化的一级生产环境。
NVIDIA
架构转变
May 27, 2026
NVIDIA CUDA 13.3为C++引入Tile编程模型,抽象GPU并行与内存管理
NVIDIA在CUDA 13.3中为C++添加了CUDA Tile编程模型支持,允许开发者在现有C++代码库中使用基于tile的抽象编写GPU内核。该模型通过tensor_span和partition_view操作固定大小的数组块,自动处理块内并行性、内存移动和硬件特性利用,无需显式线程管理,并支持Nsight Compute性能剖析。
NVIDIA
架构转变
May 27, 2026
NVIDIA CUDA 13.3 通过 Tile C++、编译器自动调优与 Python 生态巩固软件栈控制权
NVIDIA 发布 CUDA 13.3,核心动作包括将高级 CUDA Tile 编程模型扩展至 C++、正式发布稳定的 CUDA Python 1.0 并引入进程检查点等功能,以及推出 CompileIQ 编译器自动调优框架。此举旨在通过更高层级的抽象和自动化工具,进一步降低 GPU 编程门槛并提升性能。
NVIDIA
架构转变
May 27, 2026
NVIDIA发布Vera CPU基准测试,专为智能体AI工厂优化
NVIDIA公布了其专为智能体AI设计的Vera CPU的第三方基准测试结果。该CPU集成了88个定制Olympus核心与第二代LPDDR5X内存子系统,在特定功耗下实现了显著的性能与内存带宽提升,标志着NVIDIA在数据中心CPU市场对x86架构发起实质性挑战。