筛选

×
当前筛选 清除全部
关键词: TPU ×
122 情报总数
4/7 当前页
NVIDIA 其他 中信号 2026-05-01

英伟达发布TensorRT for RTX插件,优化虚幻引擎AI推理性能

英伟达发布针对虚幻引擎5(UE5)的TensorRT for RTX插件,作为其Neural Network Engine(NNE)的新运行时选项。该插件通过即时编译优化,在RTX GPU上为AI后处理(如超分、去噪)任务提供比DirectML等运行时更高的推理吞吐量,展示了英伟达将高效AI推理能力嵌入主流实时图形引擎工作流的努力。

NVIDIA 其他 强信号 2026-05-01

英伟达发布DLSS 4.5 SDK及TensorRT for RTX插件,深化游戏AI渲染生态

英伟达向开发者开放DLSS 4.5 SDK,包含动态多帧生成和6X多帧生成模式,并推出用于虚幻引擎NNE的TensorRT for RTX插件,加速游戏内AI推理。同时,其研究项目Kimodo展示了文本生成3D角色动画的潜力。

NVIDIA 其他 中信号 2026-04-30

NVIDIA通过AI Agent技能库实现GPU内核跨语言自动化迁移

NVIDIA发布TileGym项目,通过构建包含17条关键规则、API映射和验证脚本的AI Agent技能库,实现了cuTile Python GPU内核向Julia(cuTile.jl)的自动化、可重复转换。此举旨在降低高性能计算生态间的迁移成本。

Intel 其他 强信号 2026-04-30

英特尔与ChatPPT合作推出混合AI PC版,推动AI工作负载本地化

英特尔与AI应用ChatPPT合作,利用其AI Super Builder技术推出混合AI PC版。该版本将部分AI工作负载(如格式调整)从云端卸载至本地PC处理,降低了50%的云成本并提升了32%的用户使用时长,同时增强了数据隐私。

Cloudflare 其他 强信号 2026-04-30

Cloudflare推动后量子IPsec标准落地,与思科、飞塔实现互操作

Cloudflare宣布其IPsec服务全面支持基于IETF草案的混合ML-KEM后量子加密,并与思科、飞塔的硬件设备实现互操作。此举旨在应对“先窃取后解密”攻击,并推动IPsec社区从依赖专用硬件的QKD方案,转向基于软件、可大规模互操作的后量子密码学标准。

NVIDIA 其他 强信号 2026-04-29

英伟达发布Nemotron 3 Nano Omni统一多模态模型,瞄准AI Agent感知层

英伟达发布开源多模态模型Nemotron 3 Nano Omni,采用30B-A3B混合MoE架构,将视觉、音频与语言处理统一于单一模型,旨在作为AI Agent的“眼睛和耳朵”。该模型声称能消除多模型协作的延迟与上下文碎片化问题,在保持交互性的同时实现高达9倍的吞吐量提升,降低AI Agent的部署与推理成本。

Google 其他 强信号 2026-04-29

谷歌财报揭示企业AI堆栈战略,推动代理与推理基础设施增长

谷歌Q1财报显示其全栈AI战略成效显著,云业务因AI产品需求激增,收入增长63%。关键信号包括:推出Gemini Enterprise Agent Platform,代理数据处理量激增(330个客户年处理超万亿tokens),并计划将TPU硬件直接部署至客户数据中心。

Anthropic 其他 2026-04-29

Anthropic 9000亿估值背后:跨云算力布局如何重塑企业AI采购的厂商锁定风险

Anthropic以9000亿估值融资背后是三云算力布局策略,企业使用Claude实际在同时绑定AWS、Google、NVIDIA三方,厂商锁定风险从单云升级为跨云架构级锁定

ARM 其他 强信号 2026-04-28

Arm发布Performix性能分析工具包,瞄准AI Agent时代优化

Arm发布免费性能分析工具包Performix,旨在为AI Agent开发提供跨Arm平台的统一性能洞察与优化。该工具通过Arm MCP Server集成至主流AI开发环境,将硬件运行时数据转化为可操作的优化建议,并已获得微软、MongoDB等生态伙伴支持。

Microsoft 其他 强信号 2026-04-28

微软提出AI Agent成为企业软件主要用户,驱动三层架构重构

微软首席营销官提出,AI Agent正成为企业软件的主要“用户”,这要求软件从用户体验、业务逻辑到数据准备进行三层重构。核心变化在于,软件设计需同时服务人类和Agent,并将业务逻辑封装为Agent可调用的技能。

Microsoft 其他 强信号 2026-04-25

微软将GPT-5.5集成至企业级Copilot,推动多模型工作流编排

微软宣布将GPT-5.5模型部署至GitHub Copilot、Microsoft 365 Copilot、Copilot Studio及Foundry平台。该更新强调多模型编排,允许用户根据任务(如快速探索、深度推理、执行、审查)选择不同模型,并通过‘橡皮鸭’代理实现多模型反思循环。

Google 其他 2026-04-25

Google Cloud Next 2026:Ironwood TPU + $750M Agent Fund

Google在Cloud Next 2026大会上发布第七代TPU Ironwood,峰值算力达42.5 ExaFLOPS,较前代提升10倍。同时宣布7.5亿美元Agent Fund,投资AI智能体生态。主权AI战略成为核心叙事,推出Ironpod超级计算机方案满足政府数据主权需求。

NVIDIA 其他 强信号 2026-04-24

英伟达内部规模化部署GPT-5.5驱动AI代理,定义企业AI基础设施新范式

英伟达宣布其超过1万名员工已通过Codex应用,在基于GB200 NVL72的NVIDIA基础设施上规模化使用GPT-5.5。此举不仅展示了前沿模型推理在企业内部工作流中实现‘变革性’生产力的技术可行性,更通过专用的安全云VM架构,为企业部署AI代理提供了可审计、隔离的参考范式。

Microsoft 其他 强信号 2026-04-23

微软将Office Copilot代理模式设为默认,推动AI原生工作流

微软宣布Copilot在Word、Excel和PowerPoint中的“代理模式”正式上市并设为默认。该模式允许AI直接在文档画布上进行推理和多步骤操作,标志着从辅助工具到嵌入式AI协作者的转变。

NVIDIA 其他 强信号 2026-04-23

NVIDIA 集成 Blackwell MIG 与 vGPU 20,重塑企业虚拟化数据中心 GPU 控制层

NVIDIA 发布技术指南,展示如何将 RTX PRO 4500 Blackwell Server Edition GPU 的 Multi-Instance GPU (MIG) 硬件分区能力与 vGPU 20 软件栈深度集成于 VMware vSphere 环境。该组合使单物理 GPU 可被安全划分为多个具备 QoS 保证的虚拟 GPU 实例,旨在高效加速从知识工作到轻量级 AI 开发的混合企业负载。

Google 其他 强信号 2026-04-22

Google发布Gemini企业级代理平台,定义AI代理时代技术栈

Google在Next '26上发布Gemini企业级代理平台,提供构建、扩展、治理和优化AI代理的端到端解决方案。该平台整合了新的AI基础设施、数据云、安全防御和任务执行能力,旨在将企业流程统一为单一智能工作流。

Google 其他 2026-04-22

Google Cloud Next 26开幕:发布Agentic Cloud战略

Google Cloud Next 26开幕,发布企业级Agentic AI全栈。

Google 其他 2026-04-22

Google全域算力池化:资源利用率从35%提升至85%

Google发布全域算力池化技术,资源利用率从35%提升至85%+,成本降低40%+,支持跨区域、跨云厂商资源整合。

Google 产品发布 2026-04-22

Google TPU v8发布:单集群算力突破40 ExaFLOPS

Google发布TPU v8芯片,单集群算力达40+ ExaFLOPS,支持百万级Agent并发,算力密度提升3倍,能效比提升2倍。

Cisco 其他 强信号 2026-04-21

思科发布OT安全入门框架,强调经济性与可执行性

思科发布工业OT安全入门框架,针对中型企业资源有限现状,提出分阶段、低成本的实施路径。核心是避免因过度依赖SPAN端口等被动监控架构而产生高昂的隐性基础设施成本,转而利用现有网络设备(如支持Cyber Vision的交换机)实现初步可见性。