筛选

×
当前筛选 清除全部
关键词: TPU ×
122 情报总数
6/7 当前页
Google 其他 中信号 2026-04-03

Google为Gemini API推出Flex和Priority推理层级

Google在其Gemini API中新增Flex和Priority两个服务层级,允许开发者通过单一接口优化成本和可靠性。Flex针对延迟容忍型工作负载提供50%的成本节约,而Priority则为关键应用提供最高可靠性保障。这一变化简化了AI代理架构中同步和异步任务的管理。

Google 其他 中信号 2026-04-03

Google发布Gemma 4开源模型系列

Google推出Gemma 4开源模型系列,包含四种规模变体,特别优化边缘计算和移动设备。该系列支持多模态处理、长上下文窗口和140多种语言,采用Apache 2.0许可。

AMD 其他 强信号 2026-04-02

AMD发布突破性MLPerf 6.0推理结果,展示多节点扩展与多模态能力

AMD在MLPerf Inference 6.0基准测试中,凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型(Wan-2.2-t2v)的快速启用,以及广泛的合作伙伴生态系统复现结果。

Cisco 其他 中信号 2026-04-02

思科参与NIST生成式AI信任计划

思科宣布参与NIST生成式AI信任计划,重点开发可测量的AI信任评估框架。该计划包含动态对抗测试环境(Cat-and-Mouse框架)和代码生成挑战赛,旨在建立AI输出的可信度验证机制。

Cisco 其他 强信号 2026-04-02

Cisco 披露 AI 编码助手内存污染攻击方法

Cisco 安全团队发现并验证了针对 Claude Code 等 AI 编码助手的持久性内存污染攻击方法,通过篡改 MEMORY.md 系统文件可长期操纵 AI 行为。该漏洞已促使 Anthropic 在 v2.1.50 版本中移除了用户记忆文件的系统提示权限。

NVIDIA 其他 强信号 2026-03-25

英伟达联合能源机构展示AI算力工厂参与电网调峰

英伟达与能源研究机构EPRI、英国国家电网及初创公司Emerald AI合作,成功演示了基于Blackwell GPU集群的AI算力工厂如何根据电网实时需求,动态调节自身功耗以充当电网的“减震器”,同时保障高优先级AI工作负载的性能。

Cisco 其他 强信号 2026-03-23

思科扩展零信任安全至AI代理生态

思科在RSA 2026宣布针对AI代理的安全创新,扩展Zero Trust Access至非人类身份,引入agentic IAM在Duo、MCP策略执行于Secure Access SSE,并推出AI Defense: Explorer Edition自助测试工具及DefenseClaw开源框架,以自动化安全部署。

NVIDIA 其他 强信号 2026-03-14

英伟达发布Cosmos世界模型套件,强化物理AI合成数据与推理能力

英伟达发布其Cosmos世界基础模型(WFM)套件的重要更新,包括Transfer 2.5、Predict 2.5和Reason 2。这些模型旨在加速生成高保真、符合物理规律的合成数据,并支持对机器人、自动驾驶等物理AI系统进行下游任务微调和推理,以解决真实世界数据稀缺的瓶颈。

NVIDIA 其他 中信号 2026-03-06

NVIDIA在CCCL库中引入浮点确定性控制层级

NVIDIA在其CUDA核心计算库(CCCL)3.1中,为CUB库的规约算法新增了单阶段API和可配置的确定性级别。用户可在“不保证”、“运行间一致”和“GPU间一致”三个级别间权衡性能与结果可复现性,并引入了基于分桶算法的可复现浮点累加器(RFA)技术。

Trend Micro 其他 强信号 2026-03-03

Trend Micro发布AI安全报告,揭示AI供应链风险与模型攻击面

Trend Micro发布《AI生态系统断层线》报告,系统性地分析了AI供应链中的安全风险,包括模型训练数据污染、第三方插件漏洞以及模型窃取攻击。报告指出,企业AI应用的安全边界已从传统IT基础设施扩展至模型层和数据管道。

NVIDIA 其他 中信号 2026-02-05

NVIDIA 展示 AI 驱动游戏资产管线,加速传统游戏现代化

NVIDIA 开发者博客详细介绍了《Painkiller RTX》项目如何利用其生态下的工具(如 PBRFusion、RTX Remix)和生成式AI模型,批量将数千个低分辨率纹理转换为高质量的 PBR (Physically Based Rendering) 材质。该案例展示了将 AI 自动化与艺术判断相结合的混合生产管线,显著降低了小团队进行大规模视觉资产重建的门槛。

NVIDIA 其他 强信号 2026-01-23

NVIDIA 通过 NVFP4 量化与 TeaCache 技术将 FLUX.2 图像生成模型推理速度提升 10 倍

NVIDIA 与 Black Forest Labs 合作,针对 FLUX.2 [dev] 图像生成模型,在 Blackwell 数据中心 GPU 上应用了包括 NVFP4 4-bit 量化、Timestep Embedding Aware Caching (TeaCache)、CUDA Graphs 及多 GPU 支持在内的一系列推理优化技术。这些优化使模型在双 B200 GPU 配置下相比 H200 实现了 10.2 倍的延迟降低,并将内存占用减少超 40%,显著降低了高质量图像生成模型的部署门槛。

OpenAI 其他 2026-01-21

OpenAI:通过 GPT-4.1/GPT-5/Sora 2 模型栈,为 Higgsfield 提供视频生成基础设施

OpenAI 在其开发者博客中展示了第三方应用 Higgsfield 如何利用其 GPT-4.1、GPT-5 和 Sora 2 模型组合,将简单输入转化为高质量社交视频。这体现了 OpenAI 将其多模态模型作为外部 AI 推理基础设施核心组件的战略方向。

NVIDIA 其他 中信号 2026-01-09

NVIDIA发布AI商品目录蓝图,整合多模态模型与NIM部署

NVIDIA发布技术蓝图,演示如何组合其Nemotron LLM/VLM、FLUX图像生成与TRELLIS 3D模型,构建端到端的自动化商品目录增强系统。该系统通过模块化API和容器化部署,旨在将稀疏产品数据转化为本地化的富媒体内容。

NVIDIA 其他 强信号 2026-01-06

英伟达推出DGX Spark软件更新与NVFP4格式,强化本地AI开发

英伟达通过软件优化、新NVFP4数据格式及开源合作,大幅提升DGX Spark本地AI开发平台性能,并整合Brev云服务实现混合部署。此举将高性能AI模型运行从云端延伸至企业边缘和开发者桌面。

OpenAI 其他 中信号 2025-12-18

OpenAI发布思维链监控评估框架

OpenAI推出新的思维链监控评估套件,包含13项评估指标和24种测试环境。研究表明监控模型内部推理过程比仅监控输出更有效,为AI系统扩展控制提供了新路径。

NVIDIA 其他 强信号 2025-11-14

NVIDIA推动将可训练神经网络直接集成至实时图形渲染管线

NVIDIA发布技术博客,详细阐述如何将可训练的神经网络模型(神经着色)直接集成到实时图形渲染管线中。此举旨在利用专用AI硬件(如Tensor Cores)提升渲染质量与性能,标志着图形计算架构从纯手工编程向数据驱动、可学习的混合模式演进。

NVIDIA 其他 强信号 2025-11-08

NVIDIA发布开源数据科学代理原型,整合Nemotron LLM与CUDA-X加速库

NVIDIA在官方博客开源了一个交互式数据科学AI代理原型。该代理使用Nemotron Nano-9B-v2作为推理引擎,通过自然语言理解用户意图,并调用基于CUDA-X库(如cuDF、cuML)的GPU加速工具层,自动化执行数据清洗、模型训练与超参数优化等任务。其模块化架构旨在实现从自然语言到高性能计算的端到端加速,据称可获得3倍至43倍的性能提升。

NVIDIA 其他 中信号 2025-10-22

NVIDIA发布教程将轻量级LLM转化为终端AI代理

NVIDIA通过开发者博客发布教程,指导用户利用其开源的Nemotron Nano v2模型,在约200行Python代码内构建一个能理解自然语言并执行Bash命令的AI代理。该教程强调从零构建和利用LangGraph简化,核心在于实现安全的工具调用(Tool Calling)和人机回圈(Human-in-the-Loop)控制。

NVIDIA 其他 强信号 2025-10-21

英伟达发布IT工单分析AI智能体架构,强调图数据库与LLM结合

英伟达IT团队公开其内部AI智能体‘ITelligence’的架构细节,该系统结合NVIDIA Nemotron开源模型与图数据库,将非结构化工单数据转化为结构化洞察。其核心是批处理ETL、LLM驱动的根因分析、以及基于Grafana的可视化仪表板,而非RAG聊天机器人。