筛选

×
当前筛选 清除全部
关键词: LLM ×
136 情报总数
3/7 当前页
Cisco 其他 强信号 2026-05-12

思科开源Foundry安全规范,定义AI代理安全评估系统架构

思科开源了Foundry Security Spec,这是一个用于构建AI代理安全评估系统的开放规范。它定义了8个核心代理角色、130项功能需求及11项不可违背原则,旨在将前沿LLM从演示工具转变为可审计、可验证的生产级安全评估系统。该规范与CodeGuard项目结合,形成从检测到预防的闭环。

Google 其他 强信号 2026-05-12

Google Cloud G4 VM助力Imgix实现实时图像处理性能跃升

Google Cloud通过其G4 VM实例,为Imgix的图像处理平台提供了基于NVIDIA Blackwell GPU的AI Hypercomputer基础设施。该迁移使Imgix的中位处理延迟降低50%,单节点吞吐量提升6倍,且无需修改核心应用代码,展示了云上AI推理基础设施对实时媒体处理工作负载的变革性影响。

Cisco 其他 强信号 2026-05-12

思科将AI安全分类体系全面转向AI驱动的“宪法”定义模型

思科宣布其AI安全产品组合将全面采用基于详细自然语言“宪法”定义的单源真相模型,利用LLM替代人工标注者进行一致性分类与评估,并计划将此模型扩展至AI供应链安全等领域。

AMD 其他 强信号 2026-05-12

AMD联合清华开源项目,展示AI教育多智能体架构的端云协同部署

AMD与清华大学OpenMAIC团队合作,将多智能体交互式AI课堂框架部署在其ROCm软件栈上。该方案利用Instinct GPU进行云端课程内容生成,通过Ryzen AI PC和Lemonade本地服务器处理实时、低延迟的课堂交互,实现基于统一软件栈的端云协同架构。

AMD 其他 强信号 2026-05-12

AMD定义AI网络概念并推出专用AI NIC

AMD发布博客,系统性地定义了“AI网络”概念,强调其为满足分布式AI工作负载同步需求而构建的专用网络解决方案。核心是推出Pensando Pollara 400 AI NIC,通过智能流量控制、低延迟数据移动和可编程结构服务,优化GPU集群间通信。此举旨在将网络提升为与计算同等关键的基础设施层。

Fortinet 其他 强信号 2026-05-12

Fortinet深化与NVIDIA集成,瞄准企业AI基础设施安全

Fortinet宣布深化与NVIDIA的集成,旨在为大规模企业AI基础设施提供独特的安全能力。此举将Fortinet的安全平台与NVIDIA的AI计算堆栈更紧密地结合,标志着安全厂商正将防护边界从传统网络扩展至AI推理和训练基础设施层。

Google 其他 强信号 2026-05-11

Google揭示AI驱动攻击产业化:从漏洞发现到自主执行

Google威胁情报团队报告,攻击者正将生成式AI大规模应用于对抗性工作流,首次确认AI辅助开发的零日漏洞利用,并观察到AI用于增强恶意软件混淆、自主攻击编排及供应链攻击。这标志着AI在攻击生命周期中的角色从实验性工具转变为工业化引擎。

AMD 其他 强信号 2026-05-08

AMD EPYC CPU获AWS RDS for SQL Server支持,提升云数据库性价比

AWS宣布在Amazon RDS for SQL Server中引入基于第五代AMD EPYC处理器的实例选项。此举为关键数据库工作负载提供了新的高性价比计算选择,并可能改变云上关系型数据库服务的成本与性能基准。

NVIDIA 其他 强信号 2026-05-08

NVIDIA为NCCL引入Prometheus实时监控,强化AI训练可观测性

NVIDIA在NCCL 2.30中推出Prometheus模式,将GPU间通信性能指标转化为时间序列数据。这使AI训练团队能够通过Grafana仪表板实时监控和调试分布式训练性能问题,尤其是网络与NVLink混合通信场景下的瓶颈。

NVIDIA 其他 强信号 2026-05-06

英伟达通过OCP开放MRC协议,推动AI以太网架构标准化

英伟达宣布将其在Spectrum-X以太网硬件上验证的MRC(多路径可靠连接)RDMA传输协议通过开放计算项目(OCP)开放。该协议旨在通过多路径负载均衡和硬件级故障绕过,提升大规模AI训练集群的网络吞吐量、弹性和GPU利用率。

Google 其他 中信号 2026-05-06

谷歌通过Agent Platform展示AI原生应用架构范式

谷歌云客户案例展示了基于Gemini Enterprise Agent Platform构建的“流式意识转任务”应用。该架构利用原生音频流、主动工具调用和会话恢复等API,实现了从语音到结构化任务的无缝、低延迟转换,并设计了面向未来语音功能的提供商无关抽象层。

Anthropic 其他 强信号 2026-05-06

Anthropic与SpaceX达成算力协议,大幅提升Claude服务容量

Anthropic宣布与SpaceX达成协议,将使用其Colossus 1数据中心全部算力,获得超过300兆瓦新容量。此举旨在直接提升Claude Pro和Max订阅者的服务能力,并已立即提高Claude Code和API的使用限制。

NVIDIA 其他 强信号 2026-05-06

NVIDIA推出车载AI Box架构,将高级LLM推理作为独立ECU模块

NVIDIA发布车载AI Box架构,基于DRIVE AGX平台提供模块化AI计算单元,可将高级LLM/VLM推理能力作为独立ECU添加至现有座舱系统。该方案旨在解决车载AI对实时性、隐私和算力的严苛要求,并支持与云端AI的混合编排。

NVIDIA 其他 强信号 2026-05-05

NVIDIA提出面向智能体系统的“极端协同设计”基础设施栈

NVIDIA发布技术博客,系统阐述AI智能体(Agent)工作负载对基础设施的颠覆性需求,并提出其‘极端协同设计’(Extreme Co-Design)技术栈与Vera Rubin平台作为解决方案。核心观点是传统单处理器架构无法满足智能体在长上下文、高缓存命中率和低延迟交互方面的苛刻要求,必须通过计算、网络、存储的跨层优化来重塑AI基础设施。

NVIDIA 其他 强信号 2026-05-05

NVIDIA将cuOpt优化引擎封装为AI Agent技能,加速供应链决策

NVIDIA发布cuOpt Agent Skills,将GPU加速的决策优化引擎封装为AI Agent可调用的标准化技能。该方案允许LLM通过自然语言理解业务问题,并自动调用cuOpt进行数学建模与求解,将传统需数周的供应链优化流程缩短至秒级。

Anthropic 其他 强信号 2026-05-04

Anthropic发布金融行业AI代理模板,加速企业AI工作流部署

Anthropic发布了10个面向金融服务的即用型AI代理模板,涵盖投研、合规、财务等核心场景。这些模板以插件和托管代理形式交付,并与Microsoft 365深度集成,旨在将AI部署周期从数月缩短至数天。此举标志着AI应用正从通用能力向垂直行业深度工作流渗透。

AMD 其他 中信号 2026-05-04

AMD联合戴尔展示企业AI异构计算战略

AMD在戴尔技术世界大会上强调其异构计算产品组合,旨在为不同企业AI负载匹配合适的算力,并突出硬件安全与可管理性。此举标志着AI基础设施正从通用方案转向针对具体场景的精细化部署。

Anthropic 其他 强信号 2026-05-04

Anthropic联手顶级资本成立新AI服务公司,瞄准中端市场

Anthropic与黑石、Hellman & Friedman、高盛等顶级资本共同成立一家新的AI服务公司,旨在为中型企业提供Claude的深度定制化部署与长期运营支持,以补充其现有的大型企业系统集成商合作伙伴网络。

Palo Alto Networks 其他 强信号 2026-05-03

CISA Agentic AI安全指南深度分析

本文深度解读CISA发布的Agentic AI安全框架四大核心领域:攻击面与风险管理、身份与权限治理、行为监督与透明度、供应链安全。分析其对企业安全架构的影响,提供三阶段可操作落地路径,并评估Palo Alto Networks、CrowdStrike、Microsoft等厂商的受益程度与市场机会。

NVIDIA 其他 中信号 2026-05-01

英伟达发布TensorRT for RTX插件,优化虚幻引擎AI推理性能

英伟达发布针对虚幻引擎5(UE5)的TensorRT for RTX插件,作为其Neural Network Engine(NNE)的新运行时选项。该插件通过即时编译优化,在RTX GPU上为AI后处理(如超分、去噪)任务提供比DirectML等运行时更高的推理吞吐量,展示了英伟达将高效AI推理能力嵌入主流实时图形引擎工作流的努力。