情报
AI 生成的结构化厂商动态简报
思科资本将技术融资提升为核心战略杠杆,重构客户采购生态
思科通过其金融子公司Cisco Capital,将灵活的融资方案深度整合进技术销售流程。此举旨在将客户从传统的大额资本支出采购模式,转向基于生命周期的运营支出模式,以应对宏观经济压力并加速AI等关键技术的部署。
AMD发布面积优化型Versal Prime Gen 2自适应SoC,推动边缘计算硬件小型化
AMD宣布扩展其Versal Prime Series Gen 2自适应SoC产品线,新增三款面积优化型器件(2VM3454/3254/3104)。这些器件采用4核Arm Cortex-A78AE应用处理器配置,提供最小23x23mm封装,并在单位面积内提供更高的可编程逻辑密度,旨在为专业音视频、工业物联网等嵌入式应用平衡性能、尺寸与功耗。
思科发布前沿模型多轮对抗评估:所有模型均非免疫
思科发布了对15款前沿闭源大语言模型的多轮对抗攻击评估报告,结果显示所有模型在迭代攻击下都存在非微不足道的漏洞。单轮攻击成功率(ASR)无法预测多轮攻击下的表现,两者差距巨大,部分模型的多轮ASR高达88.30%。这挑战了行业当前依赖单轮基准测试评估模型安全性的做法。
AMD 以 EPYC 4005 与紧凑型系统重塑零售边缘基础设施
AMD 通过其 EPYC 4005 系列 CPU,与 Supermicro 等合作伙伴推出专为零售边缘设计的紧凑型服务器平台。这些系统强调在有限空间和功耗下的高性能(DDR5, PCIe Gen5)、远程管理(BMC)与硬件安全(TPM),旨在将数据中心级能力下沉至门店,实现工作负载整合与集中化运维。
NVIDIA CUDA 13.3为C++引入Tile编程模型,抽象GPU并行与内存管理
NVIDIA在CUDA 13.3中为C++添加了CUDA Tile编程模型支持,允许开发者在现有C++代码库中使用基于tile的抽象编写GPU内核。该模型通过tensor_span和partition_view操作固定大小的数组块,自动处理块内并行性、内存移动和硬件特性利用,无需显式线程管理,并支持Nsight Compute性能剖析。
NVIDIA发布Vera CPU基准测试,专为智能体AI工厂优化
NVIDIA公布了其专为智能体AI设计的Vera CPU的第三方基准测试结果。该CPU集成了88个定制Olympus核心与第二代LPDDR5X内存子系统,在特定功耗下实现了显著的性能与内存带宽提升,标志着NVIDIA在数据中心CPU市场对x86架构发起实质性挑战。
Anthropic发布《Zero Trust for AI Agents》安全框架
Anthropic于2026年5月27日发布《Zero Trust for AI Agents》白皮书,系统定义了企业AI Agent部署的安全框架。白皮书提出三条核心原则:永远不信任始终验证、假设已被攻破、最小权限。识别五大Agent特有威胁:提示注入(间接注入通过外部数据源,Microsoft Research确认LLM无法可靠区分信息性上下文和可执行指令)、工具投毒(首个野外恶意MCP服务器已发现)、身份/权限滥用(困惑代理人问题+记忆缓存凭证跨会话提权)、记忆/上下文投毒、供应链攻击。定义六大安全能力域的三级路线图(Foundation/Enterprise/Advanced),其中密码学身份+短命Token被列为Foundation底线——静态API Key即使带轮换策略也视为已被攻破。提出'设计测试':摩擦型措施(速率限制/跳板/短信MFA)对AI攻击者无效,必须优先移除能力而非限流能力。Agentic SOAR为防御运营新范式,几秒内应对AI驱动攻击。
NVIDIA发布RTX PRO 4500 Blackwell加速基因组与蛋白质折叠计算
NVIDIA推出基于Blackwell架构的RTX PRO 4500服务器GPU,通过集成Parabricks、Openfold3等软件,在基因组序列比对、变异检测和蛋白质结构预测等关键生命科学工作负载上实现2倍以上性能提升,显著降低计算时间与能耗。
思科发布全栈后量子密码架构,将量子安全能力嵌入C9000交换机硬件
思科在其官方博客中宣布,为应对‘现在收集,以后解密’的量子威胁,在其C9000智能交换机中实现了全栈后量子密码(PQC)架构。该架构将NIST批准的PQC算法从硬件安全启动(Secure Boot)层延伸至数据传输协议(如SSH、MACsec、IPsec),通过嵌入FPGA的信任锚模块(TAm)和基于格的ML-KEM算法,旨在为园区和分支网络提供端到端的量子抵抗保护。
Check Point报告揭示AI安全执行鸿沟,提出统一AI防御平面与代理编排
Check Point发布2026云安全报告,指出77%企业更新AI安全策略但仅26%能有效执行,存在51%的“执行差距”。报告强调需从基础设施层构建统一、预防优先的安全架构,并推出“AI防御平面”与“代理网络安全编排平台”以应对AI代理、非人类身份等新挑战。
AWS SageMaker 通过 OpenAI 兼容 API 争夺 AI 推理控制权
AWS 宣布其 Amazon SageMaker AI 推理端点现支持 OpenAI 兼容的 API 接口。此举使开发者无需修改代码即可将基于 OpenAI API 构建的 AI 应用迁移至 SageMaker 平台,显著降低了从 OpenAI 向 AWS AI 基础设施迁移的技术与锁定门槛。
Anthropic联合创始人借教宗通谕呼吁外部力量制衡AI发展
Anthropic联合创始人Chris Olah受邀在梵蒂冈对教宗方济各关于AI的通谕发表评论。他坦承前沿AI实验室面临商业、地缘政治等多重压力,可能导致行为偏离,因此强调需要不受这些利益驱动的外部力量(如宗教、哲学、社会)进行审视、批评和引导。
AMD EPYC Venice业界首款量产2nm HPC CPU,$100亿封装生态投资
AMD发布EPYC Venice,业界首款量产2nm HPC CPU。同时宣布$100亿封装生态投资,与台积电、三星深度绑定先进封装产能。Venice采用2nm GAA工艺,核心数和性能未正式公布,但GF Securities预测将大幅领先当前Genoa/Bergamo。Venice+Helios(GPU)组合剑指AI推理服务器市场。2nm量产领先Intel一代,封装投资锁定供应链产能,形成工艺+产能双重护城河。
Exploitation of KnowledgeDeliver via ViewState Deserialization Vulnerability | Google Cloud Blog
Threat IntelligenceExploitation of KnowledgeDeliver via ViewState Deserialization VulnerabilityMay 25, 2026Mandiant Google Threat Intelligence Group Mandiant ServicesStop attacks, reduce risk, and adv...
思科发布内部RAG平台DRIFT,展示企业AI基础设施蓝图
思科IT部门推出名为DRIFT的文档检索与摄取框架工具包,旨在标准化和规模化企业内部RAG应用开发流程。该平台基于云原生微服务架构,运行在思科自有的AI POD基础设施上,提供从文档预处理到检索重排的端到端流水线,并支持Agentic RAG等演进用例。
思科调整漏洞披露策略,基于AI与风险优先级
思科宣布将调整其基于风险的漏洞披露模型,利用AI能力加速漏洞发现,并优先披露高风险漏洞的详细技术信息。对于内部发现且风险较低的漏洞,将减少独立披露,转而引导客户采用包含安全补丁的软件版本。
NVIDIA 开源医学图像生成框架,推动 3D 医疗 AI 数据瓶颈突破
NVIDIA 发布并开源了基于 MAISI-v2 (Latent Rectified Flow) 架构的 NV-Generate-CTMR 框架及其新模型 NV-Generate-MR-Brain。该框架旨在规模化生成高质量的 3D CT 和 MRI 合成数据,并配套发布了大规模开源多模态 MRI 数据集 MR-RATE,以解决医疗 AI 开发中的数据稀缺和隐私限制问题。
Google Cloud展示垂直行业AI Agent架构,强调混合集成能力
Google Cloud通过客户案例Movix,展示了为牙科制造业构建的端到端AI Agent解决方案。该方案基于Google Cloud基础设施,利用定制模型和Gemini Enterprise Agent Platform,并重点设计了连接本地遗留系统的混合架构,以进入保守市场。
NVIDIA 以智能体工具包推动 AI 工作流从模型调用向编排平台演进
NVIDIA 通过其 NeMo Agent Toolkit 开源库,展示了一个用于量化金融信号发现的多智能体系统参考架构。该系统将传统手动、碎片化的研究流程,转变为由配置驱动、具备可观测性的自动化闭环,凸显了智能体编排层在复杂 AI 应用中的核心价值。
思科与Qumulo验证统一数据平台架构,瞄准AI与混合负载
思科通过博客与白皮书,验证了其UCS M8机架服务器与Qumulo数据平台的集成方案。该方案旨在为AI、企业应用等混合工作负载提供统一、可扩展的文件与对象存储,并通过Cisco Intersight实现集中管理,以应对数据碎片化挑战。