情报
AI 生成的结构化厂商动态简报
NVIDIA联合金融巨头推动交易基础模型,重构AI架构范式
NVIDIA联合Revolut、Mastercard、Stripe等金融机构,基于其全栈AI平台(Hopper GPU, Nemotron, NeMo)推出“构建您自己的交易基础模型”开发者示例。该模型旨在通过单一Transformer架构统一处理海量交易数据,替代传统针对单一业务(如欺诈、信用评分)的孤立模型,并已通过AWS、Nebius等云平台及多家服务商进行生态化部署。
Oracle Cloud加入Arm AGI CPU生态,Arm架构加速夺取AI基础设施控制层
Oracle Cloud Infrastructure宣布加入Arm AGI CPU生态系统,将基于Arm架构的优化CPU引入其云平台以支持Agentic AI工作负载。这一动作进一步验证了Arm Neoverse平台在云数据中心,特别是AI基础设施中替代传统x86架构的趋势。
Anthropic扩展‘玻璃翼项目’,以分层治理重塑AI安全能力交付
Anthropic将其AI安全协作项目‘玻璃翼(Project Glasswing)’的合作伙伴从约50家扩展至约200家,新增150家组织需满足其安全要求方可访问Claude Mythos Preview模型。项目重点覆盖全球关键基础设施供应商及核心开源软件维护者,并计划将支持从漏洞发现扩展至披露、修复和部署补丁的全生命周期。
AWS通过Bedrock集成OpenAI GPT-5.5与Codex,重塑AI模型分发控制点
AWS宣布在Amazon Bedrock平台上全面开放OpenAI的GPT-5.5、GPT-5.4模型及Codex编码代理的访问。企业可通过Bedrock的下一代推理引擎与统一的Responses API调用这些前沿模型,同时满足数据驻留要求并按Token付费。此举将OpenAI的模型能力深度嵌入AWS的AI基础设施层。
微软发布集成NVIDIA Blackwell的Surface Laptop Ultra,定位AI与开发创作者
微软发布新款Surface Laptop Ultra,首次在笔记本电脑中集成NVIDIA Blackwell RTX GPU,配备高达128GB统一内存,支持本地运行1200亿参数模型。该产品由微软、Windows和NVIDIA深度合作,从芯片层面优化,专为AI构建者、开发者和内容创作者的高负载工作流设计。
NVIDIA将Step 3.7 Flash多模态模型深度整合至其企业AI全栈
NVIDIA宣布在其加速平台上全面支持StepFun的Step 3.7 Flash模型,这是一个1980亿参数的MoE多模态模型。通过TensorRT-LLM、vLLM进行优化推理,并通过NVIDIA NIM提供生产就绪的容器化微服务部署,同时支持基于NeMo框架的Day 0微调。
AWS推出新一代Resilience Hub,集成生成式AI重构SRE弹性管理
AWS宣布其Resilience Hub平台的重大升级,引入基于业务路径的新应用模型、生成式AI驱动的故障模式分析、自动依赖发现以及模块化弹性策略。该平台深度集成AWS Organizations,旨在为企业SRE和开发团队提供从策略定义、评估到合规证明的端到端结构化弹性管理能力。
Anthropic完成650亿美元H轮融资,估值逼近万亿并锁定海量算力
Anthropic宣布完成650亿美元H轮融资,投后估值达9650亿美元。资金将用于安全研究、扩展算力以满足Claude需求,并深化与亚马逊、谷歌、SpaceX等基础设施伙伴的合作,锁定高达10吉瓦的下一代TPU和GPU产能。
思科定义“跨域扩展”网络新范式,以硅光协同应对AI集群地理分散化
思科发布博客,系统阐述其应对AI训练集群地理分散化挑战的“跨域扩展”网络架构。该架构以Cisco Silicon One P200路由系统与800G ZR/ZR+相干可插拔光模块为核心,通过硅与光的协同设计,旨在为跨数十至数百公里数据中心的GPU集群提供确定性、低延迟、无损的连接。
Anthropic发布Claude Opus 4.8,以诚实度与代理可靠性重塑企业AI协作模式
Anthropic推出Claude Opus 4.8模型,核心提升在于代理任务(agentic tasks)的端到端可靠性、诚实度及判断力。同步引入‘动态工作流’功能,支持单会话内运行数百并行子代理处理超大规模任务,并提供用户可调的‘努力程度控制’,实现速度、成本与输出质量的精细权衡。
AWS 通过 AI Hero 计划强化社区主导的 AI 基础设施布道
AWS 在 2026 年 5 月新晋的四位 Hero 中,有三位被授予“人工智能英雄”称号,他们专注于利用 Amazon Bedrock、Nova 等 AI 服务构建工具、组织大型社区活动并参与 AI/ML 认证体系构建。此举标志着 AWS 正系统性地将社区影响力从泛云架构向 AI 基础设施领域深度引导。
微软响应《Take It Down Act》,跨消费者服务部署NCII哈希检测与统一举报流程
微软宣布强化对非自愿亲密图像(NCII,含AI生成内容)的治理。核心动作包括:优化全球举报流程表单,统一处理真实与合成图像;并将在Teams Free、OneDrive、Xbox等消费者服务中,扩展使用来自StopNCII.org的已验证图像哈希进行主动检测与移除。此举直接响应美国《Take It Down Act》生效,旨在提升处理速度与跨平台协同。
AWS SageMaker 通过 OpenAI 兼容 API 争夺 AI 推理控制权
AWS 宣布其 Amazon SageMaker AI 推理端点现支持 OpenAI 兼容的 API 接口。此举使开发者无需修改代码即可将基于 OpenAI API 构建的 AI 应用迁移至 SageMaker 平台,显著降低了从 OpenAI 向 AWS AI 基础设施迁移的技术与锁定门槛。
BadHost漏洞(CVE-2026-48710):Starlette单字符绕过认证,全球AI Agent基础设施面临暴露风险
安全机构X41 D-Sec在OSTIF资助的vLLM审计中发现Starlette框架认证绕过漏洞CVE-2026-48710(BadHost)。根因:Starlette用HTTP Host头拼接重建request.url时未验证Host值合法性——注入/、?或#字符可导致request.url.path与ASGI路由的scope[path]产生解析不一致,path-based认证中间件被欺骗放行受保护资源。MCP Server特别高危:MCP规范要求/.well-known/oauth-authorization-server等Discovery端点默认公开,为攻击者提供最可靠的Host头注入路径。X41 D-Sec扫描发现生物制药临床试验数据库、企业邮箱完整访问权、AWS云拓扑、身份验证公司PII、工业设备堡垒机SSH等生产系统暴露。Starlette 1.0.1(5月21日)已修复,但3个月补丁周期(2月发现→5月发布)和间接依赖链导致大量部署仍受影响。X41评级CVSS 7.0(High),Starlette维护者评级6.5(Moderate)——分歧在于path-based auth是否为anti-pattern。
AWS深化AI代理与多云连接,强化企业现代化与安全
AWS发布多项更新,重点包括将Claude Platform原生集成至AWS账户,推出更强大的EC2 M3 Ultra Mac实例,并扩展AWS Transform AI代理现代化服务至Kiro、Claude等平台。同时,AWS Security Agent新增全仓库代码扫描,AWS Interconnect新增对Oracle Cloud Infrastructure的多云连接支持。
诺基亚与沃达丰在AWS云上验证核心网功能,推进IoT平台云化
沃达丰与诺基亚成功完成一项试验,将诺基亚的IMS语音核心网和分组数据核心网等关键网络功能部署在AWS云基础设施上,旨在为全球物联网连接平台提供更敏捷的容量扩展能力。
Cloudflare与Anthropic合作,为Claude智能体提供云原生执行环境
Cloudflare与Anthropic合作,将Claude Managed Agents的执行层(“手”)与推理层(“脑”)解耦,并集成到Cloudflare开发者平台。此举使企业能在Cloudflare的沙箱、VPC和代理网络中安全、大规模地运行AI智能体代码与工具。
NVIDIA CUDA Toolkit堆溢出漏洞暴露GPU云共享模型的根本架构缺陷
Pwn2Own Berlin 2026首次纳入AI/ML类别,NVIDIA CUDA NVVM编译器堆溢出CVE-2026-12839被利用。恶意PTX代码可从GPU驱动逃逸至主机内核,云环境中实现跨租户逃逸。GPU云安全隔离依赖驱动层,此漏洞打破隔离基础假设。
亚马逊Bedrock推出高级提示优化与模型迁移工具
亚马逊在Bedrock服务中推出高级提示优化工具,支持用户通过基于指标反馈循环自动优化提示词,并可同时在最多5个模型上进行测试与迁移评估。该工具整合了Lambda函数、LLM-as-a-Judge和自然语言指导等多种评估方法。
思科推动服务商将边缘基础设施转型为AI服务平台
思科通过其博客阐述了服务提供商在AI需求驱动下面临的边缘计算新机遇,即利用其大规模分布式网络基础设施,提供包含AI推理、本地数据处理在内的企业服务。思科统一边缘平台旨在解决跨数千个站点的规模化、自动化部署与管理挑战。