情报
AI 生成的结构化厂商动态简报
NVIDIA发布Vera CPU基准测试,专为智能体AI工厂优化
NVIDIA公布了其专为智能体AI设计的Vera CPU的第三方基准测试结果。该CPU集成了88个定制Olympus核心与第二代LPDDR5X内存子系统,在特定功耗下实现了显著的性能与内存带宽提升,标志着NVIDIA在数据中心CPU市场对x86架构发起实质性挑战。
NVIDIA发布RTX PRO 4500 Blackwell加速基因组与蛋白质折叠计算
NVIDIA推出基于Blackwell架构的RTX PRO 4500服务器GPU,通过集成Parabricks、Openfold3等软件,在基因组序列比对、变异检测和蛋白质结构预测等关键生命科学工作负载上实现2倍以上性能提升,显著降低计算时间与能耗。
Apple注册genai.apple.com域名,WWDC 2026将发布Siri独立App与生成式AI战略独立化
Apple在WWDC 2026前注册genai.apple.com域名,暗示生成式AI战略独立化。预计6月8日发布Siri重大升级:个人上下文感知、屏幕理解、深度应用操作,底层由Gemini驱动。iOS 27将带来Siri专属App、文字对话和第三方AI Extensions。
Exploitation of KnowledgeDeliver via ViewState Deserialization Vulnerability | Google Cloud Blog
Threat IntelligenceExploitation of KnowledgeDeliver via ViewState Deserialization VulnerabilityMay 25, 2026Mandiant Google Threat Intelligence Group Mandiant ServicesStop attacks, reduce risk, and adv...
微软发布Fara1.5浏览器Agent模型,72%任务成功率超OpenAI/Google
...
Google Cloud展示垂直行业AI Agent架构,强调混合集成能力
Google Cloud通过客户案例Movix,展示了为牙科制造业构建的端到端AI Agent解决方案。该方案基于Google Cloud基础设施,利用定制模型和Gemini Enterprise Agent Platform,并重点设计了连接本地遗留系统的混合架构,以进入保守市场。
Google I/O 2026全面押注Agentic AI:Gemini 3.5 Flash/Omni/Antigravity 2.0/Gemini Spark密集发布
Google I/O 2026发布Gemini 3.5 Flash(4倍输出速度+前沿智能)、Gemini Omni Flash(原生多模态视频生成)、Antigravity 2.0(Agent编排桌面平台+CLI+SDK)、Gemini Spark(24/7个人AI助手)。Gemini MAU从4亿增至9亿;资本开支2026年预计1800-1900亿美元(2022年的6倍)。
NVIDIA在COMPUTEX展示Vera Rubin NVL72等AI基础设施创新
NVIDIA在COMPUTEX 2026上获得多项最佳选择奖,其Vera Rubin NVL72机柜级AI超算、Jetson Thor边缘平台及Alpamayo自动驾驶开放平台获奖,展示了其在AI工厂、边缘推理和物理AI领域的基础设施布局。
BadHost漏洞(CVE-2026-48710):Starlette单字符绕过认证,全球AI Agent基础设施面临暴露风险
安全机构X41 D-Sec在OSTIF资助的vLLM审计中发现Starlette框架认证绕过漏洞CVE-2026-48710(BadHost)。根因:Starlette用HTTP Host头拼接重建request.url时未验证Host值合法性——注入/、?或#字符可导致request.url.path与ASGI路由的scope[path]产生解析不一致,path-based认证中间件被欺骗放行受保护资源。MCP Server特别高危:MCP规范要求/.well-known/oauth-authorization-server等Discovery端点默认公开,为攻击者提供最可靠的Host头注入路径。X41 D-Sec扫描发现生物制药临床试验数据库、企业邮箱完整访问权、AWS云拓扑、身份验证公司PII、工业设备堡垒机SSH等生产系统暴露。Starlette 1.0.1(5月21日)已修复,但3个月补丁周期(2月发现→5月发布)和间接依赖链导致大量部署仍受影响。X41评级CVSS 7.0(High),Starlette维护者评级6.5(Moderate)——分歧在于path-based auth是否为anti-pattern。
思科全面拥抱SONiC,提供从硬件到软件的全栈开放网络方案
思科宣布在其Cisco 8000和即将推出的N9000系列交换机上全面支持开放网络操作系统SONiC,并提供构建自有发行版和预构建镜像两种消费模式。此举旨在将思科硅芯片性能与SONiC的开放架构相结合,为AI和高性能工作负载提供可编程、可扩展的网络基础设施。
Google将AI Studio与云数据库及Firebase深度集成,降低全栈应用开发门槛
Google宣布AI Studio与Google Cloud的集成更新,支持开发者通过自然语言提示,一键将全栈应用部署至Cloud Run,并自动配置Firestore、Cloud SQL数据库及Firebase Auth身份验证。此举旨在通过零成本启动和AI代理驱动的数据库选择,显著降低应用原型开发与部署的初始摩擦。
谷歌发布Antigravity 2.0,定义AI Agent本地开发控制平面
谷歌在I/O 2026上推出Antigravity 2.0,这是一个独立的桌面应用,旨在成为构建、测试和编排复杂AI工作流的“Agent-First”本地控制平面。它通过CLI/SDK、动态子代理和与企业云安全环境的直接集成,将AI Agent的开发与部署流程从云端延伸至本地环境,试图统一AI应用生命周期管理。
英特尔以集成SoC架构推动边缘AI机器人计算从独立GPU迁移
英特尔宣布其Core Ultra Series 3处理器正被多家机器人公司采用,以集成CPU、GPU、NPU的SoC架构替代昂贵、高功耗的独立GPU,用于边缘AI推理。这标志着机器人“大脑”向成本效益更高、更易部署的集成化异构计算架构转变。
NVIDIA与Google Cloud深化开发者生态融合,推进AI基础设施与应用栈整合
NVIDIA与Google Cloud联合开发者社区规模超10万人,提供从JAX优化、NVIDIA Dynamo推理优化到AI水印(SynthID)的全栈学习路径。此举旨在通过整合双方底层硬件(Blackwell/Rubin GPU)、云平台(GKE, AI Hypercomputer)与软件框架(Nemotron, Gemma),加速企业级AI应用从原型到生产的落地。
谷歌推出代理优先平台Antigravity,重塑AI原生应用架构
谷歌在I/O 2026上推出代理优先开发平台Google Antigravity,并以此为基础发布Gemini 3.5 Flash模型。该平台深度集成至搜索与Gemini应用,支持创建信息代理、生成实时交互UI及构建自定义迷你应用,标志着AI开发重心从模型调用转向持续运行的代理系统。
谷歌发布统一AI Agent开发工具包,整合本地与云端部署
谷歌在I/O大会上发布统一AI Agent开发工具包,包含Antigravity 2.0和Managed Agents API,旨在通过共享的A2A协议层,为开发者提供从本地快速原型到安全合规云部署的完整路径。该举措将Gemini Enterprise Agent Platform能力延伸至本地开发工具,提供从低代码到完全代码控制的多层次选择。
谷歌公共部门展示AI Agent规模化部署蓝图
谷歌公共部门通过美国交通部、FDA和洛杉矶市案例,阐述其推动政府机构从AI试点转向全面Agentic转型的战略。其核心是提供集成化AI堆栈,并强调领导力、规模化与以人为本三大支柱。
NVIDIA与戴尔发布全栈AI工厂,加速企业级Agentic AI部署
NVIDIA与戴尔深化合作,推出更新版Dell AI Factory with NVIDIA,旨在为企业提供从工作站到数据中心的端到端Agentic AI推理与部署平台。该平台整合了NVIDIA Vera Rubin GPU、Vera CPU、Confidential Computing及Nemotron模型,强调安全、高性能的本地化AI基础设施,以应对激增的AI推理需求。
AWS深化AI代理与多云连接,强化企业现代化与安全
AWS发布多项更新,重点包括将Claude Platform原生集成至AWS账户,推出更强大的EC2 M3 Ultra Mac实例,并扩展AWS Transform AI代理现代化服务至Kiro、Claude等平台。同时,AWS Security Agent新增全仓库代码扫描,AWS Interconnect新增对Oracle Cloud Infrastructure的多云连接支持。
Google 通过 TPU 8 与分布式训练架构强化全栈 AI 控制力
Google 在 I/O 2026 上披露其 AI 基础设施战略核心:发布专为训练和推理优化的 TPU 8t 与 8i 芯片,并实现基于 JAX 和 Pathways 的跨数据中心分布式训练。同时,其年度资本支出预计达 1800-1900 亿美元,以支撑激增的 AI 算力需求。