情报
AI 生成的结构化厂商动态简报
英伟达内部规模化部署GPT-5.5驱动AI代理,定义企业AI基础设施新范式
英伟达宣布其超过1万名员工已通过Codex应用,在基于GB200 NVL72的NVIDIA基础设施上规模化使用GPT-5.5。此举不仅展示了前沿模型推理在企业内部工作流中实现‘变革性’生产力的技术可行性,更通过专用的安全云VM架构,为企业部署AI代理提供了可审计、隔离的参考范式。
思科通过资本部门加速AI数据中心融资模式转型
思科博客阐述其内部金融服务机构Cisco Capital如何提供灵活的支付解决方案,帮助客户应对AI数据中心快速迭代带来的资金压力。该模式旨在将硬件、软件和服务捆绑,简化采购流程,使IT支出与基础设施的演进周期保持一致。
思科发布通用量子交换机原型,推动量子网络互联
思科宣布其通用量子交换机研究原型,旨在解决量子网络互联的关键硬件瓶颈。该设备支持不同编码模态的量子系统间转换与路由,无需低温环境,可在标准电信光纤上运行,为构建大规模、异构的量子计算与传感网络奠定基础。
微软在澳大利亚进行250亿澳元AI与云基础设施投资
微软宣布在澳大利亚进行其史上最大规模投资,总额达250亿澳元,旨在扩大AI和云计算基础设施容量、加强网络安全,并提升全国范围内的数字技能。此举旨在将澳大利亚定位为亚太地区的AI中心。
NVIDIA 集成 Blackwell MIG 与 vGPU 20,重塑企业虚拟化数据中心 GPU 控制层
NVIDIA 发布技术指南,展示如何将 RTX PRO 4500 Blackwell Server Edition GPU 的 Multi-Instance GPU (MIG) 硬件分区能力与 vGPU 20 软件栈深度集成于 VMware vSphere 环境。该组合使单物理 GPU 可被安全划分为多个具备 QoS 保证的虚拟 GPU 实例,旨在高效加速从知识工作到轻量级 AI 开发的混合企业负载。
微软发布托管AI Agent基础设施,将AI Agent视为独立计算实体
微软通过Foundry平台推出“托管代理(Hosted agents)”,为每个AI Agent提供独立、隔离的企业级沙盒环境,包含持久化状态、内置身份与治理。此举旨在将AI Agent的运行时基础设施标准化,降低企业部署门槛,但评论指出此举将控制点从应用层转移至基础设施层。
思科将网络定位为AI基础设施的能源控制层
思科通过其博客阐述了能源正成为AI规模化的关键瓶颈,并展示其正为一家欧洲银行设计下一代AI数据中心。思科强调网络在融合数字与能源系统中的作用,将其视为提供能见度、协调和安全性的控制层,以管理AI工作负载的能源、冷却和空间约束。
NVIDIA与Google Cloud深化合作,构建面向AI工厂与物理AI的云基础设施
NVIDIA与Google Cloud宣布合作升级,推出基于Vera Rubin和Blackwell GPU的新实例,旨在构建支持近百万GPU集群的“AI工厂”,并整合Gemini、Nemotron等模型平台,加速从智能体到物理AI(如机器人、数字孪生)的生产级部署。
Google发布Gemini企业级代理平台,定义AI代理时代技术栈
Google在Next '26上发布Gemini企业级代理平台,提供构建、扩展、治理和优化AI代理的端到端解决方案。该平台整合了新的AI基础设施、数据云、安全防御和任务执行能力,旨在将企业流程统一为单一智能工作流。
思科发布OT安全入门框架,强调经济性与可执行性
思科发布工业OT安全入门框架,针对中型企业资源有限现状,提出分阶段、低成本的实施路径。核心是避免因过度依赖SPAN端口等被动监控架构而产生高昂的隐性基础设施成本,转而利用现有网络设备(如支持Cyber Vision的交换机)实现初步可见性。
Anthropic与AWS签署千亿美元协议锁定未来十年AI算力
Anthropic与亚马逊AWS签署新协议,承诺未来十年投入超1000亿美元,锁定高达5吉瓦的AI算力容量,并计划将Claude平台深度集成至AWS。此举旨在应对其AI模型Claude的爆炸性需求增长,并巩固其作为AWS上关键AI模型提供商的地位。
思科与罗克韦尔深化合作,推动工业AI从试点走向规模化生产
思科与罗克韦尔自动化强化战略合作,旨在解决工业AI从试点到规模化部署的瓶颈。双方强调,阻碍规模化部署的核心并非AI模型或算力,而是底层网络、计算、可观测性与安全集成的统一基础设施。该合作聚焦于通过思科统一边缘等平台,将AI能力嵌入生产现场,实现实时质量检测与预测性维护。
Anthropic发布Claude Design,整合AI视觉与设计工作流
Anthropic推出Claude Design,通过其最强视觉模型Claude Opus 4.7驱动,允许用户协作创建设计、原型和演示文稿等。该产品面向企业团队,支持从代码库自动构建品牌设计系统,并能将设计无缝移交给Claude Code进行开发。
思科提出AI网络演进三阶段,强调软件定义与智能运维
思科发布博客阐述其应对AI时代网络挑战的解决方案,核心是通过软件定义网络、统一分支架构和智能运维(AgenticOps)实现网络现代化,避免大规模硬件更换。该方案分为现代化分支、智能优化连接和实现自主运维三个阶段。
思科携手英伟达,将网络升级为AI媒体处理的控制平面
思科与英伟达深化合作,推出基于开放标准MXL的验证设计方案。该方案将思科IP媒体架构与英伟达Holoscan平台整合,使网络从传输层演变为支持实时AI推理的主动处理层,为广电行业实现低延迟、多语言的实时AI媒体生产。
微软提前启用Fairwater超大规模AI数据中心,定义AI基础设施新标准
微软宣布其位于威斯康星州的Fairwater数据中心提前投入运营。该中心被定位为全球最强大的AI数据中心,集成了数十万个NVIDIA GB200 GPU,通过大规模光纤互连构成单一无缝集群,旨在为下一代AI模型训练和推理提供前所未有的算力规模。
Anthropic发布Claude Opus 4.7并引入网络安全护栏
Anthropic正式发布Claude Opus 4.7模型,在复杂软件工程、多模态理解和长时推理任务上实现显著提升。该版本首次引入了针对高风险网络安全用途的自动检测与拦截护栏,并为安全研究设立了验证程序,旨在为更强大模型(如Mythos)的广泛发布积累安全经验。
思科研究揭示多模态提示注入攻击新风险与防御信号
思科AI安全研究团队发布报告,系统评估了针对视觉语言模型的排版式提示注入攻击。研究发现,字体大小、模糊、旋转等视觉变换显著影响攻击成功率,并首次提出文本-图像嵌入距离可作为轻量级、模型无关的风险信号,为构建多模态AI安全防御层提供了新思路。
英伟达推动AI基础设施评估指标从FLOPS转向每token成本
英伟达提出应将“每token成本”而非“每美元FLOPS”作为评估AI基础设施的核心经济指标。这标志着从衡量计算输入转向衡量商业输出,涉及硬件、软件、网络的全栈优化,以降低企业AI推理的总拥有成本。
NVIDIA 发布多节点 GPU 互联性能基准测试工具 NVbandwidth
NVIDIA 在其开发者博客上正式发布 NVbandwidth 工具,这是一个基于 CUDA 的基准测试套件,用于测量单节点及多节点 GPU 系统内各种内存拷贝模式的带宽与延迟。该工具支持 NVLINK、PCIe 等多种互联拓扑,并集成 MPI 以支持跨节点集群的性能评估。