TPU - AI基础设施情报搜索

Cisco 其他强信号 2026-04-10

思科宣布收购Galileo，强化AI Agent全生命周期可观测性

思科宣布计划收购专注于AI可观测性的初创公司Galileo。此举旨在将Galileo的AI质量评估、故障检测与护栏技术深度集成至Splunk可观测性云平台，为企业的AI Agent系统提供从开发到生产的全生命周期可见性与安全保障。

Google 产品发布中信号 2026-04-09

Google Cloud Next 2026：企业AI代理平台"登堂入室"的标志性时刻

Google Cloud Next 2026代表了AI平台竞争的"登堂入室"时刻。Gemini Enterprise Agent Platform的发布表明，大型云厂商已从"提供AI能力"转向"提供AI工作流"。平台捆绑战正式开打，企业需要在"功能完整性"和"供应商锁定风险"之间做出选择。

Cisco 其他强信号 2026-04-07

Cisco推广多元化增长杠杆策略

Cisco首席战略官提出企业需超越传统Build vs Buy二元决策，采用系统化增长策略。公司定义五个杠杆：内部开发、并购、合作、投资和孵化，强调生态系统协作以加速创新和市场响应。

Intel 技术更新强信号 2026-04-07

Intel代工突围：EMIB封装获美国两大云厂商战略背书

这笔交易的战略意义远超表面数字。Google和Amazon同时转向Intel意味着：美国两大云厂商在AI芯片领域"去台积电化"的战略共识已经形成。不仅是芯片制造，连先进封装这样高附加值的制造环节，也在发生供应链重构。

Anthropic 其他强信号 2026-04-06

Anthropic与Mozilla合作，AI模型可独立发现Firefox高危漏洞

Anthropic宣布其Claude Opus 4.6模型在两周内为Mozilla Firefox发现了22个漏洞，其中14个被定为高危。这标志着AI模型已能独立识别复杂软件中的未知安全漏洞，并初步尝试生成漏洞利用，预示AI在网络安全攻防两端的能力均进入新阶段。

Anthropic 其他强信号 2026-04-06

Anthropic联合谷歌与博通锁定千兆瓦级下一代TPU算力

Anthropic宣布与谷歌及博通达成新协议，锁定数千兆瓦的下一代TPU算力，预计2027年上线。此举旨在支撑其前沿Claude模型的训练与推理，并满足全球客户激增的需求。该合作是Anthropic对美国计算基础设施500亿美元投资承诺的重大扩展。

Microsoft 其他强信号 2026-04-04

微软发布Copilot Studio多智能体系统，推动企业AI架构互联

微软宣布Copilot Studio的多智能体系统全面上市，核心是通过开放协议（A2A）、与Fabric及Microsoft 365 Agents SDK的集成，实现跨工具、跨数据源的智能体协同编排。此举旨在将孤立的AI体验转变为可规模化协作的智能体系统，并增强了提示构建与治理控制。

Google 其他强信号 2026-04-03

谷歌为Gemini API引入Flex与Priority推理层级

谷歌为其Gemini API新增Flex和Priority两个服务层级。Flex是成本优化层级，为延迟容忍型工作负载提供同步接口，价格降低50%；Priority为高可靠性层级，确保关键应用在高峰期的请求不被抢占。此举旨在通过单一界面，让开发者根据AI任务类型（如后台Agent思考与前台交互）灵活平衡成本与可靠性。

Google 其他强信号 2026-04-03

谷歌发布Gemma 4开源模型，瞄准边缘推理与AI代理架构

谷歌推出Gemma 4开源模型家族，包含从2B到31B的四个版本，强调单位参数性能突破，并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化，旨在将前沿推理能力扩展至移动与IoT场景。

Google 其他中信号 2026-04-03

Google为Gemini API推出Flex和Priority推理层级

Google在其Gemini API中新增Flex和Priority两个服务层级，允许开发者通过单一接口优化成本和可靠性。Flex针对延迟容忍型工作负载提供50%的成本节约，而Priority则为关键应用提供最高可靠性保障。这一变化简化了AI代理架构中同步和异步任务的管理。

Google 其他中信号 2026-04-03

Google发布Gemma 4开源模型系列

Google推出Gemma 4开源模型系列，包含四种规模变体，特别优化边缘计算和移动设备。该系列支持多模态处理、长上下文窗口和140多种语言，采用Apache 2.0许可。

AMD 其他强信号 2026-04-02

AMD发布突破性MLPerf 6.0推理结果，展示多节点扩展与多模态能力

AMD在MLPerf Inference 6.0基准测试中，凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型（Wan-2.2-t2v）的快速启用，以及广泛的合作伙伴生态系统复现结果。

Cisco 其他中信号 2026-04-02

思科参与NIST生成式AI信任计划

思科宣布参与NIST生成式AI信任计划，重点开发可测量的AI信任评估框架。该计划包含动态对抗测试环境（Cat-and-Mouse框架）和代码生成挑战赛，旨在建立AI输出的可信度验证机制。

Cisco 其他强信号 2026-04-02

Cisco 披露 AI 编码助手内存污染攻击方法

Cisco 安全团队发现并验证了针对 Claude Code 等 AI 编码助手的持久性内存污染攻击方法，通过篡改 MEMORY.md 系统文件可长期操纵 AI 行为。该漏洞已促使 Anthropic 在 v2.1.50 版本中移除了用户记忆文件的系统提示权限。

NVIDIA 其他强信号 2026-03-25

英伟达联合能源机构展示AI算力工厂参与电网调峰

英伟达与能源研究机构EPRI、英国国家电网及初创公司Emerald AI合作，成功演示了基于Blackwell GPU集群的AI算力工厂如何根据电网实时需求，动态调节自身功耗以充当电网的“减震器”，同时保障高优先级AI工作负载的性能。

Cisco 其他强信号 2026-03-23

思科扩展零信任安全至AI代理生态

思科在RSA 2026宣布针对AI代理的安全创新，扩展Zero Trust Access至非人类身份，引入agentic IAM在Duo、MCP策略执行于Secure Access SSE，并推出AI Defense: Explorer Edition自助测试工具及DefenseClaw开源框架，以自动化安全部署。

Samsung Electronics 其他 2026-03-20

SK海力士HBM4E逻辑芯片跳级至TSMC 3nm，意在狙击三星4nm性能领先

SK海力士计划在第七代HBM4E中采用TSMC 3nm工艺制造逻辑芯片，较HBM4的12nm实现代际跨越。此举旨在扭转在HBM4上性能落后三星（三星采用4nm逻辑）的局面，为NVIDIA Vera Rubin Ultra等下一代AI芯片提供更高带宽与能效。

NVIDIA 其他 2026-03-17

NVIDIA Project Rheo：用仿真训练医院机器人，控制点从现实转向虚拟

NVIDIA发布Project Rheo蓝图，整合Isaac Sim、GR00T VLA模型和合成数据生成，用于医院机器人自动化。开发者可在数字孪生中训练物理AI策略，包括定位操作（如手术托盘拾取）和精密双手操作（如套管组装），并通过Cosmos Transfer 2.5跨场景泛化。

NVIDIA 其他强信号 2026-03-14

英伟达发布Cosmos世界模型套件，强化物理AI合成数据与推理能力

英伟达发布其Cosmos世界基础模型（WFM）套件的重要更新，包括Transfer 2.5、Predict 2.5和Reason 2。这些模型旨在加速生成高保真、符合物理规律的合成数据，并支持对机器人、自动驾驶等物理AI系统进行下游任务微调和推理，以解决真实世界数据稀缺的瓶颈。

NVIDIA 其他 2026-03-13

NVIDIA Warp：可微分物理模拟框架，打通AI训练与GPU加速

NVIDIA发布Warp框架，允许用Python编写GPU加速的物理模拟代码，并原生支持自动微分。通过2D Navier-Stokes求解器示例，展示了如何将模拟直接集成到AI优化流程中，降低物理AI训练数据生成成本。

情报

筛选