Google - AI基础设施情报搜索

Google Cloud 其他 2026-07-18

Google Cloud Cloud Run沙箱5秒千级并发，锁定Agentic AI部署标准

Google Cloud发布Cloud Run沙箱功能，可在5秒内启动1000个隔离环境，平均延迟500毫秒，专为自主AI Agent工作负载设计。该功能解决了Agentic工作流中安全、临时、高响应计算实例的需求，支持RAG和多步Agent系统。

AMD 其他 2026-07-16

AMD与OpenAI达成6GW算力供应历史性协议 1.6亿认股权证可获10%股权股价盘前涨35%

...

NVIDIA 其他 2026-07-16

NVIDIA联手日本打造主权AI与物理AI生态，发布T3000/T2000模块和Cosmos 3 Edge

NVIDIA发布基于Thor架构的T3000/T2000超级计算模块和Cosmos 3 Edge世界模型，与日本Noetra联盟签约部署13750颗Vera CPU+27500颗Rubin GPU（140MW），主权AI收入FY2026三倍增长至300亿美元以上，物理AI生态加速成型。

NVIDIA 其他 2026-07-16

NVIDIA+Nokia联盟打破RAN生态：GPU加速AI RAN 2027年商用

NVIDIA与Nokia联合开发AI RAN技术，利用NVIDIA GPU加速基带处理，通过AI优化波束赋形和频谱管理，目标2028年频谱效率翻倍。该合作标志着电信RAN从专用硬件向GPU通用计算和AI软件定义的重大转型，预计2027年商用部署。

Google 其他 2026-07-15

Google BigQuery深度集成Gemini Enterprise，重塑AI治理控制权

Google Cloud推出方案，将Gemini Enterprise应用的遥测数据（用户提示、模型响应、活动日志）实时路由到BigQuery。利用BigQuery的AI分析能力（Conversational Analytics、自动Schema生成），实现大规模AI部署的自动化审计、合规治理和业务洞察，强化数据驱动的AI可观测性。

Apple 其他 2026-07-15

Apple洽谈PrismML压缩Qwen 27B模型，端侧AI实现15倍内存缩减

Apple正与AI初创公司PrismML洽谈，利用其压缩技术将阿里巴巴Qwen 27B参数模型部署到iPhone上。该技术通过1-bit量化、蒸馏和架构优化，使模型仅需10GB VRAM运行，实现15倍内存减少，推动端侧AI从云端调用转向本地推理。

Other 其他 2026-07-15

纽约州签署一年期AI超大规模数据中心禁令，监管化范式转折开启

纽约州签署行政命令，对50MW以上AI超大规模数据中心实施一年建设禁令，立即生效。此举为美国首个全州范围禁令，至少11州正审议类似法案，标志着AI基础设施从'建得快'到'建得稳'的监管范式转折。

Microsoft 其他 2026-07-15

Microsoft发布Agent Framework Go SDK，与Google争夺Go开发者生态

2026年7月，Microsoft发布Agent Framework的Go SDK公开预览版，支持MCP和多Agent协调。此举使Microsoft与Google成为仅有的两家为Go语言提供原生Agent框架的一线云厂商，而OpenAI和Anthropic仍仅支持Python，面临开发者生态流失风险。

AMD 其他 2026-07-15

AMD确认Zen 6 EPYC Venice：首款2nm服务器CPU，2026年7月登场

AMD确认将于2026年7月22-23日推出基于Zen 6架构的EPYC Venice服务器CPU，这是业界首款采用2nm制程的芯片。该CPU采用三层混合架构，单核性能提升约29%，多核提升约22%，核心数达128-192核，旨在强化AI推理与CPU-GPU协同。

Other 其他 2026-07-14

SANS发现49个IP分布式扫描MCP服务器，AI基础设施成安全新靶

SANS Internet Storm Center披露攻击者系统性地扫描MCP服务器、AI助手配置文件和本地LLM端点。49个独立IP发起MCP握手，利用CVE-2026-25536和CVE-2026-34742，标志AI基础设施成为攻击焦点。

Meta 其他 2026-07-14

Meta斥资500亿美元扩建5GW数据中心，以Local-First模式重构AI基础设施生态

Meta将路易斯安那州Hyperion数据中心扩建至5GW容量，总投资从100亿美元跃升至500亿美元。通过与Entergy合作自建10座发电设施和240英里输电线，并采用合资与融资模式，Meta正在开创AI基础设施的Local-First时代，彻底改变数据中心与能源、资本的协作方式。

Meta 其他 2026-07-13

Meta Iris芯片9月量产：6个月迭代周期颠覆NVIDIA GPU霸权

路透社确认Meta Iris AI芯片9月量产，2026年底达2.5GW，2027年目标14GW。Meta采用6个月一代的MTIA四代路线图，以自研ASIC节奏对抗NVIDIA年度更新，标志着超大规模厂商从GPU依赖向定制芯片自主的范式转移。

TSMC 其他 2026-07-13

TSMC CoWoS产能2027年冲击20万片，从GPU专属转向CPU/ASIC三驱动

TSMC规划CoWoS月产能2027年达20万片，供需缺口从20%收敛至10%。客户结构从NVIDIA GPU独大转向GPU+AI服务器CPU+自研ASIC三驱动，MediaTek ARM服务器CPU封装量翻倍。CoPoS面板级封装2027年中试产，为后CoWoS时代铺垫。

Microsoft 其他 2026-07-12

微软接手OpenAI北极数据中心，AI算力基础设施控制权转移

微软租赁挪威北极圈数据中心，部署3万颗NVIDIA Vera Rubin芯片，填补OpenAI退出的算力空缺。OpenAI将2030年基建支出从$140B大幅下修至$60B，战略收缩。微软在AI算力军备竞赛中已超越OpenAI，并形成地理冗余优势。

Anthropic 其他 2026-07-12

Anthropic锁定Broadcom 3.5GW定制TPU，AI算力从GPU转向专用ASIC

Broadcom Q2 FY2026财报披露与Anthropic的3.5GW TPU算力协议，2027年上线。该协议标志着Anthropic从依赖通用GPU转向大规模部署定制TPU（ASIC），同时OpenAI、Meta等也有类似GW级承诺，AI算力基础设施正经历从通用芯片向专用ASIC的根本性转变。

Apple 其他 2026-07-10

PrismML 1-bit压缩技术突破：270亿参数Qwen模型4GB内完整运行于手机端

PrismML实现270亿参数稠密大模型压缩至4GB，在iPhone 17 Pro上全量激活运行。采用原生1-bit技术（权重仅{-1, +1}），压缩比超92%，推理速度提升8倍，能耗降低75-80%。显著区别于Apple稀疏架构方案，有望重塑端侧AI部署范式。

Amazon 其他 2026-07-10

AWS Trainium 3对外销售：自研AI芯片挑战NVIDIA霸权

AWS正式对外销售第三代自研AI训练芯片Trainium 3，采用台积电3nm制程，单芯片算力达2.52 PFLOPS。Anthropic、Uber为首批客户，此举直接挑战NVIDIA主导地位，标志着AWS从云服务商向芯片供应商的战略延伸。

AMD 其他 2026-07-10

Towards Feature Complete Triton Support in JAX-Triton â ROCm Blogs

...

OpenAI 其他 2026-07-09

OpenAI重返开源：GPT-oss系列以Apache 2.0许可部署云端卸载控制点

OpenAI发布GPT-oss-120b和GPT-oss-20b两款开源模型，采用Apache 2.0许可，可在单张80GB GPU上运行。但模型内置云端卸载机制，复杂任务自动转至闭源模型处理，表面开源实则保留核心控制点。

Google 其他 2026-07-09

Google Gemini 3.5 Pro架构重写：200万Token上下文引爆AI模型军备竞赛

Google DeepMind宣布7月17日发布Gemini 3.5 Pro，采用从头重建的预训练架构而非迭代升级，以解决数学推理、SVG生成和图像质量三大短板。模型将具备200万Token上下文窗口、Deep Think推理层和多步骤自主工作流能力，但官方规格尚未确认。

情报

筛选