Token - AI基础设施情报搜索

Other 其他 2026-07-18

PPIO发布Agentic Cloud，智能模型网关成Agent流量新控制点

PPIO在WAIC 2026发布Agentic Cloud和智能模型网关，专为Agent工作负载设计，实现语义级流量识别与成本感知调度。平台日均Token调用超1.2万亿，Agent Harness支持沙箱冷启动低于200毫秒。这标志着Agent基础设施正成为独立品类。

Palo Alto Networks 其他 2026-07-17

Palo Alto Networks推出AI Gateway，意图成为企业AI流量的统一控制平面

Palo Alto Networks宣布AI Gateway正式全面上市，整合收购的Portkey技术，定位为企业的AI控制平面。该平台提供统一执行点支持LLM、MCP和A2A协议，已处理超68万亿token，实现亚毫秒级路由延迟。

Other 其他 2026-07-17

百度昆仑芯超节点量产交付，是石科技首发国产Token优化工厂

...

Other 其他 2026-07-17

国产GPU集群亮相WAIC 2026，摩尔线程/无问芯穹/壁仞/沐曦密集发布

...

AMD 其他 2026-07-16

AMD与OpenAI达成6GW算力供应历史性协议 1.6亿认股权证可获10%股权股价盘前涨35%

...

Microsoft 其他 2026-07-16

Microsoft自研MAI模型替代OpenAI/Anthropic，AI供应商格局生变

Microsoft开始在Excel和Outlook中用自研MAI模型替代OpenAI和Anthropic的AI调用，每周处理数万次提示任务。此举旨在降低对Anthropic的依赖和成本，推动AI模型内部化战略，影响AI供应商生态。

Other 其他 2026-07-14

SANS发现49个IP分布式扫描MCP服务器，AI基础设施成安全新靶

SANS Internet Storm Center披露攻击者系统性地扫描MCP服务器、AI助手配置文件和本地LLM端点。49个独立IP发起MCP握手，利用CVE-2026-25536和CVE-2026-34742，标志AI基础设施成为攻击焦点。

Huawei 其他 2026-07-10

华为昇腾万卡集群上线韶关，灵衢协议统一池化引领国产AI算力

华为在粤港澳大湾区韶关上线昇腾万卡智算集群，部署超万张昇腾AI加速卡。同时发布Atlas 950 SuperPoD，采用自研灵衢(UnifiedBus)互联协议，支持8192张NPU卡互联，带宽16.3 PB/s。华为云入选Gartner 2026云AI基础设施领导者象限，进一步强化国产算力生态布局。

AMD 其他 2026-07-10

AMD实验性Topological Ghost Protocol使MI300X推理吞吐量飙升10倍

AMD在MI300X GPU上实验性推出Topological Ghost Protocol（TGP），通过KV-cache回收与分段状态管理，在高并发推理中实现431 tokens/秒吞吐量，较标准vLLM的42.7 tokens/秒提升10倍，成功率100%。该技术仍处实验阶段，但可能重新定义AI推理性能基准。

Google 其他 2026-07-09

Google Gemini 3.5 Pro架构重写：200万Token上下文引爆AI模型军备竞赛

Google DeepMind宣布7月17日发布Gemini 3.5 Pro，采用从头重建的预训练架构而非迭代升级，以解决数学推理、SVG生成和图像质量三大短板。模型将具备200万Token上下文窗口、Deep Think推理层和多步骤自主工作流能力，但官方规格尚未确认。

Anthropic 其他 2026-07-03

Anthropic发布Sonnet 5中端模型，性能逼近旗舰Opus，加速企业生态锁定

Anthropic发布中端模型Claude Sonnet 5，在SWE-bench Pro和知识工作基准测试中性能逼近旗舰Opus 4.8，定价仅为旗舰的六成。同时推出Claude Science科研工作台，整合60多个科学数据库，意图通过工具链和性价比优势深化企业用户锁定。

Qualcomm 其他 2026-07-02

高通携Dragonfly C1000与HBC技术杀入AI推理，直指Nvidia HBM壁垒

高通发布Dragonfly路线图，包括自研Oryon核心的C1000 CPU和搭载HBC近存计算技术的AI300推理加速器，Meta和Microsoft已签约。目标是通过降低TCO和突破memory wall，在AI推理市场形成差异化，避开与Nvidia在训练端的正面竞争。

Anthropic 其他 2026-07-02

Anthropic发布Sonnet 5：以旗舰40%成本实现近Opus级性能，重构AI推理经济

Anthropic发布中端旗舰模型Claude Sonnet 5，定价仅为Opus 4.8的40%。该模型在SWE-bench Pro编码测试中得分63.2%，逼近Opus 4.8的69.2%；在知识工作基准GDPval-AA v2中以1618分超越Opus 4.8。Sonnet 5原生支持100万Token上下文，平均激活480亿参数，旨在以高性价比驱动大规模API收入增长。

Cloudflare 其他 2026-07-01

Announcing the Monetization Gateway: charge for any resource behind Cloudflare via x402

...

NVIDIA 其他 2026-07-01

NVIDIA BlueField-3 DPU：将AI云I/O控制权从CPU移至专用硬件，重塑算力交付安全边界

NVIDIA BlueField-3 DPU通过硬件级vDPA架构将虚拟化网络与存储数据面从主机CPU卸载至专用数据处理器，实现接近裸金属的性能与热迁移弹性。同时，它构建了CPU-DPU-GPU间的可信I/O通路，强化机密计算，但本质上是以专用硬件锁定云平台底层架构，增加对NVIDIA硅片的依赖。

OpenAI 其他 2026-06-30

OpenAI GPT-5.6 Sol限量发布：政府审批式访问开启AI监管新纪元

OpenAI发布GPT-5.6系列，旗舰模型Sol在TerminalBench 2.1取得91.9%高分，但采用政府审批式限量预览模式。模型安全评级为'High'，且被曝最高作弊率。定价仅为Anthropic一半，但访问流程受白宫直接干预，首批仅20家合作伙伴获得API权限。

Amazon 其他 2026-06-30

AWS与Anthropic签Token付费协议，重塑AI云生态利益分配

亚马逊AWS与Anthropic达成新协议，从按算力付费转向按Token付费。此举旨在应对亚马逊自有Nova模型竞争力不足的困境，同时深化与Anthropic的绑定，以对标微软-OpenAI的合作模式，但为亚马逊的AI支出引入了新的成本变量。

NVIDIA 其他 2026-06-25

NVIDIA推Vera CPU+Rubin GPU，意图将AI控制权从x86转向自研架构

黄仁勋在股东大会上宣布Vera CPU为智能体设计，与Rubin GPU组成新平台，声称Blackwell推理token吞吐量比竞品高30倍，并强调CUDA生态是护城河。此举旨在将AI计算控制点从通用CPU转向NVIDIA自有架构。

Huawei 其他 2026-06-25

华为MWC上海2026力推Token计费：从字节管道转向AI价值交付，运营商需重构网络架构

华为在MWC上海2026提出运营商应从基于字节的计费转向基于AI Token的计费，并展示了AI推理加速方案，将长序列推理吞吐量提升372%。同时强调U6 GHz频段对AI可穿戴设备上行链路的关键作用，推动5G-A网络成为AI计算交付基础设施。