TSMC 2026-07-01
Product Launch 影响: Major 置信: 85%

Etched发布Transformer专用ASIC Sohu:推理性能声称达H100的20倍,正面冲击NVIDIA垄断

内容摘要

AI芯片初创公司Etched推出首款Transformer专用ASIC芯片Sohu,采用台积电N4P工艺,搭载144GB HBM3E。通过将注意力机制固化于电路,实现8卡服务器运行Llama 70B吞吐量达H100的20倍,每美元性能为140倍。累计融资8亿美元,首批机柜今夏出货,直接挑战NVIDIA推理市场地位。

核心要点

Etched正式从隐身状态退出,宣布累计融资8亿美元,投后估值50亿美元,并签署超10亿美元客户需求合同。其首款产品SohuTransformer专用ASIC芯片,采用台积电N4P 4纳米工艺,搭载144GB HBM3E高带宽内存,首次流片即成功(A0 spin)。

Sohu芯片的设计核心是将Transformer注意力机制直接固化在芯片电路层面,与NVIDIA等通用GPU不同,分离权重读取与键值缓存读取路径,解决制约GPU吞吐量的内存带宽瓶颈及单令牌延迟问题。官方宣称8卡Sohu服务器运行Llama 70B模型吞吐量为H100的20倍,每美元性能为GPU的140倍。首批服务器机柜将于今夏出货。

投资者阵容极为豪华:天使投资人包括Geoffrey Hinton、李飞飞、Andrej Karpathy、Peter Thiel;机构投资者包括台积电关联基金VentureTech Alliance、Jane Street等顶级量化交易机构。Etched已组建400+人工程师团队,核心成员来自NVIDIA、谷歌TPU团队、博通、台积电。Etched的路线代表AI推理芯片的专用化趋势,与OpenAI Jalapeño(博通ASIC)、Qualcomm Dragonfly(HBC推理)形成三条推理专用化路线,正面对抗NVIDIA GPU在推理市场的垄断地位。

重要性说明

Etched的Sohu ASIC表面上是一次技术突破,本质上是一场精心策划的针对NVIDIA推理市场的合围。其核心战略是通过电路级固化Transformer注意力机制,将NVIDIA GPU的通用计算灵活性视为弱点,直接攻击其内存带宽瓶颈单令牌延迟。这实际上是在防守来自NVIDIA自身(如Blackwell架构改进)和博通等定制ASIC厂商的双重压力。

然而,Etched故意隐瞒了关键的物理限制和工程陷阱:第一,Sohu是Transformer专用,完全无法运行非Transformer架构(如Mamba、RWKV或未来新架构),一旦模型架构迭代,客户将面临资产彻底折旧的风险。第二,其144GB HBM3E容量远小于NVIDIA H100的80GB(单卡),但声称8卡跑Llama 70B,暗示其内存容量扩展性跨卡通信(如NVLink替代方案)可能是性能瓶颈。第三,首次流片成功(A0 spin) 在ASIC领域极为罕见,通常意味着功能验证极其保守,可能存在功耗或散热未达标的隐患。更关键的是,20倍吞吐量和140倍每美元性能的宣称未经任何第三方独立基准测试,这在量化交易机构主导的投资者阵容下尤为可疑,因为量化机构对延迟极度敏感,但公开基准测试通常仅关注吞吐量。

PRO 决策建议

【厂商】竞争对手(如NVIDIA、AMD、Broadcom)应立即采取以下进攻性动作:

  • NVIDIA应发布针对推理场景的专用推理芯片路线图(如Blackwell架构的推理优化),并公开对比Sohu在非Transformer模型上的性能缺陷,强调其生态锁定风险
  • Broadcom可联合OpenAI等客户,加速其Jalapeño ASIC的迭代,并强调多架构兼容性(如支持Mamba),以对冲Etched的单一架构风险。
  • 所有厂商应推动MLPerf Inference基准测试,要求Etched提交标准化结果,以暴露其性能宣称的水分。

【企业】CIO与架构师应执行以下零信任技术审计:

  • 要求Etched提供第三方独立基准测试(如MLPerf),并自行在非Transformer模型(如Mamba、RWKV)上运行PoC,验证其性能退化程度。
  • 评估跨卡通信方案:Sohu缺乏NVLink等效技术,需测试InfiniBand或RoCEv2下的尾部延迟可扩展性,确保生产环境可部署。
  • 签订合同时加入架构迭代保护条款,要求Etched在模型架构变化时提供硬件升级路径或补偿机制,避免资产锁定。

【投资者】资本市场应看穿以下公关辞令下的真实趋势:

  • Etched的高估值依赖未经验证的性能数据,且单一架构风险极高。投资者应关注客户集中度(如OpenAI是否真正采用),以及台积电产能分配是否优先于NVIDIA。
  • 量化交易机构的大额投资可能是对冲NVIDIA风险的金融操作,而非对Etched技术的长期信心。建议投资者等待第三方基准测试首批客户部署反馈后再做决策。

来源: TrendForce
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)