情报
AI 生成的结构化厂商动态简报
苹果押注英特尔18A:代工生态重构与地缘政治保险
苹果与英特尔达成芯片代工合作,将使用英特尔最先进的**18A-P**(风险生产)及后续**14A**节点在美国本土生产芯片。此举既是对英特尔代工能力的最高认可,也是苹果应对台积电产能紧张(英伟达占据60% CoWoS产能)和台湾地缘政治风险的关键战略转移。
AMD悄然移除消费级Ryzen TSME:安全功能分化锁定企业客户
AMD在未公开声明的情况下,从基于Zen 5的消费级Ryzen处理器中移除了Transparent Secure Memory Encryption (TSME)功能,仅保留给Ryzen PRO系列。该变化始于AGESA 1.2.7.0固件,用户难以在Windows上察觉,但Linux系统可检测到缺失。此举旨在通过安全功能差异化,推动企业用户转向更高价格的PRO产品线。
AMD Threadripper 'Mustang Peak' 曝光:144核、PCIe 6.0、新TR6插槽,但功耗内存瓶颈暗藏
AMD Zen 6 Threadripper Pro 'Mustang Peak' 确认采用2nm工艺、DDR5、PCIe 6.0及全新TR6插槽。基于Powderhorn CCD,核心数最高可达144核(288线程),频率超6GHz。但功耗巨大,内存带宽可能依赖MRDIMM,平台升级成本高昂。
NVIDIA RTX Remix 1.5:用RTX IO压缩和AI Agent重塑游戏MOD生态,强化GPU锁定
NVIDIA发布RTX Remix 1.5更新,核心亮点是引入RTX IO技术,将《半条命2 RTX》文件大小从80GB压缩至50GB,并降低CPU开销。同时,新增AI Agent集成(RTX Remix Skills),允许AI编码代理自动执行复杂的MOD制作步骤,降低非程序员用户的入门门槛。
AI Hits the Office - Mesoclever
AI Hits the Office Posted on June 17, 2026 by zar { "@context": "https://schema.org", "@type": "Article", "headline": "AI Hits the Off...
Google Cloud 为 AI Agent 嵌入法律可验证身份,监管驱动架构重构
Google Cloud 为 Gemini Enterprise 和 Vertex AI Agent Engine 引入基于 SPIFFE 的 Agent Identity,并集成 Kakunin 的合规层,将内部 SPIFFE 标识映射为 AWS KMS 生成的 X.509 证书,所有状态变更写入 WORM 审计日志。此举将运行时安全升级为法律可审计的市场参与者身份,以应对 EU AI Act 和 MiCA 的问责要求。
Cisco AI Defense推出Agent Harness专项红队测试,填补Agent安全评估空白
Cisco在AI Defense: Explorer Edition中引入Agent Validation功能,专门针对Agent Harness的独特攻击面(工具路由、间接内容通道、跨会话持久状态)进行自动化红队测试。该功能通过自主侦察、结构化攻击与独立验证,填补了传统对话式安全评估在Agent场景下的空白。
AMD MLPerf 6.0:MI350系列用MXFP4实现3.5倍代际提升,多节点训练首秀
AMD在MLPerf Training 6.0中提交了最全面的结果,包括首次多节点训练(FLUX.1在512 GPU上)和MXFP4训练配方。MI355X相比MI300X在Llama 2-70B上实现3.5倍性能提升,且与NVIDIA B200的差距缩小至5%以内。10家生态伙伴验证了可复现性。
Lexar用SSD卸载AI模型:DRAM成本降低40%,但延迟问题未解
Lexar发布AI Storage Core SSD,通过自研SPU DRAM-less控制器和软件栈,将大语言模型卸载到NAND Flash,使Qwen 3.5 122B模型在32GB DRAM上运行,速度达15.6 tokens/s,相比传统方案提升3倍,但首次token延迟(TTFM)达2-8秒,限制了实时交互场景。
NVIDIA Blackwell MLPerf六连冠:NVLink与NVFP4定义AI训练新范式
NVIDIA在MLPerf Training 6.0中凭借Blackwell平台全面领先,首次提交所有7个基准测试,包括MoE模型。GB300 NVL72比GB200快1.6x,通过第五代NVLink实现72 GPU一体化,NVFP4低精度训练提升性能。展示了从单机到8192 GPU集群的线性扩展能力。
HBM成AI新瓶颈:亚洲内存厂商夺回供应链控制权,Nvidia成本占比升至90%
SK Hynix、Samsung和Micron凭借HBM3E/HBM4的独家供应能力,市值突破万亿美元,而Nvidia的GPU生产成本中亚洲供应商占比升至90%。AI基础设施的真正瓶颈从GPU算力转向高带宽内存和先进封装。
AMD与Rackspace共建30MW受管AI算力:从硅层到结果的生态重构
AMD与Rackspace签署协议,分阶段部署30MW基于AMD Instinct GPU(MI355X等)和EPYC CPU的AI计算,构建面向受监管企业的“受管AI堆栈”,提供从裸金属到推理的单一责任方服务,旨在替代传统多厂商集成模式。
Apple联手Google Gemini重塑Siri:AI模型外包,硬件支持大幅收缩
Apple宣布基于Google Gemini技术重建Siri,推出五个新AFM 3基础模型,其中20B参数多模态模型为最强端侧选项。同时watchOS 27仅支持S9/S10芯片,大幅削减旧设备支持,加速AI功能与硬件绑定,标志着生态位从完全自研转向混合合作。
AMD Ryzen 10000系列拟弃集成GPU换NPU:AI性能跃升但牺牲基本显示能力
据泄漏,AMD下一代Zen 6桌面CPU“Olympic Ridge”将不再集成GPU,转而集成NPU以提升本地AI算力(目标>40 TOPS以满足Copilot+认证)。同时升级cIOD支持CUDIMM/CAMM内存与EXPO 1.2超频标准。此举意在追赶Intel DDR5速度并抢占AI PC生态位,但迫使绝大多数用户必须搭配独立显卡。
ASML/TSMC/imec突破:300mm晶圆上集成2D材料晶体管,50nm节距创世界纪录
imec、ASML与TSMC联合展示首个300mm晶圆上基于MoS2/WS2/WSe2的n/pFETs,采用EUV单次光刻实现50nm接触多晶间距(CPP),94%良率。该成果是2D材料晶体管从实验室走向量产的关键里程碑,有望延续摩尔定律。
AMD收购MEXT:用AI预测让Flash逼近DRAM,降低AI内存TCO
AMD宣布收购AI内存优化初创公司MEXT,其核心技术利用AI预测模型使NAND Flash在延迟和吞吐量上逼近DRAM,旨在扩展AI服务器的有效内存容量,降低总拥有成本(TCO)。该技术将被整合进AMD数据中心全线产品,包括EPYC CPU和Instinct GPU,以应对大模型对内存的饥渴。
AMD通过Vultr开源AI软件组件,向NVIDIA CUDA生态发起生态重构挑战
AMD通过Vultr Marketplace发布开源、模块化的企业AI软件组件,包括AMD Inference Microservices (AIMs)、AI Workbench、Resource Manager和Solution Blueprints。该组合旨在提供生产级AI基础设施,避免单一厂商锁定,直接挑战NVIDIA的CUDA生态。
NVIDIA力推World-Action模型:机器人控制权从语言转向视频基础模型
NVIDIA发表深度技术博客,提出World-Action Model(WAM)作为VLM-based VLA的替代路线。WAM利用预训练视频/世界模型骨干,同时预测未来状态和机器人动作,旨在克服VLA的语言-动作接地鸿沟。该范式可能重塑机器人基础模型训练格局,但面临推理成本和实时性挑战。
NVIDIA携ASUS推桌面级DGX Station:GB300芯片下放,控制点从云转向本地硬件生态
ASUS发布ExpertCenter Pro ET900N G3,基于NVIDIA DGX Station GB300架构,搭载GB300 Grace Blackwell Ultra芯片,提供748GB统一内存和20 PFLOPS AI性能。该桌面级AI超算支持本地LLM微调、推理及AI agent工作负载,通过NVLink-C2C实现高速互连,并集成NVIDIA AI软件栈与NemoClaw框架。
Z.ai GLM-5.2推可用1M Token上下文,无基准测试下挑战长文本推理极限
Z.ai发布GLM-5.2,宣称支持可用的1M token上下文窗口,并引入两种思考努力级别(Thinking-Effort Levels)。但未提供任何标准基准测试结果,引发对其实际性能与可用性的质疑。该模型旨在直接替代传统RAG分块检索流程,实现端到端长文本推理。