memory - AI基础设施情报搜索

MediaTek 其他 2026-06-18

苹果押注英特尔18A：代工生态重构与地缘政治保险

苹果与英特尔达成芯片代工合作，将使用英特尔最先进的**18A-P**（风险生产）及后续**14A**节点在美国本土生产芯片。此举既是对英特尔代工能力的最高认可，也是苹果应对台积电产能紧张（英伟达占据60% CoWoS产能）和台湾地缘政治风险的关键战略转移。

NVIDIA 其他 2026-06-18

AMD悄然移除消费级Ryzen TSME：安全功能分化锁定企业客户

AMD在未公开声明的情况下，从基于Zen 5的消费级Ryzen处理器中移除了Transparent Secure Memory Encryption (TSME)功能，仅保留给Ryzen PRO系列。该变化始于AGESA 1.2.7.0固件，用户难以在Windows上察觉，但Linux系统可检测到缺失。此举旨在通过安全功能差异化，推动企业用户转向更高价格的PRO产品线。

AMD 其他 2026-06-17

AMD Threadripper 'Mustang Peak' 曝光：144核、PCIe 6.0、新TR6插槽，但功耗内存瓶颈暗藏

AMD Zen 6 Threadripper Pro 'Mustang Peak' 确认采用2nm工艺、DDR5、PCIe 6.0及全新TR6插槽。基于Powderhorn CCD，核心数最高可达144核（288线程），频率超6GHz。但功耗巨大，内存带宽可能依赖MRDIMM，平台升级成本高昂。

NVIDIA 其他 2026-06-17

NVIDIA RTX Remix 1.5：用RTX IO压缩和AI Agent重塑游戏MOD生态，强化GPU锁定

NVIDIA发布RTX Remix 1.5更新，核心亮点是引入RTX IO技术，将《半条命2 RTX》文件大小从80GB压缩至50GB，并降低CPU开销。同时，新增AI Agent集成（RTX Remix Skills），允许AI编码代理自动执行复杂的MOD制作步骤，降低非程序员用户的入门门槛。

Google Cloud 其他 2026-06-17

AI Hits the Office - Mesoclever

AI Hits the Office Posted on June 17, 2026 by zar { "@context": "https://schema.org", "@type": "Article", "headline": "AI Hits the Off...

Google Cloud 其他 2026-06-17

Google Cloud 为 AI Agent 嵌入法律可验证身份，监管驱动架构重构

Google Cloud 为 Gemini Enterprise 和 Vertex AI Agent Engine 引入基于 SPIFFE 的 Agent Identity，并集成 Kakunin 的合规层，将内部 SPIFFE 标识映射为 AWS KMS 生成的 X.509 证书，所有状态变更写入 WORM 审计日志。此举将运行时安全升级为法律可审计的市场参与者身份，以应对 EU AI Act 和 MiCA 的问责要求。

Cisco 其他 2026-06-17

Cisco AI Defense推出Agent Harness专项红队测试，填补Agent安全评估空白

Cisco在AI Defense: Explorer Edition中引入Agent Validation功能，专门针对Agent Harness的独特攻击面（工具路由、间接内容通道、跨会话持久状态）进行自动化红队测试。该功能通过自主侦察、结构化攻击与独立验证，填补了传统对话式安全评估在Agent场景下的空白。

AMD 其他 2026-06-17

AMD MLPerf 6.0：MI350系列用MXFP4实现3.5倍代际提升，多节点训练首秀

AMD在MLPerf Training 6.0中提交了最全面的结果，包括首次多节点训练（FLUX.1在512 GPU上）和MXFP4训练配方。MI355X相比MI300X在Llama 2-70B上实现3.5倍性能提升，且与NVIDIA B200的差距缩小至5%以内。10家生态伙伴验证了可复现性。

NVIDIA 其他 2026-06-16

Lexar用SSD卸载AI模型：DRAM成本降低40%，但延迟问题未解

Lexar发布AI Storage Core SSD，通过自研SPU DRAM-less控制器和软件栈，将大语言模型卸载到NAND Flash，使Qwen 3.5 122B模型在32GB DRAM上运行，速度达15.6 tokens/s，相比传统方案提升3倍，但首次token延迟（TTFM）达2-8秒，限制了实时交互场景。

NVIDIA 其他 2026-06-16

NVIDIA Blackwell MLPerf六连冠：NVLink与NVFP4定义AI训练新范式

NVIDIA在MLPerf Training 6.0中凭借Blackwell平台全面领先，首次提交所有7个基准测试，包括MoE模型。GB300 NVL72比GB200快1.6x，通过第五代NVLink实现72 GPU一体化，NVFP4低精度训练提升性能。展示了从单机到8192 GPU集群的线性扩展能力。

MediaTek 其他 2026-06-16

HBM成AI新瓶颈：亚洲内存厂商夺回供应链控制权，Nvidia成本占比升至90%

SK Hynix、Samsung和Micron凭借HBM3E/HBM4的独家供应能力，市值突破万亿美元，而Nvidia的GPU生产成本中亚洲供应商占比升至90%。AI基础设施的真正瓶颈从GPU算力转向高带宽内存和先进封装。

AMD 其他 2026-06-16

AMD与Rackspace共建30MW受管AI算力：从硅层到结果的生态重构

AMD与Rackspace签署协议，分阶段部署30MW基于AMD Instinct GPU（MI355X等）和EPYC CPU的AI计算，构建面向受监管企业的“受管AI堆栈”，提供从裸金属到推理的单一责任方服务，旨在替代传统多厂商集成模式。

Google Cloud 其他 2026-06-16

Apple联手Google Gemini重塑Siri：AI模型外包，硬件支持大幅收缩

Apple宣布基于Google Gemini技术重建Siri，推出五个新AFM 3基础模型，其中20B参数多模态模型为最强端侧选项。同时watchOS 27仅支持S9/S10芯片，大幅削减旧设备支持，加速AI功能与硬件绑定，标志着生态位从完全自研转向混合合作。

NVIDIA 其他 2026-06-16

AMD Ryzen 10000系列拟弃集成GPU换NPU：AI性能跃升但牺牲基本显示能力

据泄漏，AMD下一代Zen 6桌面CPU“Olympic Ridge”将不再集成GPU，转而集成NPU以提升本地AI算力（目标>40 TOPS以满足Copilot+认证）。同时升级cIOD支持CUDIMM/CAMM内存与EXPO 1.2超频标准。此举意在追赶Intel DDR5速度并抢占AI PC生态位，但迫使绝大多数用户必须搭配独立显卡。

NVIDIA 其他 2026-06-16

ASML/TSMC/imec突破：300mm晶圆上集成2D材料晶体管，50nm节距创世界纪录

imec、ASML与TSMC联合展示首个300mm晶圆上基于MoS2/WS2/WSe2的n/pFETs，采用EUV单次光刻实现50nm接触多晶间距（CPP），94%良率。该成果是2D材料晶体管从实验室走向量产的关键里程碑，有望延续摩尔定律。

AMD 其他 2026-06-15

AMD收购MEXT：用AI预测让Flash逼近DRAM，降低AI内存TCO

AMD宣布收购AI内存优化初创公司MEXT，其核心技术利用AI预测模型使NAND Flash在延迟和吞吐量上逼近DRAM，旨在扩展AI服务器的有效内存容量，降低总拥有成本（TCO）。该技术将被整合进AMD数据中心全线产品，包括EPYC CPU和Instinct GPU，以应对大模型对内存的饥渴。

AMD 其他 2026-06-15

AMD通过Vultr开源AI软件组件，向NVIDIA CUDA生态发起生态重构挑战

AMD通过Vultr Marketplace发布开源、模块化的企业AI软件组件，包括AMD Inference Microservices (AIMs)、AI Workbench、Resource Manager和Solution Blueprints。该组合旨在提供生产级AI基础设施，避免单一厂商锁定，直接挑战NVIDIA的CUDA生态。

NVIDIA 其他 2026-06-15

NVIDIA力推World-Action模型：机器人控制权从语言转向视频基础模型

NVIDIA发表深度技术博客，提出World-Action Model（WAM）作为VLM-based VLA的替代路线。WAM利用预训练视频/世界模型骨干，同时预测未来状态和机器人动作，旨在克服VLA的语言-动作接地鸿沟。该范式可能重塑机器人基础模型训练格局，但面临推理成本和实时性挑战。

NVIDIA 其他 2026-06-15

NVIDIA携ASUS推桌面级DGX Station：GB300芯片下放，控制点从云转向本地硬件生态

ASUS发布ExpertCenter Pro ET900N G3，基于NVIDIA DGX Station GB300架构，搭载GB300 Grace Blackwell Ultra芯片，提供748GB统一内存和20 PFLOPS AI性能。该桌面级AI超算支持本地LLM微调、推理及AI agent工作负载，通过NVLink-C2C实现高速互连，并集成NVIDIA AI软件栈与NemoClaw框架。

Research 其他 2026-06-15

Z.ai GLM-5.2推可用1M Token上下文，无基准测试下挑战长文本推理极限

Z.ai发布GLM-5.2，宣称支持可用的1M token上下文窗口，并引入两种思考努力级别（Thinking-Effort Levels）。但未提供任何标准基准测试结果，引发对其实际性能与可用性的质疑。该模型旨在直接替代传统RAG分块检索流程，实现端到端长文本推理。

情报

筛选

苹果押注英特尔18A：代工生态重构与地缘政治保险

AMD悄然移除消费级Ryzen TSME：安全功能分化锁定企业客户

AMD Threadripper 'Mustang Peak' 曝光：144核、PCIe 6.0、新TR6插槽，但功耗内存瓶颈暗藏

NVIDIA RTX Remix 1.5：用RTX IO压缩和AI Agent重塑游戏MOD生态，强化GPU锁定

AI Hits the Office - Mesoclever

Google Cloud 为 AI Agent 嵌入法律可验证身份，监管驱动架构重构

Cisco AI Defense推出Agent Harness专项红队测试，填补Agent安全评估空白

AMD MLPerf 6.0：MI350系列用MXFP4实现3.5倍代际提升，多节点训练首秀

Lexar用SSD卸载AI模型：DRAM成本降低40%，但延迟问题未解

NVIDIA Blackwell MLPerf六连冠：NVLink与NVFP4定义AI训练新范式

HBM成AI新瓶颈：亚洲内存厂商夺回供应链控制权，Nvidia成本占比升至90%

AMD与Rackspace共建30MW受管AI算力：从硅层到结果的生态重构

Apple联手Google Gemini重塑Siri：AI模型外包，硬件支持大幅收缩

AMD Ryzen 10000系列拟弃集成GPU换NPU：AI性能跃升但牺牲基本显示能力

ASML/TSMC/imec突破：300mm晶圆上集成2D材料晶体管，50nm节距创世界纪录

AMD收购MEXT：用AI预测让Flash逼近DRAM，降低AI内存TCO

AMD通过Vultr开源AI软件组件，向NVIDIA CUDA生态发起生态重构挑战

NVIDIA力推World-Action模型：机器人控制权从语言转向视频基础模型

NVIDIA携ASUS推桌面级DGX Station：GB300芯片下放，控制点从云转向本地硬件生态

Z.ai GLM-5.2推可用1M Token上下文，无基准测试下挑战长文本推理极限