情报
AI 生成的结构化厂商动态简报
AMD MLPerf 6.0:MI350系列用MXFP4实现3.5倍代际提升,多节点训练首秀
AMD在MLPerf Training 6.0中提交了最全面的结果,包括首次多节点训练(FLUX.1在512 GPU上)和MXFP4训练配方。MI355X相比MI300X在Llama 2-70B上实现3.5倍性能提升,且与NVIDIA B200的差距缩小至5%以内。10家生态伙伴验证了可复现性。
Lexar用SSD卸载AI模型:DRAM成本降低40%,但延迟问题未解
Lexar发布AI Storage Core SSD,通过自研SPU DRAM-less控制器和软件栈,将大语言模型卸载到NAND Flash,使Qwen 3.5 122B模型在32GB DRAM上运行,速度达15.6 tokens/s,相比传统方案提升3倍,但首次token延迟(TTFM)达2-8秒,限制了实时交互场景。
NVIDIA Blackwell MLPerf六连冠:NVLink与NVFP4定义AI训练新范式
NVIDIA在MLPerf Training 6.0中凭借Blackwell平台全面领先,首次提交所有7个基准测试,包括MoE模型。GB300 NVL72比GB200快1.6x,通过第五代NVLink实现72 GPU一体化,NVFP4低精度训练提升性能。展示了从单机到8192 GPU集群的线性扩展能力。
HPE Nonstop集成Lusis TANGO AIF:将Agentic AI嵌入交易处理,锁定反欺诈控制权
HPE将Lusis TANGO AIF完全集成到Nonstop Compute平台,引入Random Forest与深度学习模型,实现实时、自适应的自主反欺诈操作,具备自愈基础设施和线性扩展能力,旨在替代传统规则引擎,提升交易处理智能化水平。
HBM成AI新瓶颈:亚洲内存厂商夺回供应链控制权,Nvidia成本占比升至90%
SK Hynix、Samsung和Micron凭借HBM3E/HBM4的独家供应能力,市值突破万亿美元,而Nvidia的GPU生产成本中亚洲供应商占比升至90%。AI基础设施的真正瓶颈从GPU算力转向高带宽内存和先进封装。
AMD与Rackspace共建30MW受管AI算力:从硅层到结果的生态重构
AMD与Rackspace签署协议,分阶段部署30MW基于AMD Instinct GPU(MI355X等)和EPYC CPU的AI计算,构建面向受监管企业的“受管AI堆栈”,提供从裸金属到推理的单一责任方服务,旨在替代传统多厂商集成模式。
D-Wave双平台战略商业化加速:退火与门模型并行挑战IBM生态
D-Wave Q1订单暴增2000%至3340万美元,商业收入占比73%。公司同时推进退火和门模型两条路线,计划2032年实现100逻辑量子比特。CEO罕见呼吁行业摒弃炒作,聚焦客户与已发表结果。
CrowdStrike推出连续身份认证,重塑AI代理安全控制平面
CrowdStrike在Identiverse 2026发布Continuous Identity for AI Agents,作为Falcon Next-Gen Identity Security能力。基于SPIFFE标准实现可验证代理身份,通过实时风险信号动态授权,消除常驻权限,并与Falcon AIDR集成检测权限滥用,将身份安全控制平面从静态策略转向连续风险评估。
CrowdStrike用持续身份引擎控制AI代理:从静态策略到实时风险授权
CrowdStrike发布Continuous Identity for AI Agents,基于SPIFFE标准为AI代理提供加密验证身份,并通过Falcon平台实时评估所有者、调用者和设备风险,动态授予或撤销权限。该方案消除静态特权,结合AIDR检测权限滥用,将身份安全控制平面扩展到所有代理行为。
Cisco安全组合全面迁入AWS Marketplace:生态绑定加速,多云中立性存疑
Cisco宣布将其全套SaaS安全产品(Duo、Secure Access、Identity Intelligence、Hybrid Mesh Firewall等)通过AWS Marketplace提供,并与Amazon Bedrock、SageMaker深度集成,强化AI安全与零信任代理管理。此举旨在简化采购、加速部署,但显著加深对AWS生态的依赖,可能牺牲多云灵活性。
Google is expanding Android parental controls
Breadcrumb ...
Cloudflare Announces Scheduled Maintenance and Global Infrastructure Expansion
...
Palo Alto GlobalProtect VPN遭主动利用:远程代码执行漏洞暴露企业网关防线脆弱性
Palo Alto Networks GlobalProtect VPN曝出严重漏洞,允许未认证攻击者远程执行任意代码,且已在野被主动利用。该漏洞直接威胁依赖VPN进行远程接入的企业网络边界,凸显了在混合办公模式下,VPN设备作为关键入口点的脆弱性。安全团队需立即修补并审查日志。
AMD收购MEXT:用AI预测让Flash逼近DRAM,降低AI内存TCO
AMD宣布收购AI内存优化初创公司MEXT,其核心技术利用AI预测模型使NAND Flash在延迟和吞吐量上逼近DRAM,旨在扩展AI服务器的有效内存容量,降低总拥有成本(TCO)。该技术将被整合进AMD数据中心全线产品,包括EPYC CPU和Instinct GPU,以应对大模型对内存的饥渴。
Z.ai GLM-5.2推可用1M Token上下文,无基准测试下挑战长文本推理极限
Z.ai发布GLM-5.2,宣称支持可用的1M token上下文窗口,并引入两种思考努力级别(Thinking-Effort Levels)。但未提供任何标准基准测试结果,引发对其实际性能与可用性的质疑。该模型旨在直接替代传统RAG分块检索流程,实现端到端长文本推理。
DXC与Anthropic深度绑定:用Claude认证工程师军团锁定关键任务AI部署
DXC与Anthropic宣布多年全球合作,DXC成为Claude Partner Network全球顶级合作伙伴。双方将培训数万名Claude认证工程师,通过DXC OASIS平台在银行、保险、制造等关键任务环境中部署Claude模型,采用“Customer Zero”内部验证模式。
Cloudflare吸纳Ensemble团队:架构级模型压缩重塑边缘推理经济
Cloudflare宣布吸纳Ensemble AI核心团队,引入其架构级模型压缩技术NdLinear和NdLinear-LoRA。该技术通过保留多维激活结构而非扁平化处理,直接减少Transformer模型的参数量和计算开销。此举旨在显著降低Workers AI平台的推理成本,提升GPU利用率,并加速全球边缘AI部署。
Anthropic借DXC锁定受监管行业:Claude认证工程师与OASIS平台成新控制点
Anthropic与DXC Technology达成全球联盟,DXC将培训数万名Claude认证的前沿部署工程师,并将Claude深度集成到其管理的银行、航空等关键系统中。DXC的AI原生平台OASIS已默认使用Claude,且95%以上代码由Claude生成,形成深度依赖。
微软联合NVIDIA推RTX Spark Arm AI芯片,Windows PC算力跨越1 Petaflop门槛
微软在Computex 2026宣布与NVIDIA、MediaTek合作推出RTX Spark Arm架构AI超级芯片,集成Blackwell RTX GPU和128GB统一内存,支持本地运行120B参数大模型。同时Intel Arc G3、高通Snapdragon X2系列齐发,Windows AI PC生态全面升级。
NVIDIA借DiffusionGemma并行生成,将本地AI推理控制权锁定于自家GPU
NVIDIA优化Google DeepMind的DiffusionGemma开源模型,该模型通过并行生成256 tokens(非逐token)实现4倍加速。在H100上达1000 tokens/sec,DGX Spark上150 tokens/sec,完全本地运行,无云成本。此举强化了NVIDIA GPU在计算密集型本地AI推理中的核心地位。