筛选

×
当前筛选 清除全部
关键词: MIT ×
272 情报总数
1/14 当前页
NVIDIA 其他 2026-06-16

Lexar用SSD卸载AI模型:DRAM成本降低40%,但延迟问题未解

Lexar发布AI Storage Core SSD,通过自研SPU DRAM-less控制器和软件栈,将大语言模型卸载到NAND Flash,使Qwen 3.5 122B模型在32GB DRAM上运行,速度达15.6 tokens/s,相比传统方案提升3倍,但首次token延迟(TTFM)达2-8秒,限制了实时交互场景。

NVIDIA 其他 2026-06-16

NVIDIA Blackwell MLPerf六连冠:NVLink与NVFP4定义AI训练新范式

NVIDIA在MLPerf Training 6.0中凭借Blackwell平台全面领先,首次提交所有7个基准测试,包括MoE模型。GB300 NVL72比GB200快1.6x,通过第五代NVLink实现72 GPU一体化,NVFP4低精度训练提升性能。展示了从单机到8192 GPU集群的线性扩展能力。

MediaTek 其他 2026-06-16

HBM成AI新瓶颈:亚洲内存厂商夺回供应链控制权,Nvidia成本占比升至90%

SK Hynix、Samsung和Micron凭借HBM3E/HBM4的独家供应能力,市值突破万亿美元,而Nvidia的GPU生产成本中亚洲供应商占比升至90%。AI基础设施的真正瓶颈从GPU算力转向高带宽内存和先进封装。

AMD 其他 2026-06-16

AMD与Rackspace共建30MW受管AI算力:从硅层到结果的生态重构

AMD与Rackspace签署协议,分阶段部署30MW基于AMD Instinct GPU(MI355X等)和EPYC CPU的AI计算,构建面向受监管企业的“受管AI堆栈”,提供从裸金属到推理的单一责任方服务,旨在替代传统多厂商集成模式。

Microsoft 其他 2026-06-16

D-Wave双平台战略商业化加速:退火与门模型并行挑战IBM生态

D-Wave Q1订单暴增2000%至3340万美元,商业收入占比73%。公司同时推进退火和门模型两条路线,计划2032年实现100逻辑量子比特。CEO罕见呼吁行业摒弃炒作,聚焦客户与已发表结果。

CrowdStrike 其他 2026-06-16

CrowdStrike推出连续身份认证,重塑AI代理安全控制平面

CrowdStrike在Identiverse 2026发布Continuous Identity for AI Agents,作为Falcon Next-Gen Identity Security能力。基于SPIFFE标准实现可验证代理身份,通过实时风险信号动态授权,消除常驻权限,并与Falcon AIDR集成检测权限滥用,将身份安全控制平面从静态策略转向连续风险评估。

CrowdStrike 其他 2026-06-16

CrowdStrike用持续身份引擎控制AI代理:从静态策略到实时风险授权

CrowdStrike发布Continuous Identity for AI Agents,基于SPIFFE标准为AI代理提供加密验证身份,并通过Falcon平台实时评估所有者、调用者和设备风险,动态授予或撤销权限。该方案消除静态特权,结合AIDR检测权限滥用,将身份安全控制平面扩展到所有代理行为。

Cisco 其他 2026-06-16

Cisco安全组合全面迁入AWS Marketplace:生态绑定加速,多云中立性存疑

Cisco宣布将其全套SaaS安全产品(Duo、Secure Access、Identity Intelligence、Hybrid Mesh Firewall等)通过AWS Marketplace提供,并与Amazon Bedrock、SageMaker深度集成,强化AI安全与零信任代理管理。此举旨在简化采购、加速部署,但显著加深对AWS生态的依赖,可能牺牲多云灵活性。

Cloudflare 其他 2026-06-15

Cloudflare Announces Scheduled Maintenance and Global Infrastructure Expansion

...

Palo Alto Networks 其他 2026-06-15

Palo Alto GlobalProtect VPN遭主动利用:远程代码执行漏洞暴露企业网关防线脆弱性

Palo Alto Networks GlobalProtect VPN曝出严重漏洞,允许未认证攻击者远程执行任意代码,且已在野被主动利用。该漏洞直接威胁依赖VPN进行远程接入的企业网络边界,凸显了在混合办公模式下,VPN设备作为关键入口点的脆弱性。安全团队需立即修补并审查日志。

AMD 其他 2026-06-15

AMD收购MEXT:用AI预测让Flash逼近DRAM,降低AI内存TCO

AMD宣布收购AI内存优化初创公司MEXT,其核心技术利用AI预测模型使NAND Flash在延迟和吞吐量上逼近DRAM,旨在扩展AI服务器的有效内存容量,降低总拥有成本(TCO)。该技术将被整合进AMD数据中心全线产品,包括EPYC CPU和Instinct GPU,以应对大模型对内存的饥渴。

Research 其他 2026-06-15

Z.ai GLM-5.2推可用1M Token上下文,无基准测试下挑战长文本推理极限

Z.ai发布GLM-5.2,宣称支持可用的1M token上下文窗口,并引入两种思考努力级别(Thinking-Effort Levels)。但未提供任何标准基准测试结果,引发对其实际性能与可用性的质疑。该模型旨在直接替代传统RAG分块检索流程,实现端到端长文本推理。

Fortinet 其他 2026-06-15

DXC与Anthropic深度绑定:用Claude认证工程师军团锁定关键任务AI部署

DXC与Anthropic宣布多年全球合作,DXC成为Claude Partner Network全球顶级合作伙伴。双方将培训数万名Claude认证工程师,通过DXC OASIS平台在银行、保险、制造等关键任务环境中部署Claude模型,采用“Customer Zero”内部验证模式。

Cloudflare 其他 2026-06-15

Cloudflare吸纳Ensemble团队:架构级模型压缩重塑边缘推理经济

Cloudflare宣布吸纳Ensemble AI核心团队,引入其架构级模型压缩技术NdLinear和NdLinear-LoRA。该技术通过保留多维激活结构而非扁平化处理,直接减少Transformer模型的参数量和计算开销。此举旨在显著降低Workers AI平台的推理成本,提升GPU利用率,并加速全球边缘AI部署。

Anthropic 其他 2026-06-11

Anthropic借DXC锁定受监管行业:Claude认证工程师与OASIS平台成新控制点

Anthropic与DXC Technology达成全球联盟,DXC将培训数万名Claude认证的前沿部署工程师,并将Claude深度集成到其管理的银行、航空等关键系统中。DXC的AI原生平台OASIS已默认使用Claude,且95%以上代码由Claude生成,形成深度依赖。

Microsoft 其他 2026-06-11

微软联合NVIDIA推RTX Spark Arm AI芯片,Windows PC算力跨越1 Petaflop门槛

微软在Computex 2026宣布与NVIDIA、MediaTek合作推出RTX Spark Arm架构AI超级芯片,集成Blackwell RTX GPU和128GB统一内存,支持本地运行120B参数大模型。同时Intel Arc G3、高通Snapdragon X2系列齐发,Windows AI PC生态全面升级。

NVIDIA 其他 2026-06-11

NVIDIA借DiffusionGemma并行生成,将本地AI推理控制权锁定于自家GPU

NVIDIA优化Google DeepMind的DiffusionGemma开源模型,该模型通过并行生成256 tokens(非逐token)实现4倍加速。在H100上达1000 tokens/sec,DGX Spark上150 tokens/sec,完全本地运行,无云成本。此举强化了NVIDIA GPU在计算密集型本地AI推理中的核心地位。

NVIDIA 其他 2026-06-10

NVIDIA将BESS嵌入AI工厂电力架构:电力控制层从电网转向智能储能系统

NVIDIA通过DSX平台将电池储能系统(BESS)作为AI工厂电力架构的系统级组件,而非独立附加。BESS结合逆变器、实时遥测和动态控制,实现负载平滑、扰动穿越、加速互联,并定义自认证指南,推动电力基础设施从被动备用转向主动控制。

ARM 其他 2026-06-10

ARM以Neural Dawn演示移动神经图形:专用加速器将改写移动GPU架构

Arm联合Sumo Digital发布Neural Dawn,首款移动端支持Unreal Engine MegaLights的游戏。通过下一代Mali GPU内置神经加速器,实现桌面级实时光线追踪和动态照明,同时维持移动功耗预算。这标志着移动图形从传统渲染向AI原生管线的转折点。

Google 其他 2026-06-10

Google发布Lightning Engine:4.9x性能提升背后的生态锁定与架构隐忧

Google Cloud宣布Lightning Engine全面可用,基于开源Gluten和Velox实现向量化原生执行,声称性能提升4.9倍,价格性能比领先2倍。深度优化Cloud Storage和BigQuery连接器,但通过专有集成和premium tier强化生态锁定。