筛选

×
当前筛选 清除全部
关键词: Frontier ×
111 情报总数
2/6 当前页
AMD 其他 2026-06-15

AMD收购MEXT:用AI预测让Flash逼近DRAM,降低AI内存TCO

AMD宣布收购AI内存优化初创公司MEXT,其核心技术利用AI预测模型使NAND Flash在延迟和吞吐量上逼近DRAM,旨在扩展AI服务器的有效内存容量,降低总拥有成本(TCO)。该技术将被整合进AMD数据中心全线产品,包括EPYC CPU和Instinct GPU,以应对大模型对内存的饥渴。

AMD 其他 2026-06-15

AMD通过Vultr开源AI软件组件,向NVIDIA CUDA生态发起生态重构挑战

AMD通过Vultr Marketplace发布开源、模块化的企业AI软件组件,包括AMD Inference Microservices (AIMs)、AI Workbench、Resource Manager和Solution Blueprints。该组合旨在提供生产级AI基础设施,避免单一厂商锁定,直接挑战NVIDIA的CUDA生态。

NVIDIA 其他 2026-06-15

NVIDIA力推World-Action模型:机器人控制权从语言转向视频基础模型

NVIDIA发表深度技术博客,提出World-Action Model(WAM)作为VLM-based VLA的替代路线。WAM利用预训练视频/世界模型骨干,同时预测未来状态和机器人动作,旨在克服VLA的语言-动作接地鸿沟。该范式可能重塑机器人基础模型训练格局,但面临推理成本和实时性挑战。

MediaTek 其他 2026-06-15

Carmen Li推动GPU期货市场:算力金融化将颠覆AI基础设施采购模式

Carmen Li通过Silicon Data和Compute Exchange构建GPU价格指数和现货市场,目标推出计算期货。该计划获DRW支持,旨在解决GPU价格波动,标准化算力交易,可能创造万亿美元级新资产类别,彻底改变AI算力的定价与分配机制。

Cloudflare 其他 2026-06-15

Cloudflare吸纳Ensemble团队:架构级模型压缩重塑边缘推理经济

Cloudflare宣布吸纳Ensemble AI核心团队,引入其架构级模型压缩技术NdLinear和NdLinear-LoRA。该技术通过保留多维激活结构而非扁平化处理,直接减少Transformer模型的参数量和计算开销。此举旨在显著降低Workers AI平台的推理成本,提升GPU利用率,并加速全球边缘AI部署。

NVIDIA 其他 2026-06-13

NVIDIA GB300 NVL72在Agentic AI基准测试中实现20倍能效跃升,定义新推理标准

NVIDIA在第三方AA-AgentPerf基准测试中,凭借GB300 NVL72的72 GPU NVLink域、MXFP4/MXFP8内核及MoE优化,实现每兆瓦并发agent数达H200的20倍。该基准首次标准化agentic推理性能度量,直接冲击数据中心容量规划。

NVIDIA 其他 2026-06-13

NVIDIA推AgentPerf基准测试:Blackwell Ultra每瓦代理数较Hopper提升20倍

NVIDIA与Artificial Analysis联合发布首个Agentic AI基准测试AgentPerf,结果显示GB300 NVL72平台在运行DeepSeek V4 Pro等MoE模型时,每兆瓦可承载的并发代理数较HGX H200提升20倍。该基准模拟真实编码代理轨迹,测量端到端吞吐与响应延迟。

Cisco 其他 2026-06-11

思科AI Defense Policy Studio:用元提示将隐性策略转化为可审计护栏

思科推出AI Defense Policy Studio,通过一个AI助手引导策略所有者以对话方式定义自定义AI护栏。该工具使用元提示(meta-prompting)技术,将非正式指导转化为人类和模型可读的策略文档,并直接部署到思科AI Defense运行时进行执行。

Microsoft 其他 2026-06-11

微软联合NVIDIA推RTX Spark Arm AI芯片,Windows PC算力跨越1 Petaflop门槛

微软在Computex 2026宣布与NVIDIA、MediaTek合作推出RTX Spark Arm架构AI超级芯片,集成Blackwell RTX GPU和128GB统一内存,支持本地运行120B参数大模型。同时Intel Arc G3、高通Snapdragon X2系列齐发,Windows AI PC生态全面升级。

NVIDIA 其他 2026-06-11

NVIDIA联手Google DeepMind推出并行文本生成模型,吞吐量突破1000 tokens/sec

NVIDIA宣布与Google DeepMind合作优化DiffusionGemma,该模型基于扩散去噪实现每步并行生成256个token,在单个H100上达到1000 tokens/sec,并通过NIM和NeMo提供即用部署,显著降低推理成本和延迟。

NVIDIA 其他 2026-06-11

NVIDIA借DiffusionGemma并行生成,将本地AI推理控制权锁定于自家GPU

NVIDIA优化Google DeepMind的DiffusionGemma开源模型,该模型通过并行生成256 tokens(非逐token)实现4倍加速。在H100上达1000 tokens/sec,DGX Spark上150 tokens/sec,完全本地运行,无云成本。此举强化了NVIDIA GPU在计算密集型本地AI推理中的核心地位。

Google 其他 2026-06-10

Google发布Lightning Engine:4.9x性能提升背后的生态锁定与架构隐忧

Google Cloud宣布Lightning Engine全面可用,基于开源Gluten和Velox实现向量化原生执行,声称性能提升4.9倍,价格性能比领先2倍。深度优化Cloud Storage和BigQuery连接器,但通过专有集成和premium tier强化生态锁定。

Microsoft 其他 2026-06-09

微软借KPMG全球部署Agent 365,锁定企业AI代理管理控制平面

KPMG宣布全球采用Microsoft Agent 365管理AI代理,并扩展Copilot部署。Agent 365成为KPMG Workbench的核心治理层,协调跨系统、数据与业务流程的AI代理。此举将微软的AI管理平台深度嵌入全球最大咨询公司的交付体系,形成对企业AI代理生命周期的集中控制。

NVIDIA 其他 2026-06-09

NVIDIA NVFP4:原生4位训练实现1.73倍吞吐跃升,锁定Blackwell生态

NVIDIA发布NVFP4格式,利用Blackwell原生硬件支持,在JAX/MaxText中实现4位混合精度预训练。相比FP8基线,Llama 3.1 405B在GB300上获得1.73倍吞吐提升,且精度无损失。该技术通过微块缩放、随机哈达玛变换等创新,显著降低训练成本,但深度绑定NVIDIA硬件生态。

Cloudflare 其他 2026-06-09

Cloudflare以自身为靶场,推AI时代分层防御架构:WAF+零信任+ML评分

Cloudflare公开其防御前沿AI模型的完整架构,以自身为“客户零号”,整合WAF Attack Score、API Shield、Bot Management、Zero Trust及MCP Server Portal。核心思路:架构比补丁速度更重要,通过ML评分和正面安全模型,在攻击变种产生前阻断,并限制单点突破后的横向移动半径。

NVIDIA 其他 2026-06-08

NVIDIA 借英国主权AI基金,从芯片商跃升为国家AI基础设施的幕后控制者

NVIDIA 与英国政府合作,通过 Isambard-AI(搭载 5,400 颗 GH200)及 Sovereign AI Fund,扶持本地初创(Cosine, Cursive, Doubleword)。此举表面是技术部署,实则是 NVIDIA 构建主权AI控制平面,将国家算力锁入其生态系统,削弱AWS/Azure等传统云厂商的地位。

Cloudflare 其他 2026-06-05

Cloudflare AI Gateway 引入身份驱动预算,争夺 AI 流量控制层

Cloudflare 在 AI Gateway 中推出基于美元预算的 spend limits 和与 Cloudflare Access 集成的身份驱动预算与路由(closed beta)。该功能允许企业按用户、团队、模型设置预算,并在超限时降级或阻断请求,将 AI 成本控制从模型提供商转移到网关层。

NVIDIA 其他 2026-06-04

NVIDIA Nemotron 3 Ultra:以MoE与MOPD重构AI Agent控制平面,锁定企业推理成本

NVIDIA发布**Nemotron 3 Ultra**,一个550B参数MoE模型(55B活跃),专为AI Agent编排而设计。通过**多教师在线策略蒸馏(MOPD)** 与**Hybrid Mamba-Transformer**架构,其在**SWE-bench**等任务中实现5倍吞吐量提升与30%成本节省,标志着推理控制权从单一模型向分层Agent系统的转移。

Cisco 其他 2026-06-03

思科将OT安全控制点嵌入交换机ASIC:从可见性到执行的闭环锁定

思科在Cisco Live 2026发布Cyber Vision新功能,将安全策略自动推荐、模拟与执行直接集成到IE3500/IE9300工业交换机的自有ASIC中,并嵌入零信任远程访问。此举将OT安全从独立设备转移到网络基础设施内部,实现从可见性到预防的闭环,但旨在深度锁定用户于Cisco全栈。

Microsoft 其他 2026-06-02

微软Build大会:从芯片到云构建Agent时代统一生态

微软在Build大会上发布一系列Agent时代基础设施:Project Solara芯片到云平台、Microsoft IQ统一知识层、Rayfin后端生成、Azure HorizonDB、GPU加速分析等,旨在将开发者锁定在微软生态内。