筛选

×
当前筛选 清除全部
关键词: open-source ×
46 情报总数
1/3 当前页
Google 其他 2026-06-16

Google开源Brazos液冷:风冷数据中心即插即用高密度冷却

Google发布Brazos模块化液冷系统,可在现有风冷数据中心中逐机架部署,支持60kW热负载。系统基于OCP ORv3标准,开源设计,降低液冷采纳门槛,无需大规模设施改造。

AMD 其他 2026-06-15

AMD通过Vultr开源AI软件组件,向NVIDIA CUDA生态发起生态重构挑战

AMD通过Vultr Marketplace发布开源、模块化的企业AI软件组件,包括AMD Inference Microservices (AIMs)、AI Workbench、Resource Manager和Solution Blueprints。该组合旨在提供生产级AI基础设施,避免单一厂商锁定,直接挑战NVIDIA的CUDA生态。

NVIDIA 其他 2026-06-15

NVIDIA携ASUS推桌面级DGX Station:GB300芯片下放,控制点从云转向本地硬件生态

ASUS发布ExpertCenter Pro ET900N G3,基于NVIDIA DGX Station GB300架构,搭载GB300 Grace Blackwell Ultra芯片,提供748GB统一内存和20 PFLOPS AI性能。该桌面级AI超算支持本地LLM微调、推理及AI agent工作负载,通过NVLink-C2C实现高速互连,并集成NVIDIA AI软件栈与NemoClaw框架。

Research 其他 2026-06-15

Z.ai GLM-5.2推可用1M Token上下文,无基准测试下挑战长文本推理极限

Z.ai发布GLM-5.2,宣称支持可用的1M token上下文窗口,并引入两种思考努力级别(Thinking-Effort Levels)。但未提供任何标准基准测试结果,引发对其实际性能与可用性的质疑。该模型旨在直接替代传统RAG分块检索流程,实现端到端长文本推理。

Cisco 其他 2026-06-11

思科AI Defense Policy Studio:用元提示将隐性策略转化为可审计护栏

思科推出AI Defense Policy Studio,通过一个AI助手引导策略所有者以对话方式定义自定义AI护栏。该工具使用元提示(meta-prompting)技术,将非正式指导转化为人类和模型可读的策略文档,并直接部署到思科AI Defense运行时进行执行。

Google 其他 2026-06-10

Google发布Lightning Engine:4.9x性能提升背后的生态锁定与架构隐忧

Google Cloud宣布Lightning Engine全面可用,基于开源Gluten和Velox实现向量化原生执行,声称性能提升4.9倍,价格性能比领先2倍。深度优化Cloud Storage和BigQuery连接器,但通过专有集成和premium tier强化生态锁定。

Google 其他 2026-06-09

GKE Inference Gateway前缀缓存:AI推理延迟降低92%,但锁定风险暗藏

Google Cloud推出GKE Inference Gateway,通过前缀缓存和模型感知路由,在Llama 3.1 8B模型上实现92.8%更短首令牌延迟和15.7%更高吞吐量。Snap实测缓存命中率达75-80%。但该技术深度绑定GKE Gateway API和Google生态,企业需警惕架构弹性损失。

Cloudflare 其他 2026-06-09

Cloudflare以自身为靶场,推AI时代分层防御架构:WAF+零信任+ML评分

Cloudflare公开其防御前沿AI模型的完整架构,以自身为“客户零号”,整合WAF Attack Score、API Shield、Bot Management、Zero Trust及MCP Server Portal。核心思路:架构比补丁速度更重要,通过ML评分和正面安全模型,在攻击变种产生前阻断,并限制单点突破后的横向移动半径。

Cloudflare 其他 2026-06-05

Cloudflare AI Gateway 引入身份驱动预算,争夺 AI 流量控制层

Cloudflare 在 AI Gateway 中推出基于美元预算的 spend limits 和与 Cloudflare Access 集成的身份驱动预算与路由(closed beta)。该功能允许企业按用户、团队、模型设置预算,并在超限时降级或阻断请求,将 AI 成本控制从模型提供商转移到网关层。

NVIDIA 其他 2026-06-04

NVIDIA Nemotron 3 Ultra:以MoE与MOPD重构AI Agent控制平面,锁定企业推理成本

NVIDIA发布**Nemotron 3 Ultra**,一个550B参数MoE模型(55B活跃),专为AI Agent编排而设计。通过**多教师在线策略蒸馏(MOPD)** 与**Hybrid Mamba-Transformer**架构,其在**SWE-bench**等任务中实现5倍吞吐量提升与30%成本节省,标志着推理控制权从单一模型向分层Agent系统的转移。

Cloudflare 其他 2026-06-04

Cloudflare收购VoidZero:以Vite整合控制开发者部署管道

Cloudflare收购开源JavaScript工具链公司VoidZero,将Vite、Rolldown、Oxc等Rust原生工具整合进Workers平台,实现从本地代码到全球边缘网络的一键部署。此举旨在统一开发全生命周期,并推动意图驱动的基础设施自动预配。

Microsoft 其他 2026-06-02

微软Build大会:从芯片到云构建Agent时代统一生态

微软在Build大会上发布一系列Agent时代基础设施:Project Solara芯片到云平台、Microsoft IQ统一知识层、Rayfin后端生成、Azure HorizonDB、GPU加速分析等,旨在将开发者锁定在微软生态内。

Google 其他 2026-06-02

Google 开源 gcs-analytics-core 库,以并行 I/O 和预取优化 Iceberg/Spark 性能

Google Cloud 推出 gcs-analytics-core 开源 Java 库,集成于 Iceberg 1.11.0+ 的 GCSFileIO,通过 Vectored I/O 和 Smart Parquet prefetching 减少扫描延迟。TPC-DS 测试显示扫描时间提升 18%-71%,但执行时间提升有限(大数据集仅 1.58%)。

Google 其他 2026-06-01

AlloyDB Remote MCP Server GA:Google Cloud以开放协议重塑AI代理数据访问生态

Google Cloud宣布AlloyDB Remote MCP Server正式GA,允许AI代理通过HTTP端点安全访问操作型数据。该服务基于开放MCP协议,提供IAM细粒度授权、Model Armor防护和审计日志,并集成AlloyDB的ScaNN向量索引(10亿+向量,6倍速度)与AI函数,旨在成为企业AI代理的单一数据源。

NVIDIA 其他 2026-06-01

NVIDIA Cosmos 3开源统一物理AI模型,以MoT架构合围GPU生态

NVIDIA发布Cosmos 3,基于Mixture-of-Transformers双塔架构统一物理推理、世界生成与动作生成。开源模型权重、训练脚本和六个合成数据集,但部署优化深度绑定NVIDIA NIM微服务与GPU,意图将物理AI开发生态锁定在其硬件和软件栈上。

NVIDIA 其他 2026-06-01

NVIDIA DSX OS:以开源软件夺取AI工厂控制平面,锁定生态

NVIDIA发布DSX OS,一套开源模块化软件,用于运营AI工厂。包含DSX Exchange、MaxLPS、NICo、NVSentinel等组件,统一IT/OT通信、电源优化、生命周期管理。声称可在固定功率下多运行40% GPU,但核心依赖NVIDIA专有硬件,旨在锁定用户至其生态。

Google 其他 2026-05-18

Google Cloud推MCP托管服务:将AI数据层控制点从SQL转向标准化协议

Google Cloud发布Managed MCP Tools,通过Model Context Protocol标准化AI与BigQuery等数据源的交互。文章提出五个演进场景,从静态API到MCP代理,强调MCP作为开放标准可解耦推理层与数据层,但托管实现深度绑定BigQuery生态。

Cloudflare 其他 2026-05-18

Cloudflare实测Anthropic Mythos:AI漏洞链构建与自动验证突破

Cloudflare在Project Glasswing中测试了Anthropic的Mythos Preview模型,发现其能自动将多个低严重性漏洞链成可利用的PoC,并生成可运行的代码。同时,他们构建了多阶段harness以解决噪声和上下文限制,显著提升漏洞发现质量。

Cisco 其他 强信号 2026-05-05

思科发布Nexus Dashboard 4.2,强化AI工作负载的网络监控与安全

思科发布数据中心管理平台Nexus Dashboard 4.2,核心升级包括集成Slurm进行AI/HPC作业监控、通过LLDP与NVIDIA网卡联动实现自适应路由,以及推出基于eBPF的零停机漏洞防护功能Live Protect。该版本旨在为混合云和AI基础设施提供统一、智能且安全的运营平面。

Microsoft 其他 强信号 2026-05-01

微软发布AI时代网络安全责任框架,强调公私协作与漏洞管理现代化

微软发布了一份关于利用下一代AI加强全球数字生态安全的框架性文件,核心观点是AI加速漏洞发现的同时,必须同步强化响应与修复能力。文件提出了五项具体建议,强调公私协作、负责任的AI能力发布以及现代化漏洞管理流程。