筛选

×
当前筛选 清除全部
关键词: LLM ×
136 情报总数
7/7 当前页
Amazon 其他 强信号 2026-02-28

AWS发布Inferentia2推理芯片优化生成式AI基础设施

亚马逊推出第二代AI推理芯片Inferentia2,专为Transformer模型设计,性能提升4倍并支持1750亿参数模型。该芯片集成于EC2 Inf2实例,通过UltraClusters架构支持大规模集群部署,提供比GPU实例高40%的性价比和低50%能耗。

Cisco 其他 强信号 2026-02-10

思科定义Agentic AI时代安全架构,扩展AI Defense与SASE能力

思科宣布其AI Defense解决方案的重大更新,新增AI供应链治理和运行时保护功能,以降低Agentic AI被篡改或操纵的风险。同时,思科SASE引入AI流量检测与优化能力,旨在保障Agentic工作流的安全性和可靠性。这些更新反映了思科在AI安全与网络架构融合方向上的战略布局。

Cisco 其他 强信号 2026-02-10

思科将AgenticOps确立为AI时代核心IT运营模型

思科宣布将AgenticOps运营模型扩展至全产品线,涵盖网络、安全和可观测性领域。该模型通过深度网络模型和跨域遥测数据,实现自主故障排查、持续优化和可信验证等智能执行能力。这是思科平台战略的关键演进,标志着其从传统运维向AI驱动的闭环操作系统的转型。

Cisco 其他 强信号 2026-02-10

思科发布G300芯片与系统,定位AI Agent时代数据中心网络基础

思科推出102.4Tbps的Silicon One G300交换芯片及配套N9000/8000系统,采用液冷设计提升70%能效,支持1.6T光学模块,并升级Nexus One统一管理平面。

OpenAI 其他 中信号 2026-02-05

OpenAI 将 GPT-5 与生物云自动化结合展示 AI 基础设施价值

OpenAI 展示了 GPT-5 与 Ginkgo Bioworks 的云自动化技术结合,在无细胞蛋白质合成实验中实现闭环实验,降低成本40%。这一合作凸显了大型语言模型在科学研发闭环中的基础设施潜力。

NVIDIA 其他 强信号 2026-01-23

NVIDIA 通过 NVFP4 量化与 TeaCache 技术将 FLUX.2 图像生成模型推理速度提升 10 倍

NVIDIA 与 Black Forest Labs 合作,针对 FLUX.2 [dev] 图像生成模型,在 Blackwell 数据中心 GPU 上应用了包括 NVFP4 4-bit 量化、Timestep Embedding Aware Caching (TeaCache)、CUDA Graphs 及多 GPU 支持在内的一系列推理优化技术。这些优化使模型在双 B200 GPU 配置下相比 H200 实现了 10.2 倍的延迟降低,并将内存占用减少超 40%,显著降低了高质量图像生成模型的部署门槛。

NVIDIA 其他 中信号 2026-01-09

NVIDIA发布AI商品目录蓝图,整合多模态模型与NIM部署

NVIDIA发布技术蓝图,演示如何组合其Nemotron LLM/VLM、FLUX图像生成与TRELLIS 3D模型,构建端到端的自动化商品目录增强系统。该系统通过模块化API和容器化部署,旨在将稀疏产品数据转化为本地化的富媒体内容。

Trend Micro 其他 强信号 2026-01-07

趋势科技揭示Docker Desktop WSL2新型虚拟机逃逸攻击面

趋势科技发现Docker Desktop在WSL2环境下的新型虚拟机逃逸技术,攻击者可利用暴露的内部API与配置机制,从容器环境突破至宿主机执行任意代码。这暴露了开发工具链中隐藏的严重安全边界风险。

NVIDIA 其他 强信号 2026-01-06

英伟达推出DGX Spark软件更新与NVFP4格式,强化本地AI开发

英伟达通过软件优化、新NVFP4数据格式及开源合作,大幅提升DGX Spark本地AI开发平台性能,并整合Brev云服务实现混合部署。此举将高性能AI模型运行从云端延伸至企业边缘和开发者桌面。

NVIDIA 其他 强信号 2025-11-08

NVIDIA发布开源数据科学代理原型,整合Nemotron LLM与CUDA-X加速库

NVIDIA在官方博客开源了一个交互式数据科学AI代理原型。该代理使用Nemotron Nano-9B-v2作为推理引擎,通过自然语言理解用户意图,并调用基于CUDA-X库(如cuDF、cuML)的GPU加速工具层,自动化执行数据清洗、模型训练与超参数优化等任务。其模块化架构旨在实现从自然语言到高性能计算的端到端加速,据称可获得3倍至43倍的性能提升。

NVIDIA 其他 中信号 2025-10-22

NVIDIA发布教程将轻量级LLM转化为终端AI代理

NVIDIA通过开发者博客发布教程,指导用户利用其开源的Nemotron Nano v2模型,在约200行Python代码内构建一个能理解自然语言并执行Bash命令的AI代理。该教程强调从零构建和利用LangGraph简化,核心在于实现安全的工具调用(Tool Calling)和人机回圈(Human-in-the-Loop)控制。

NVIDIA 其他 强信号 2025-10-21

英伟达发布IT工单分析AI智能体架构,强调图数据库与LLM结合

英伟达IT团队公开其内部AI智能体‘ITelligence’的架构细节,该系统结合NVIDIA Nemotron开源模型与图数据库,将非结构化工单数据转化为结构化洞察。其核心是批处理ETL、LLM驱动的根因分析、以及基于Grafana的可视化仪表板,而非RAG聊天机器人。

Trend Micro 其他 强信号 2025-09-08

趋势科技揭示Power Automate成为企业自动化安全盲点

趋势科技发布研究报告,指出微软Power Automate等低代码自动化工具的复杂性正被网络犯罪分子利用,用于规避检测和数据窃取。该研究揭示了自动化平台内部可见性不足的严重安全风险,并警告地下犯罪市场对此类攻击能力的需求正在增长。

Microsoft 其他 中信号 2025-02-27

微软推出Phi-4系列小语言模型,强化边缘AI与多模态推理能力

微软发布Phi-4系列小型语言模型(SLM),包括5.6B参数的Phi-4-multimodal模型,支持语音、视觉和文本的多模态处理。该系列已部署至Azure AI Foundry、HuggingFace和NVIDIA API Catalog,重点优化边缘设备上的AI推理能力。

Google 其他 强信号 2020-10-11

Google Cloud推出MCP与Apigee集成及Agentic Platform,推动企业API向AI Agent化演进

Google Cloud宣布Apigee Model Context Protocol (MCP)正式可用,并推出Agentic Platform,旨在将传统企业API转化为可被AI Agent安全、规模化调用的工具。此举结合了API治理、安全层与AI推理基础设施,为企业从API驱动转向Agent驱动架构提供了核心平台能力。

Trend Micro 其他 强信号 2020-06-01

趋势科技揭示Azure DNS设计缺陷暴露云基础设施接管风险

趋势科技旗下TrendAI™研究团队披露了Azure云平台中一个“设计使然”的安全漏洞。已删除的Azure资源其DNS记录可能被持久保留,攻击者可利用这些残留的DNS名称,接管受信任的端点并入侵依赖系统,揭示了云基础设施中一个关键但常被忽视的信任继承风险。