筛选

×
当前筛选 清除全部
关键词: LLM ×
136 情报总数
5/7 当前页
NVIDIA 其他 强信号 2026-04-15

英伟达推动AI基础设施评估指标从FLOPS转向每token成本

英伟达提出应将“每token成本”而非“每美元FLOPS”作为评估AI基础设施的核心经济指标。这标志着从衡量计算输入转向衡量商业输出,涉及硬件、软件、网络的全栈优化,以降低企业AI推理的总拥有成本。

NVIDIA 其他 中信号 2026-04-15

NVIDIA 发布多节点 GPU 互联性能基准测试工具 NVbandwidth

NVIDIA 在其开发者博客上正式发布 NVbandwidth 工具,这是一个基于 CUDA 的基准测试套件,用于测量单节点及多节点 GPU 系统内各种内存拷贝模式的带宽与延迟。该工具支持 NVLINK、PCIe 等多种互联拓扑,并集成 MPI 以支持跨节点集群的性能评估。

Cisco 产品发布 强信号 2026-04-15

Cisco RSA 2026发布Agentic Workforce安全三支柱方案

Cisco在RSA Conference 2026发布针对AI Agent工作力的三层安全架构:1) Zero Trust for AI Agents - 通过Duo IAM和MCP策略为每个Agent建立身份验证;2) AI Defense Explorer Edition - 动态红队测试工具,支持prompt injection和jailbreak攻击模拟;3) Splunk SOC升级 - Exposure Analytics、Detection Studio、Agentic SOC Expansion,包括Detection Builder Agent和Triage Agent等专用AI代理。同时推出DefenseClaw安全框架和LLM Security Leaderboard。

Cisco 其他 强信号 2026-04-14

思科阐述AI Agent框架如何重塑网络运维架构

思科通过博客详细阐述了AI Agentic框架在网络工程中的应用,提出从聊天机器人到多步工作流编排的演进路径。其核心在于将人类专业知识编码为‘技能’文件,通过MCP协议连接基础设施API,并在关键步骤设置人工审批点,实现从任务执行到流程编排的角色转变。

Cisco 其他 强信号 2026-04-11

思科分享企业AI助手实战模式,强调确定性安全与引导式交互

思科基于其客户体验部门AI助手的18个月实战经验,提炼出决定企业AI系统成败的非显性模式。核心包括:通过确定性代码而非LLM提示词执行RBAC、主动解决企业术语歧义、减少澄清式交互以提升效率,以及基于系统能力提供引导式后续问题。

NVIDIA 其他 强信号 2026-04-10

NVIDIA发布Slinky slurm-operator,在Kubernetes上融合HPC与AI调度

NVIDIA通过其收购的SchedMD,推出开源项目Slinky的slurm-operator,使HPC领域主流的Slurm作业调度系统能够以原生方式在Kubernetes上运行。该方案将Slurm组件容器化,通过CRD管理集群生命周期,实现了Slurm与Kubernetes生态在监控、自动扩缩容、节点维护及多节点NVLink拓扑感知等方面的双向状态同步。

Samsung Electronics 其他 强信号 2026-04-09

三星将Bixby重构为以LLM为核心的设备智能体

三星宣布其语音助手Bixby已完成架构重构,从基于命令的执行模式转变为以LLM为核心的智能体范式。新版Bixby能理解设备上下文与用户意图,自主调用设备功能与API执行复杂多步骤任务,并计划成为三星全系设备的统一交互入口。

Samsung Electronics 其他 强信号 2026-04-09

三星通过Android Enterprise将企业移动管理扩展至XR头显

三星为Galaxy XR发布关键软件更新,正式引入Android Enterprise支持,将企业级设备管理、安全框架和应用部署能力延伸至扩展现实(XR)设备。此举旨在为XR在企业的大规模、受控部署提供标准化基础,并承诺提供长达五年的软件和安全更新。

Cisco 其他 中信号 2026-04-08

思科与斑马技术深化集成:面向零售终端的网络与体验可见性

思科宣布其无线网络(Meraki)与ThousandEyes平台与斑马技术移动设备深度集成,将设备级遥测与端到端网络性能监控引入统一管理界面。此举旨在解决零售、仓储等边缘场景中移动设备连接问题的快速定位与排障,提升运营效率。

Microsoft 其他 强信号 2026-04-06

微软联合日本本土运营商构建主权AI基础设施

微软宣布未来四年在日投资100亿美元,核心是与日本樱花互联网和软银合作,通过Azure提供由本土运营商管理的GPU算力服务,确保数据驻留日本。此举旨在满足日本对数据主权和合规性要求严格的AI工作负载需求。

Anthropic 其他 强信号 2026-04-06

Anthropic与Mozilla合作,AI模型可独立发现Firefox高危漏洞

Anthropic宣布其Claude Opus 4.6模型在两周内为Mozilla Firefox发现了22个漏洞,其中14个被定为高危。这标志着AI模型已能独立识别复杂软件中的未知安全漏洞,并初步尝试生成漏洞利用,预示AI在网络安全攻防两端的能力均进入新阶段。

Google 其他 强信号 2026-04-03

谷歌发布Gemma 4开源模型,瞄准边缘推理与AI代理架构

谷歌推出Gemma 4开源模型家族,包含从2B到31B的四个版本,强调单位参数性能突破,并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化,旨在将前沿推理能力扩展至移动与IoT场景。

Google 其他 中信号 2026-04-03

Google发布Gemma 4开源模型系列

Google推出Gemma 4开源模型系列,包含四种规模变体,特别优化边缘计算和移动设备。该系列支持多模态处理、长上下文窗口和140多种语言,采用Apache 2.0许可。

AMD 其他 强信号 2026-04-02

AMD发布突破性MLPerf 6.0推理结果,展示多节点扩展与多模态能力

AMD在MLPerf Inference 6.0基准测试中,凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型(Wan-2.2-t2v)的快速启用,以及广泛的合作伙伴生态系统复现结果。

Intel 其他 中信号 2026-04-01

英特尔在MLPerf推理测试中展示Xeon 6与Arc Pro GPU的AI性能

英特尔在MLPerf Inference v6.0基准测试中展示了其Xeon 6 CPU和Arc Pro B系列GPU的性能,特别是在处理大型语言模型(LLM)时的表现。测试结果显示,配备四块Arc Pro B70 GPU的系统能够处理120B参数的模型,并在多GPU设置中提供高达1.8倍的推理性能提升。

Cisco 其他 中信号 2026-03-31

思科开源AI Agent安全治理工具DefenseClaw

思科推出开源工具DefenseClaw,为OpenClaw等AI Agent提供三层安全防护架构:供应链扫描、运行时检测和系统边界控制。该方案整合了NVIDIA的OpenShell沙箱技术,实现从安装到运行的全周期自动化安全治理。

Cisco 其他 中信号 2026-03-28

Cisco DevNet集成托管LLM访问降低AI安全实践门槛

Cisco在其DevNet Learning Labs平台推出托管LLM访问功能,通过LLM代理提供单一OpenAI兼容API端点,支持Azure OpenAI和AWS Bedrock等后端模型。该功能无需API密钥管理,预配置环境使学员可直接调用LLM进行AI安全工具实践,包括A2A协议安全、AI防御等工作流。

Cisco 其他 中信号 2026-03-25

思科联合英伟达验证私有AI基础设施快速微调能力

思科IT与英伟达合作,基于Nemotron RAG配方在单颗H200 GPU上实现2-5小时端到端嵌入模型微调。该方案通过120B参数本地LLM生成合成数据,无需人工标注,使NDCG@1指标提升7.3个绝对点。验证了企业私有AI基础设施快速优化领域知识检索的技术路径。

Cisco 其他 强信号 2026-03-25

思科通过LangChain中间件统一AI代理安全策略执行

思科发布AI Defense Runtime Protection与LangChain的集成方案,通过中间件提供监控与执行双模式,实现AI代理安全策略的统一执行。该方案生成包含决策、分类和请求ID的运行时合约,支持多种集成路径。思科计划将该集成贡献至LangChain上游并扩展至其他AI环境。

NVIDIA 其他 强信号 2026-03-24

NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区

NVIDIA将其GPU动态资源分配(DRA)驱动捐献给CNCF,使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区,并协同多家云厂商推动标准化。