筛选

×
当前筛选 清除全部
关键词: TPU ×
122 情报总数
1/7 当前页
Google 其他 强信号 2026-06-02

谷歌发布GCS MCP服务器,将非结构化数据无缝接入AI代理工作流

谷歌推出Google Cloud Storage (GCS) MCP服务器,支持远程托管和本地开源两种模式。该服务器基于Model Context Protocol (MCP)标准,旨在将存储在GCS中的非结构化数据(如文档、日志)直接转化为AI代理可用的上下文,并内置IAM、审计日志和Model Armor等企业级安全控制。

Google 其他 强信号 2026-06-02

Google Cloud 集成 GKE 多集群推理网关与托管 DRANET,定义 AI 服务网格新范式

Google Cloud 通过博客和代码实验室展示了一项实验:将 TPU v6e、GKE 托管 DRANET(动态资源分配网络)、多集群 GKE Inference Gateway 与 Cloud Storage FUSE 集成,构建跨区域、高可用的 AI 推理服务。该架构利用 Fleet 统一管理集群,并通过声明式策略实现基于硬件指标(如 KV cache 使用率)的智能流量路由与故障转移。

ARM 其他 强信号 2026-06-02

Oracle Cloud加入Arm AGI CPU生态,Arm架构加速夺取AI基础设施控制层

Oracle Cloud Infrastructure宣布加入Arm AGI CPU生态系统,将基于Arm架构的优化CPU引入其云平台以支持Agentic AI工作负载。这一动作进一步验证了Arm Neoverse平台在云数据中心,特别是AI基础设施中替代传统x86架构的趋势。

Amazon 其他 强信号 2026-06-02

AWS通过Bedrock集成OpenAI GPT-5.5与Codex,重塑AI模型分发控制点

AWS宣布在Amazon Bedrock平台上全面开放OpenAI的GPT-5.5、GPT-5.4模型及Codex编码代理的访问。企业可通过Bedrock的下一代推理引擎与统一的Responses API调用这些前沿模型,同时满足数据驻留要求并按Token付费。此举将OpenAI的模型能力深度嵌入AWS的AI基础设施层。

Cisco 其他 强信号 2026-06-01

思科将SSE与企业浏览器深度集成,推动零信任向数据使用层延伸

思科将其云交付的Security Service Edge (SSE)平台Cisco Secure Access与Island Enterprise Browser深度集成。该方案旨在为未托管设备提供安全应用访问,将零信任策略执行点从网络访问层延伸至浏览器内的用户会话,实现对数据复制、粘贴等操作的原生控制。

NVIDIA 其他 强信号 2026-06-01

NVIDIA借DSX平台与全球伙伴构建全栈AI云生态,定义AI工厂经济性

NVIDIA正通过其DSX平台与全球云伙伴(如CoreWeave、Firmus、Nebius)深度合作,共同构建由NVIDIA全栈技术定义的‘AI Cloud’生态系统。该生态旨在将‘AI工厂’基础设施贴近数据与用户,并引入‘每Token成本’作为核心经济性指标,以优化从训练、推理到智能体(agentic AI)的全周期工作负载。

NVIDIA 其他 强信号 2026-06-01

NVIDIA发布Vera CPU,为AI代理工作负载定义新设计标准

NVIDIA推出基于自研Olympus核心的Vera CPU,针对AI代理和强化学习工作负载中的‘工具调用-执行’循环进行架构优化。该CPU通过高单核性能、高并发及高效LPDDR5X内存子系统,旨在提升AI工厂中CPU关键路径的性能,从而增加整体AI输出吞吐量和能效。

NVIDIA 其他 强信号 2026-05-30

NVIDIA 发布 DynoSim 仿真框架,将 AI 服务栈优化从硬件试错转向模拟优先

NVIDIA 推出 DynoSim,这是一个基于 Rust 的、全栈离散事件仿真框架,用于对 NVIDIA Dynamo AI 服务栈进行原子级模拟。它通过虚拟时钟和组件化事件队列,将配置搜索和算法研究从昂贵的 GPU 硬件实验转变为快速模拟验证循环,旨在高效探索服务部署的帕累托前沿。

NVIDIA 其他 强信号 2026-05-30

NVIDIA 发布容器化 AI 模型文档自动生成工具包,集成 RAG 与 NIM 应对监管

NVIDIA 推出 Model Card Generator (MCG) 工具包,一个容器化流水线,可在一分钟内自动从源代码生成符合 Model Card++ 标准的 AI 模型文档。该工具利用 NVIDIA Nemotron RAG 进行高精度信息检索,并由大语言模型(如 GPT-OSS-120B)提取和格式化内容,旨在应对欧盟 AI 法案等法规要求。

NVIDIA 其他 强信号 2026-05-29

NVIDIA将Step 3.7 Flash多模态模型深度整合至其企业AI全栈

NVIDIA宣布在其加速平台上全面支持StepFun的Step 3.7 Flash模型,这是一个1980亿参数的MoE多模态模型。通过TensorRT-LLM、vLLM进行优化推理,并通过NVIDIA NIM提供生产就绪的容器化微服务部署,同时支持基于NeMo框架的Day 0微调。

Anthropic 其他 强信号 2026-05-29

Anthropic完成650亿美元H轮融资,估值逼近万亿并锁定海量算力

Anthropic宣布完成650亿美元H轮融资,投后估值达9650亿美元。资金将用于安全研究、扩展算力以满足Claude需求,并深化与亚马逊、谷歌、SpaceX等基础设施伙伴的合作,锁定高达10吉瓦的下一代TPU和GPU产能。

Anthropic 其他 强信号 2026-05-28

Anthropic发布Claude Opus 4.8,以诚实度与代理可靠性重塑企业AI协作模式

Anthropic推出Claude Opus 4.8模型,核心提升在于代理任务(agentic tasks)的端到端可靠性、诚实度及判断力。同步引入‘动态工作流’功能,支持单会话内运行数百并行子代理处理超大规模任务,并提供用户可调的‘努力程度控制’,实现速度、成本与输出质量的精细权衡。

NVIDIA 其他 强信号 2026-05-27

NVIDIA CUDA 13.3为C++引入Tile编程模型,抽象GPU并行与内存管理

NVIDIA在CUDA 13.3中为C++添加了CUDA Tile编程模型支持,允许开发者在现有C++代码库中使用基于tile的抽象编写GPU内核。该模型通过tensor_span和partition_view操作固定大小的数组块,自动处理块内并行性、内存移动和硬件特性利用,无需显式线程管理,并支持Nsight Compute性能剖析。

NVIDIA 其他 强信号 2026-05-27

NVIDIA CUDA 13.3 通过 Tile C++、编译器自动调优与 Python 生态巩固软件栈控制权

NVIDIA 发布 CUDA 13.3,核心动作包括将高级 CUDA Tile 编程模型扩展至 C++、正式发布稳定的 CUDA Python 1.0 并引入进程检查点等功能,以及推出 CompileIQ 编译器自动调优框架。此举旨在通过更高层级的抽象和自动化工具,进一步降低 GPU 编程门槛并提升性能。

NVIDIA 其他 强信号 2026-05-27

NVIDIA发布RTX PRO 4500 Blackwell加速基因组与蛋白质折叠计算

NVIDIA推出基于Blackwell架构的RTX PRO 4500服务器GPU,通过集成Parabricks、Openfold3等软件,在基因组序列比对、变异检测和蛋白质结构预测等关键生命科学工作负载上实现2倍以上性能提升,显著降低计算时间与能耗。

NVIDIA 其他 强信号 2026-05-23

NVIDIA 开源医学图像生成框架,推动 3D 医疗 AI 数据瓶颈突破

NVIDIA 发布并开源了基于 MAISI-v2 (Latent Rectified Flow) 架构的 NV-Generate-CTMR 框架及其新模型 NV-Generate-MR-Brain。该框架旨在规模化生成高质量的 3D CT 和 MRI 合成数据,并配套发布了大规模开源多模态 MRI 数据集 MR-RATE,以解决医疗 AI 开发中的数据稀缺和隐私限制问题。

Google 产品发布 强信号 2026-05-22

Google I/O 2026全面押注Agentic AI:Gemini 3.5 Flash/Omni/Antigravity 2.0/Gemini Spark密集发布

Google I/O 2026发布Gemini 3.5 Flash(4倍输出速度+前沿智能)、Gemini Omni Flash(原生多模态视频生成)、Antigravity 2.0(Agent编排桌面平台+CLI+SDK)、Gemini Spark(24/7个人AI助手)。Gemini MAU从4亿增至9亿;资本开支2026年预计1800-1900亿美元(2022年的6倍)。

NVIDIA 其他 强信号 2026-05-22

NVIDIA 以智能体工具包推动 AI 工作流从模型调用向编排平台演进

NVIDIA 通过其 NeMo Agent Toolkit 开源库,展示了一个用于量化金融信号发现的多智能体系统参考架构。该系统将传统手动、碎片化的研究流程,转变为由配置驱动、具备可观测性的自动化闭环,凸显了智能体编排层在复杂 AI 应用中的核心价值。

Cisco 其他 中信号 2026-05-21

思科Talos IR分享AI生成报告一致性控制方法

思科Talos事件响应团队发布研究,识别AI生成技术报告中的四类不一致问题,并通过提示工程方法进行控制。该研究基于桌面演练报告案例,旨在提升AI辅助内容生成的可靠性与效率。

Google 其他 强信号 2026-05-21

谷歌发布Antigravity 2.0,定义AI Agent本地开发控制平面

谷歌在I/O 2026上推出Antigravity 2.0,这是一个独立的桌面应用,旨在成为构建、测试和编排复杂AI工作流的“Agent-First”本地控制平面。它通过CLI/SDK、动态子代理和与企业云安全环境的直接集成,将AI Agent的开发与部署流程从云端延伸至本地环境,试图统一AI应用生命周期管理。