Reports
AI-generated structured vendor updates
谷歌为Gemini API引入Flex与Priority推理层级
谷歌为其Gemini API新增Flex和Priority两个服务层级。Flex是成本优化层级,为延迟容忍型工作负载提供同步接口,价格降低50%;Priority为高可靠性层级,确保关键应用在高峰期的请求不被抢占。此举旨在通过单一界面,让开发者根据AI任务类型(如后台Agent思考与前台交互)灵活平衡成本与可靠性。
谷歌发布Gemma 4开源模型,瞄准边缘推理与AI代理架构
谷歌推出Gemma 4开源模型家族,包含从2B到31B的四个版本,强调单位参数性能突破,并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化,旨在将前沿推理能力扩展至移动与IoT场景。
Google为Gemini API推出Flex和Priority推理层级
Google在其Gemini API中新增Flex和Priority两个服务层级,允许开发者通过单一接口优化成本和可靠性。Flex针对延迟容忍型工作负载提供50%的成本节约,而Priority则为关键应用提供最高可靠性保障。这一变化简化了AI代理架构中同步和异步任务的管理。
Google发布Gemma 4开源模型系列
Google推出Gemma 4开源模型系列,包含四种规模变体,特别优化边缘计算和移动设备。该系列支持多模态处理、长上下文窗口和140多种语言,采用Apache 2.0许可。
微软将MAI多模态模型系列全面集成至Foundry平台
微软宣布将自研的MAI多模态模型家族(包括转录、语音、图像模型)全面提供给Foundry平台的开发者。此举旨在通过统一的平台层,降低企业开发者集成和编排多模态AI能力的复杂性,推动AI从独立产品向企业基础设施层转变。
思科推出AI就绪宽带解决方案应对边缘计算挑战
思科发布Agile Services Networking和Unified Edge平台,旨在帮助宽带服务提供商应对AI带来的带宽激增和低延迟需求。该方案通过在网络边缘部署计算和推理能力,减少核心网络负载,并支持智能流量优先级管理。
思科推动6GHz Wi-Fi作为AI基础设施核心
思科基于对6000名无线决策者的调研,提出6GHz频段是解决AI工作负载网络需求的关键,数据显示采用6GHz的企业AI部署率高出传统网络72%。该主张涉及网络架构升级和安全体系重构。
思科报告:企业无线投资正成为AI时代战略增长引擎
思科发布首份无线状态报告,指出AI、物联网和高带宽应用正推动企业增加无线投资,并产生复合业务回报。报告揭示了“无线AI悖论”:AI既是驱动投资回报的主要动力,也带来了运营复杂性和安全风险。
思科报告揭示AI自动化提升企业无线投资回报
思科首份全球无线状态报告显示,80%企业过去五年增加无线预算,35%计划未来四年追加50%以上投入。采用AI自动化运维的企业获得4倍以上投资回报,每日节省3.2小时人力,但面临AI安全事件导致的年均百万美元损失。
思科报告揭示无线投资与AI的乘数效应
思科发布首份全球无线状态报告,基于对6000多名决策者的调研显示,80%的企业在过去五年增加了无线投资,其中AI驱动的自动化平均每天为IT人员节省3小时20分钟。报告提出'无线AI悖论'概念,指出成功应对复杂性、安全性和人才挑战的企业获得4倍投资回报。
思科提出无线AI基础设施四大支柱战略
思科基于其《2026年无线网络状态报告》提出解决无线AI悖论的四大支柱:构建Wi-Fi 7基础平台、实施AgenticOps自动化、整合ISE安全方案以及通过Networking Academy培养人才。该战略强调现代无线基础设施需同时满足AI性能需求与安全运维要求。
思科Talos报告揭示身份攻击成为主要战场
思科Talos 2025年度报告显示,攻击者正以前所未有的速度利用身份相关攻击作为主要手段,同时老旧漏洞仍被广泛利用。报告强调身份控制已成为安全防御的核心挑战。
AMD发布突破性MLPerf 6.0推理结果,展示多节点扩展与多模态能力
AMD在MLPerf Inference 6.0基准测试中,凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型(Wan-2.2-t2v)的快速启用,以及广泛的合作伙伴生态系统复现结果。
Check Point发布AI防御平面,将安全控制重心从模型转向运行时
Check Point发布“AI防御平面”,旨在为AI驱动的企业提供统一安全控制。其核心是构建一个AI原生安全引擎,将防护从模型安全层(guardrails)延伸至AI在真实环境中的运行时行为控制,覆盖员工使用、AI应用及自主智能体(Agent)系统。
谷歌将Veo视频生成模型免费开放,推动AI视频创作平民化
谷歌宣布其AI视频创作工具Vids免费提供高质量视频生成功能,所有个人账户每月可获得10次Veo 3.1模型生成的免费额度,并推出Chrome扩展以简化屏幕录制流程。
思科推出全栈后量子密码架构
思科在Cisco Live 2026上发布业界首个全栈后量子密码(PQC)架构,该方案采用NIST认证的量子抗性算法,覆盖从设备启动完整性到数据传输保护的全栈安全层。此举标志着二十年来最重要的密码学突破,旨在应对量子计算带来的'现在收集未来解密'威胁。
思科通过统一可观测性平台实现预防性IT运维
思科IT部门通过整合Splunk、ThousandEyes和AppDynamics等工具,构建了统一的可观测性平台,将运维重点从MTTR转向事故预防。该平台利用AI技术实现数据关联分析,在过去18个月减少了25%的重大事故并提升45%的故障解决速度。
思科推出开源AI Agent安全解决方案DefenseClaw
思科发布开源安全解决方案DefenseClaw,针对OpenClaw AI Agent提供四大防护引擎,包括提示检查、工具检测、安装扫描和代码审查功能。该方案通过实操实验室展示如何防御恶意技能、不安全MCP服务器等11.9%已发现的威胁。
高通推出集成NPU的可穿戴平台,强化边缘AI与“个人AI生态”
高通发布Snapdragon Wear Elite平台,首次为可穿戴设备集成专用NPU,支持本地运行高达20亿参数模型。该平台旨在将AI计算从智能手机中心转向以个人AI代理为中心的架构,利用可穿戴设备提供持续上下文,实现跨设备智能协同。
思科推出统一AI网络架构应对训练与推理流量冲突
思科提出统一AI网络架构解决方案,通过N9000系列交换机实现训练和推理流量的智能调度,解决传统双架构模式下的资源浪费问题。该方案包含硅级低延迟支持、实时遥测和自动化策略调整能力,瞄准新兴云服务商的平台化转型需求。