Reports
AI-generated structured vendor updates
AMD与Liquid AI探讨从芯片到系统的高效AI架构
AMD CTO与Liquid AI CEO探讨AI架构演进,强调效率是AI从云端向边缘和终端设备扩展的关键。双方认为,通过从芯片到系统的协同设计,可实现低功耗、高响应性的AI推理,支持持续运行的智能体与多模型协同。
微软通过IQ与Agent 365平台化AI能力,推动企业向“前沿”转型
微软CEO Judson Althoff阐述其“前沿企业”愿景,核心是推出“Microsoft IQ”和“Agent 365”两大平台能力,旨在将智能与信任系统化地嵌入企业工作流。通过多个大型客户案例,展示了从Copilot规模化部署到自主AI代理(Agent)构建的演进路径,强调通过开放、模型多样的平台实现业务增长。
思科SD-WAN更新:AI应用分类、AI助手与Neocloud连接性集成
思科发布SD-WAN 26.1.1版本,重点增强AI就绪能力。更新包括对AI应用的自动识别与分类、内置生成式AI助手用于运维,以及与Megaport AI Exchange集成以连接分布式GPU和Neocloud环境。此举旨在优化AI流量性能与安全,并简化网络操作。
微软发布Azure Local大规模扩展,支持主权私有云部署数千节点
微软宣布Azure Local平台现可支持在单一主权边界内部署数千台服务器,为大规模主权私有云提供基础设施。该平台支持在连接、间歇连接或完全断开的环境下运行,并集成了英特尔Xeon 6处理器等硬件,旨在满足国家基础设施、受监管工作负载和本地AI推理对规模、控制与合规性的综合需求。
微软推出“前沿成功”框架,将智能体AI与企业工作流深度融合
微软在香港AI巡展上推出“前沿成功”框架,旨在帮助企业将智能体AI从实验阶段转向规模化运营。该框架通过整合Copilot、Work IQ和Agent 365等组件,强调在深度工作上下文和安全治理基础上实现AI价值。
Anthropic与AWS签署千亿美元协议锁定未来十年AI算力
Anthropic与亚马逊AWS签署新协议,承诺未来十年投入超1000亿美元,锁定高达5吉瓦的AI算力容量,并计划将Claude平台深度集成至AWS。此举旨在应对其AI模型Claude的爆炸性需求增长,并巩固其作为AWS上关键AI模型提供商的地位。
思科研究揭示多模态提示注入攻击新风险与防御信号
思科AI安全研究团队发布报告,系统评估了针对视觉语言模型的排版式提示注入攻击。研究发现,字体大小、模糊、旋转等视觉变换显著影响攻击成功率,并首次提出文本-图像嵌入距离可作为轻量级、模型无关的风险信号,为构建多模态AI安全防御层提供了新思路。
思科联合工业自动化厂商,推动工厂边缘成为统一AI计算平台
思科在汉诺威工业展上联合罗克韦尔自动化等厂商,提出工厂边缘正演变为一个集成了控制、可视化与AI推理的统一计算平台。其核心是通过Cisco Unified Edge架构,将传统孤立的PLC、HMI、SCADA与AI工作负载(如视觉检测、预测性维护)整合,实现从洞察到实时闭环行动的转变。
思科在MWC 2026通过统一平台展示AI安全架构整合
思科在MWC 2026的S/NOC中,将其AI就绪防火墙、SSE、AI Defense、Splunk SIEM和XDR作为统一平台运行,展示了从DNS层到应用层的多层级AI安全防护与自动化响应,并特别强调了对生成式AI应用的发现与风险管控。
谷歌在Colab推出“学习模式”,将AI编程助手转向教学引导
Google Colab为集成的Gemini AI助手推出两项新功能:“自定义指令”和“学习模式”。前者允许用户按项目或教学大纲定制助手行为并分享,后者将AI从直接生成代码转变为分步引导的教学导师,旨在提升用户编程技能。
谷歌将NotebookLM深度集成至Gemini,推出个人知识库功能
谷歌在Gemini应用中引入“笔记本”功能,与NotebookLM深度同步,旨在将AI对话、项目文件与个人知识库整合。此举将AI助手从单次交互工具,转变为支持长期、复杂项目的结构化知识管理平台。
谷歌在Gemini中引入Notebooks,与NotebookLM同步
谷歌在Gemini应用中推出“Notebooks”功能,作为个人知识库,可跨Gemini与NotebookLM同步。该功能旨在组织聊天、文件和自定义指令,为复杂项目提供上下文,并计划向付费订阅者及后续免费用户开放。
微软联合日本本土运营商构建主权AI基础设施
微软宣布未来四年在日投资100亿美元,核心是与日本樱花互联网和软银合作,通过Azure提供由本土运营商管理的GPU算力服务,确保数据驻留日本。此举旨在满足日本对数据主权和合规性要求严格的AI工作负载需求。
谷歌为Gemini API引入Flex与Priority推理层级
谷歌为其Gemini API新增Flex和Priority两个服务层级。Flex是成本优化层级,为延迟容忍型工作负载提供同步接口,价格降低50%;Priority为高可靠性层级,确保关键应用在高峰期的请求不被抢占。此举旨在通过单一界面,让开发者根据AI任务类型(如后台Agent思考与前台交互)灵活平衡成本与可靠性。
谷歌发布Gemma 4开源模型,瞄准边缘推理与AI代理架构
谷歌推出Gemma 4开源模型家族,包含从2B到31B的四个版本,强调单位参数性能突破,并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化,旨在将前沿推理能力扩展至移动与IoT场景。
Google为Gemini API推出Flex和Priority推理层级
Google在其Gemini API中新增Flex和Priority两个服务层级,允许开发者通过单一接口优化成本和可靠性。Flex针对延迟容忍型工作负载提供50%的成本节约,而Priority则为关键应用提供最高可靠性保障。这一变化简化了AI代理架构中同步和异步任务的管理。
Google发布Gemma 4开源模型系列
Google推出Gemma 4开源模型系列,包含四种规模变体,特别优化边缘计算和移动设备。该系列支持多模态处理、长上下文窗口和140多种语言,采用Apache 2.0许可。
思科推出AI就绪宽带解决方案应对边缘计算挑战
思科发布Agile Services Networking和Unified Edge平台,旨在帮助宽带服务提供商应对AI带来的带宽激增和低延迟需求。该方案通过在网络边缘部署计算和推理能力,减少核心网络负载,并支持智能流量优先级管理。
AWS与西门子能源深化合作推进数据中心能源解决方案
AWS宣布与西门子能源扩大战略合作,将AWS云服务和AI技术(包括Amazon Bedrock和SageMaker)应用于西门子能源的智能制造和工厂自动化。双方还将共同探索数据中心电力基础设施的创新方案,包括千兆瓦级发电和微电网技术。
AMD发布突破性MLPerf 6.0推理结果,展示多节点扩展与多模态能力
AMD在MLPerf Inference 6.0基准测试中,凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型(Wan-2.2-t2v)的快速启用,以及广泛的合作伙伴生态系统复现结果。
思科参与NIST生成式AI信任计划
思科宣布参与NIST生成式AI信任计划,重点开发可测量的AI信任评估框架。该计划包含动态对抗测试环境(Cat-and-Mouse框架)和代码生成挑战赛,旨在建立AI输出的可信度验证机制。
谷歌将Veo视频生成模型免费开放,推动AI视频创作平民化
谷歌宣布其AI视频创作工具Vids免费提供高质量视频生成功能,所有个人账户每月可获得10次Veo 3.1模型生成的免费额度,并推出Chrome扩展以简化屏幕录制流程。
ARM推出自研AGI CPU芯片,扩展AI基础设施布局
ARM首次推出自研AGI CPU芯片,突破传统IP授权模式,提供从定制化芯片到完整平台解决方案的全栈能力。此举将重构AI基础设施供应链控制权,推动企业从硬件层优化AI工作负载部署效率。
谷歌提出隐私创新理念,推动AI助手时代数据保护框架演进
谷歌全球事务总裁在IAPP峰会上提出“隐私创新”理念,强调在AI助手时代,数据保护框架需与技术同步演进。他指出,未来的隐私控制需超越传统通知与同意模式,通过情境感知、精细化的访问控制和内置护栏来实现。这代表了对AI时代隐私与安全治理模式的系统性思考。
Google 提出隐私创新框架以支持 AI 助手发展
Google 全球事务总裁 Kent Walker 在 IAPP 2026 全球峰会上阐述了公司对 AI 时代隐私保护的新框架,强调通过技术创新实现'隐私即质量'的理念,并展示了其个性化 AI 助手如何整合多应用数据提供主动服务。
AWS与TGS达成战略合作,推动能源行业AI与HPC转型
TGS选择AWS作为首选云提供商,利用AWS的高性能计算和生成式AI构建能源勘探解决方案。合作包括现代化TGS Imaging AnyWare平台,部署多模态地下基础模型,并利用AWS Nitro系统确保工作负载安全。
ARM与NVIDIA推动AI工作站本地化变革
ARM与NVIDIA联合推出基于GB10 Grace Blackwell芯片的DGX Spark AI工作站系列,八家主流OEM厂商同步发布产品。该方案采用统一内存架构支持2000亿参数模型本地运行,第三方测试显示较x86方案提升41%渲染性能与3.2倍AI处理速度,实现云端工具链向边缘端无缝迁移。
HPE报告揭示攻击者商业模式AI化
HPE Threat Labs发布报告,显示网络攻击者采用企业化运营模式,利用自动化和生成式AI加速攻击。基于2025年全球威胁活动分析,强调防御需整合AI和零信任架构。
Fortinet整合AI代理与SASE于FortiOS 8.0
Fortinet发布FortiOS 8.0,引入基于Fabric的AI代理、安全AI控制、灵活SASE和简化SD-WAN功能,旨在增强企业网络安全的AI集成能力,推动安全控制层向AI驱动转移。
FortiOS 8.0 GenAI检测:企业AI可见性与安全管控新范式
FortiOS 8.0引入AIAP数据库和GenAI专用日志字段,实现对ChatGPT、Gemini等主流AI应用的网络层检测与管控。六个专用日志字段覆盖用户身份、模型、数据位置等完整信息链路。