智能操作

加快运营调查和修复

概览

利用 AWS 17 年来为全球数百万客户提供云服务所积累和完善的丰富运营经验。我们已应用人工智能和机器学习(ML)来帮助增强、加速和自动化您的云运营流程。智能运营可让您轻松观察应用程序和基础设施组件,加快运营调查和故障排除,并采取行动解决和修复运营问题,从而缩短平均恢复时间(MTTR)。

优势

AWS 的运营经验和规模远超任何其他云提供商,17 年来一直为全球数百万客户提供云服务。我们将这些经验融入 Amazon CloudWatch 的功能中,帮助指导您完成故障排除和修复过程,使您能够在极短的时间内完成跨 AWS 环境的运营调查。

从 AWS 管理控制台的任意位置启动运营调查。您可以将 CloudWatch 配置为在警报触发时立即开始调查,或者从 Amazon Q 聊天中创建调查。CloudWatch 会在调查过程中与您协同工作,帮助您识别应用程序中的异常,并就问题的根本原因提出假设。

CloudWatch 通过提供相关的 AWS Systems Manager Automation 运行手册AWS re:Post 文章和文档来对常见的 AWS 问题提出修复措施建议。您可以在运行运行手册之前填写关键参数并查看运行手册内容,以解决问题。

在从问题分类到修复的整个故障排除过程中,CloudWatch 会与您协同工作,从而节省在寻找根本原因上花费的时间。CloudWatch 可自动将上下文添加到可观测性数据中,让各种经验水平的操作人员都能熟练地浏览遥测数据和相关资源。

 

使用案例

您可以将 CloudWatch 配置为在 CloudWatch 警报触发时自动开始调查。当您打开笔记本电脑时,CloudWatch 已在筛选遥测数据以查找异常。CloudWatch 利用其对 AWS 资源的了解来发现资源之间的关系,并就警报提出可能的根本原因,帮助您以前所未有的速度恢复生产。

Amazon CloudWatch 为可观测性数据添加上下文,将不同的指标和日志转化为实时见解。此功能集成在 AWS 管理控制台中,可从多个入口点访问,因此您可以轻松浏览相关的遥测数据,并直观显示资源之间的关系,从而加快分析速度。

无需深入了解查询语言,即可快速从可观测性数据中收集见解。您可以用简洁的英语对日志和指标提出问题,CloudWatch 会为您生成相应的查询。