跳至主要内容

人工智能运营

利用 AI 快速识别、诊断和修复运营问题

概览

利用 AWS 17 年来为全球数百万客户提供云服务所积累和完善的丰富运营经验。我们已应用人工智能和机器学习(ML)来帮助增强、加速和自动化您的云运营流程。AIOps 允许您轻松观察工作负载,加快操作故障排除,并采取措施解决和修复运营问题,从而缩短平均恢复时间 (MTTR)。 

在短时间内找到问题的根本原因

从 AWS 管理控制台的任意位置启动运营调查。您可以将 CloudWatch 配置为在警报触发时立即开始调查,或者从 Amazon Q 聊天中创建调查。CloudWatch 会在调查过程中与您协同工作,帮助您识别应用程序中的异常,并就问题的根本原因提出假设。

开始 CloudWatch 调查互动演示

Missing alt text value

使用修复建议快速解决问题

CloudWatch 通过提供相关的 AWS Systems Manager Automation 运行手册、AWS re:Post 文章和文档来对常见的 AWS 问题提出修复措施建议。运行运行手册来解决问题,这样您就可以让关键业务应用程序快速恢复全面运行。

在文档中阅读有关亚马逊 CloudWatch 调查的信息

Missing alt text value

适合各种经验水平的操作人员

Amazon CloudWatch 承担了故障排除过程的繁重工作,因此您不必是所有应用程序资源的专家。在运营调查中,CloudWatch 筛选了数十万个数据点,以发现服务之间的关系,并了解它们是如何协同工作的。在分析了其发现之后,CloudWatch 会向您提出问题的根本原因的潜在假设,并指导您如何解决问题。

查看样本调查

Missing alt text value

自动检测异常和模式

Amazon CloudWatch 使用高级机器学习 (ML) 自动设置基准并检测遥测数据中的异常,无需手动筛选指标和日志。获取有关峰值或异常模式的警报,以便在问题升级之前解决问题。CloudWatch 突出显示反复出现的模式和关键值,例如严重性级别,帮助您快速找准相关日志或比较一段时间内的行为,以更快地发现问题。

在文档中阅读有关 CloudWatch 异常检测的信息

Missing alt text value

使用自然语言查询遥测数据

无需学习复杂的查询语言,即可从遥测中提取见解。与其编写复杂的查询,您只需用通俗易懂的英语提问,例如 “显示过去 24 小时内最慢的 10 个 AWS Lambda 请求”,Amazon CloudWatch 将自动生成正确的语法。使用 CloudWatch Logs Insights 中的自然语言摘要功能,您可以根据查询结果生成摘要,以帮助您快速识别问题并从日志数据中获得切实可行的见解。

阅读文档中如何使用自然语言查询自然语言摘要

Missing alt text value

客户

Cedar Gate Technologies

医疗技术提供商 Cedar Gate Technologies 现在借助 Amazon CloudWatch 来加快调查速度并快速解决问题,将识别运营问题根本原因的时间从两小时缩短至约 30 分钟,从而确保客户能够持续为患者提供有价值的护理服务。

Missing alt text value

Amazon Kindle

Amazon Kindle 的支持工程师在使用 Amazon CloudWatch 进行问题调查时,问题解决速度提升了 65-80%,这有助于他们更快地满足客户需求,从而提供最佳用户体验。 

Missing alt text value

Amazon Music

Amazon Music 的开发人员正在使用 Amazon CloudWatch 作为全天候助手来自动执行调查并识别问题趋势,这有助于他们在待命轮班期间更快采取行动。早期的使用表明,Amazon Music 解决问题的速度是原来的两倍,因此听众可以继续欣赏自己喜欢的歌曲。

Missing alt text value

SmugMug

照片管理平台SmugMug将使用亚马逊CloudWatch自动分析其系统中的指标、日志和操作事件,使他们能够在不到20分钟的时间内诊断出大多数问题,速度最多可提高50%。这通过减少手动日志搜索来提高运营效率,因此他们的团队可以减少花在管理问题上的时间和资源,将更多的时间用于构建平台以帮助摄影师发展其数字店面。

Missing alt text value