- Amazon CloudWatch›
- 功能›
- AIOps
概览
利用 AWS 17 年来为全球数百万客户提供云服务所积累和完善的丰富运营经验。我们已应用人工智能和机器学习(ML)来帮助增强、加速和自动化您的云运营流程。AIOps 允许您轻松观察工作负载,加快操作故障排除,并采取措施解决和修复运营问题,从而缩短平均恢复时间 (MTTR)。
在短时间内找到问题的根本原因
从 AWS 管理控制台的任意位置启动运营调查。您可以将 CloudWatch 配置为在警报触发时立即开始调查,或者从 Amazon Q 聊天中创建调查。CloudWatch 会在调查过程中与您协同工作,帮助您识别应用程序中的异常,并就问题的根本原因提出假设。
使用修复建议快速解决问题
CloudWatch 通过提供相关的 AWS Systems Manager Automation 运行手册、AWS re:Post 文章和文档来对常见的 AWS 问题提出修复措施建议。运行运行手册来解决问题,这样您就可以让关键业务应用程序快速恢复全面运行。
适合各种经验水平的操作人员
Amazon CloudWatch 承担了故障排除过程的繁重工作,因此您不必是所有应用程序资源的专家。在运营调查中,CloudWatch 筛选了数十万个数据点,以发现服务之间的关系,并了解它们是如何协同工作的。在分析了其发现之后,CloudWatch 会向您提出问题的根本原因的潜在假设,并指导您如何解决问题。
自动检测异常和模式
Amazon CloudWatch 使用高级机器学习 (ML) 自动设置基准并检测遥测数据中的异常,无需手动筛选指标和日志。获取有关峰值或异常模式的警报,以便在问题升级之前解决问题。CloudWatch 突出显示反复出现的模式和关键值,例如严重性级别,帮助您快速找准相关日志或比较一段时间内的行为,以更快地发现问题。
客户
Cedar Gate Technologies
医疗技术提供商 Cedar Gate Technologies 现在借助 Amazon CloudWatch 来加快调查速度并快速解决问题,将识别运营问题根本原因的时间从两小时缩短至约 30 分钟,从而确保客户能够持续为患者提供有价值的护理服务。
Amazon Kindle
Amazon Kindle 的支持工程师在使用 Amazon CloudWatch 进行问题调查时,问题解决速度提升了 65-80%,这有助于他们更快地满足客户需求,从而提供最佳用户体验。
Amazon Music
Amazon Music 的开发人员正在使用 Amazon CloudWatch 作为全天候助手来自动执行调查并识别问题趋势,这有助于他们在待命轮班期间更快采取行动。早期的使用表明,Amazon Music 解决问题的速度是原来的两倍,因此听众可以继续欣赏自己喜欢的歌曲。
SmugMug
照片管理平台SmugMug将使用亚马逊CloudWatch自动分析其系统中的指标、日志和操作事件,使他们能够在不到20分钟的时间内诊断出大多数问题,速度最多可提高50%。这通过减少手动日志搜索来提高运营效率,因此他们的团队可以减少花在管理问题上的时间和资源,将更多的时间用于构建平台以帮助摄影师发展其数字店面。