Amazon Web Services ブログ

Tag: Observability

AWS Summit Japan 2025 に Chaos Kitty が更にパワーアップして 3 回目の登場!

 みなさんこんにちは! どちらかというと猫より犬が好きな Solutions Architect の高野です。 […]

Istio と ARC ゾーンシフトによる Amazon EKS におけるモニタリングとAZ障害からのリカバリ自動化

マイクロサービスアーキテクチャをクラウドで実行することは、すぐに複雑な運用になる可能性があります。個々のワークロードにおける複数のインスタンスのような増え続ける変動要素を、インフラストラクチャの依存関係と合わせて考慮する必要があります。Amazon EKS 環境では、1 つのワーカーノード、一部のワーカーノード、または AZ 全体に問題が発生することがあります。AZ の障害が発生した場合は、回復力と復旧戦略の一環として Amazon Application Recovery Controller (ARC) のゾーンシフトを使用できます。ARC ゾーンシフトを使用すると、クラスター内のネットワークトラフィックを、影響を受けた AZ から一時的にリダイレクトできます。この投稿では、ゾーンシフトを管理するためのシグナルとして Istio のメトリクスを利用し、AZ における異常または劣化が発生した際に、アプリケーションの迅速な復旧を監視および自動化する方法に焦点を当てています。

行く前に知っておきたい — AWS re:Invent 2024 モニタリングとオブザーバビリティ

12 月 2 日から 12 月 6 日までラスベガスで開催される AWS re: Invent 2024 に参加する予定で、モニタリングとオブザーバビリティについて詳しく知りたいとお考えですか? もしそうなら、このブログでは re:Invent 2024 でのモニタリングとオブザーバビリティに焦点を当てたクラウド運用に関連するセッションを取り上げています。

awso11yfes2024autumn

【開催報告 & 資料公開】AWS 秋の Observability 祭り 2024

本ブログでは、2024 年 11 月 1 日に実施した「AWS 秋の Observability 祭り ~明日使えるアセット祭り~」のイベントについて内容を簡単にご紹介しつつ、アセット資料を紹介致します。今回のイベントでは、すぐデプロイできるアセットを活用し Observability の高度化をジャンプスタートすることをテーマに様々なアセットをご紹介しました。アセットは生成 AI を活用した Observability での障害分析の効率化 、負荷試験における可視化や異常検知といった Observability で試験の速度と品質の改善、Amazon CloudWatch をさらに高度に活用するためのネットワーク監視、ログ異常検知機能による運用改善と複数のユースケースをカバーしています。

Amazon Bedrock Insights による CloudWatch アラームへの対応

クラウドで複雑な分散システムを運用する際、問題の原因を迅速に特定し、インシデントを解決することは大変な課題です。トラブルシューティングには、複数の AWS サービスからメトリクス、ログ、トレースをさらけずる必要があり、問題の全体像を把握することが難しくなります。しかし、この Alarm Context Tool (ACT) を使えば、効果的なインシデント解決に必要な時間と労力を削減できます。このブログでは、Amazon CloudWatch アラームに追加のコンテキストを提供する ACT ソリューションを紹介しています。ACT は、AWS Lambda 、Amazon CloudWatch 、AWS X-Ray 、AWS Health 、Amazon Bedrock を活用して、メトリクス、ログ、トレースを統合・分析し、有益な洞察を生成します。ACT を使えば、トラブルシューティングが簡素化され、運用コストを削減でき、AWS 環境の可観測性が向上します。