Amazon Web Services ブログ
Category: Monitoring and observability
コンテナでデプロイした Lambda から OpenTelemetry でトレースを X-Ray に送る
はじめに 分散アプリケーションにおいてオブザーバビリティはパフォーマンスボトルネックやエラー率・アプリケーシ […]
【開催報告 & 資料公開】AWS 秋の Observability 祭り 2024
本ブログでは、2024 年 11 月 1 日に実施した「AWS 秋の Observability 祭り ~明日使えるアセット祭り~」のイベントについて内容を簡単にご紹介しつつ、アセット資料を紹介致します。今回のイベントでは、すぐデプロイできるアセットを活用し Observability の高度化をジャンプスタートすることをテーマに様々なアセットをご紹介しました。アセットは生成 AI を活用した Observability での障害分析の効率化 、負荷試験における可視化や異常検知といった Observability で試験の速度と品質の改善、Amazon CloudWatch をさらに高度に活用するためのネットワーク監視、ログ異常検知機能による運用改善と複数のユースケースをカバーしています。
Amazon CloudWatch Logs Data Protection による機密ログデータの検出と保護
Amazon Web Services (AWS) 上で実行されるお客様のアプリケーションでは、個人を特定できる情報 (PII) や保護された健康情報 (PHI) などの機密データを扱う必要がある場合があります。
その結果、機密ログデータがアプリケーションの可観測性データの一部として意図的または意図せずに記録される可能性があります。包括的なログ記録はアプリケーションのトラブルシューティング、監視、(原因)分析に重要ですが、記録された機密情報はデータセキュリティとコンプライアンスの観点から重大なリスクとなります。このブログでは、Amazon CloudWatch Logs Data Protection を使用してログ内の機密データを検出および保護する方法、データ保護を検証する方法、非準拠の結果を収集および報告する方法を学びます。また、Amazon CloudWatch アラーム、通知、さらなる是正アクションを作成する方法についても学び、コンプライアンス要件を満たすために活用方法をご紹介します。
Amazon Bedrock Insights による CloudWatch アラームへの対応
クラウドで複雑な分散システムを運用する際、問題の原因を迅速に特定し、インシデントを解決することは大変な課題です。トラブルシューティングには、複数の AWS サービスからメトリクス、ログ、トレースをさらけずる必要があり、問題の全体像を把握することが難しくなります。しかし、この Alarm Context Tool (ACT) を使えば、効果的なインシデント解決に必要な時間と労力を削減できます。このブログでは、Amazon CloudWatch アラームに追加のコンテキストを提供する ACT ソリューションを紹介しています。ACT は、AWS Lambda 、Amazon CloudWatch 、AWS X-Ray 、AWS Health 、Amazon Bedrock を活用して、メトリクス、ログ、トレースを統合・分析し、有益な洞察を生成します。ACT を使えば、トラブルシューティングが簡素化され、運用コストを削減でき、AWS 環境の可観測性が向上します。
アプリケーションの信頼性を効果的な SLO で向上させる
このブログでは、パフォーマンスを客観的に測定し、信頼性を正確に報告することで、インシデント発生時の迅速な対応と不要な警告を減らすことができる信頼性のベストプラクティスについて説明します。また、任意の Amazon CloudWatch メトリクスを使用して Amazon CloudWatch Application Signals で、サービスレベル目標(SLO)の作成、監視、アラートの方法を学びます。
AWS Summit Japan 2024 に Chaos Kitty がパワーアップして帰ってきます!
みなさんお久しぶりです! 猫が大好きな Solutions Architect の服部です。昨年の AWS S […]
SAP on AWS のエンドツーエンドオブザーバビリティ: パート 1 概要
AWS が提供する SAP システムの一括監視/可観測化ダッシュボードを使うことで、顧客は問題が発生しているレイヤー (データベース、アプリケーション サーバー、プレゼンテーション層、ネットワーク接続など) の関連付けを行い、操作の卓越性と重要業務プロセスの回復力を向上させることができます。
AWS で SAP の end-to-end 可観測性を実現するサービスを活用することで、SAP システムの根本原因分析を包括的に実施し、障害からの平均復旧時間を日単位から時間単位 (場合によっては分単位) に短縮できます。また、ユーザーに障害が発生する前に積極的な警告を行い、重要業務プロセスをサポートするための主要リソースの適正化とキャパシティ予測も可能になります。
Python アプリのモニタリングを Amazon CloudWatch Application Signals (プレビュー) で実施
このブログ投稿では、Amazon EKS クラスター上で実行されている Python アプリケーションを、コード変更を行うことなくシームレスに計装するための CloudWatch Application Signals の活用方法について説明します。この強力な機能により、アプリケーションサービスのゴールデンメトリクスとトレースを簡単に収集でき、監視とトラブルシューティングが容易になることができます。さらに、Application Signals が提供する既製のダッシュボードを使うことで、アプリケーションサービスの全体の活動状況と運用の健全性をどのように視覚化できるかを説明します。これらのダッシュボードを活用することで、主要なパフォーマンスメトリクスにすばやくアクセスし、トレースと関連付けて、根本的な問題を数クリックで簡単に特定して対処できます。
Amazon EKS Windows ワークロードの監視のための Amazon CloudWatch Container Insights 発表
この記事では、Amazon EKS Windows クラスターに Container Insights を有効化するプロセスを紹介します。Container Insights を利用することで、数回のクリックで、Amazon EKS Windows クラスターのコントロールプレーンとデータプレーンの両方の詳細なメトリクスを収集できるようになります。Amazon EKS クラスターで高度な CloudWatch Container Insights を有効にし、Amazon EKS クラスター上で実行中の Windows ワークロードの組み込みのダッシュボードを使うことで、パフォーマンス問題の特定と解決にかかる時間を短縮できます。
【開催報告 & 資料公開】AWS 春の Observability 祭り 2024
こんにちは。ソリューションアーキテクト (以下 SA) の高野です。 2024 年 4 月 25 日に「A […]