CloudWatch アラーム設計ツール

ユースケースを選択すると、推奨されるCloudWatchアラーム設定を確認できます。 しきい値やパラメータをカスタマイズすると、AWS CLIコマンドとCloudFormationテンプレートがリアルタイムで更新されます。

ユースケースを選択

このツールについて

CloudWatchアラームの基本構成要素

CloudWatchアラームは以下の4要素で定義されます。

  • メトリクス: 監視対象の数値(CPU使用率、リクエスト数など)
  • 統計: Average(平均)、Sum(合計)、Maximum(最大)など、メトリクスをどう集計するか
  • 期間: 集計する時間枠(60秒、300秒など)
  • 評価期間 × データポイント: 連続で条件を満たしたらアラート発報

例: 「CPU使用率(メトリクス)のAverage(統計)が5分間(期間)で3回連続(評価期間)80%を超えたら発報」

統計と期間の選び方

  • 統計の選択: CPU使用率などはAverage、リクエスト数・エラー数はSum、最大負荷の監視はMaximumが基本です。
  • 評価期間を長くする: ノイズが減り、誤発報が少なくなる代わりに検知が遅くなります。本番の重要なアラームは「3回中3回」のように複数データポイントで判定すると安定します。
  • 評価期間を短くする: 異常をすぐ検知できますが、一時的なスパイクでも発報しやすくなります。
  • 期間60秒: CloudWatchの標準解像度では最小1分単位です。それ以下は「高解像度メトリクス(追加料金)」が必要です。

ハマりやすいポイント

  • メトリクスがない状態の扱い: 「missing」の挙動を設定し忘れると、データが来なくなった時(EC2が停止したなど)に無限に発報し続けたり、逆に気づけなかったりします。
  • アラームの数=コスト: アラーム1つにつき月$0.10程度。数百個作ると見過ごせないコストになります。まとめられるものはまとめて。
  • SNSトピックとサブスクリプションの混在: アラームからSNSへ、SNSからLambdaやメールへ、の二段構成が基本。直接Lambda呼び出しもできますが、通知先の拡張性を考えるとSNS経由が無難です。
  • 複合アラームを使えば発報を集約できる: 2026年時点では複合アラームで「このメトリクスとあのメトリクスの両方がしきい値超過」というAND条件を作れます。単純アラームの量産を避けられます。