サーバーアラート通知
ホーム画面 > プロジェクト選択 > アラート通知 > イベント設定
サーバー、プロセス、ログファイル / Windowsウイベントなどのイベントポリシーを作成、修正、削除できます。イベントタイプを選択して、サーバーの再起動有無、エージェントの通信トラブルの持続時間、リソース使用量などによるイベントを設定できます。
-
+ イベント設定追加
イベントを追加できます。
-
名前
イベントの名前を表示します
-
条件
イベントの条件を表示します.
-
サーバー
当該イベントが設定されたサーバーを表示します。
-
修正と コピー
-
ボタンを選択して、保存されているイベント設定を修正できます。
-
ボタンを選択して、別のインフラにイベントをコピーできます。
-
サーバーイベント設定の追加
ホーム画面> プロジェクト選択> アラート通知 > イベント設定 > サーバータップ> + イベント設定追加ボタンを選択
特定のサーバーの全体的なイベントを設定して、警告通知を受信できます。
-
イベント設定追加画面が表示されるとイベント題名を入力します。
-
サーバーリストを確認するか、検索画面からモニタリングするサーバーを選択します。
-
アラート通知条件タブでメトリクスの条件、レベル、持続時間、活性化の有無を設定します。
-
レベル:警告または危険レベルを選択できます。
-
持続時間:設定した持続時間以降のサーバーの状態が警告、危険レベルに変更されます。
メトリクスの案内は次を参照してください。
-
再起動:サーバーの再起動時に発生するイベントです。
-
未受信:エージェントから持続時間の間、正常なデータを受信できなかった場合に発生する通信障害イベントです。
-
ポート:ポート接続不可イベントです。プロジェクト内に登録されたエージェントは、10120ポートを使用して双方の状態を確認します。持続時間の間の通信が行われない場合に発生するイベントです。
-
CPU、メモリ、スワップ:CPU、Memory、SWAPメモリなどの使用量に関するイベントを設定します。
-
Steal:CPU Steal Timeのイベントを設定します。Linux系のOSのみ設定できます。
-
ディスクI/O、ディスク使用量、inode:ディスク使用量とI/O使用量、Inode使用量でイベントを設定します。
-
ネットワークIOPS、ネットワークBPS:ネットワーク使用量に関するイベントを設定します。トラフィック量と毎秒パケットを基準に設定できます。
-
-
イベント受信タグを設定してください。
-
イベント受信タグを選択すると、そのタグを持つプロジェクトメンバーと3rd-partyプラグインに通知を送信できます。イベント受信タグを選択しない場合は、プロジェクトの全体メンバーにアラート通知を送信します。
-
+ タグ追加をクリックし、タグリストからアラート通知の受信対象を選択してください。+ 新しいタグ作成を選択してタグを追加することもできます。
-
アラート通知 > イベント受信設定メニューからプロジェクトメンバーと3rd-partyプラグインにタグを設定できます。イベント受信設定メニューの詳細は次の文書を参照してください。
-
-
イベント設定終了後、保存ボタンを選択します。
1台のサーバーに1つのイベントを割り当てることができます。
サーバーイベントの基本設定
WhaTapサーバーモニタリング サービスは、エージェントのインストールと同時に、次のような基本イベント設定を提供します。
-
再起動:活性化
-
ネットワークIOPS
- 警告:45,000 pps / 持続時間:5分
- 危険:50,000 pps / 持続時間:5分
-
ネットワークBPS
- 警告:5000,000,000 bps / 持続時間:5分
- 危険:7000,000,000 bps / 持続時間:5分
-
ディスクI/O
- 警告:90% / 持続時間:5分
- 危険:95% / 持続時間:5分
-
ディスク使用量
- 警告:90% / 持続時間:5分
- 危険:95% / 持続時間:5分
-
inode
- 警告:90% / 持続時間:5分
- 危険:95% / 持続時間:5分
-
CPU
- 警告:70% / 持続時間:1分
- 危険:90% / 持続時間:1分
-
メモリ
- 警告:70% / 持続時間:1分
- 危険:90% / 持続時間:1分
-
steal
- 警告:5% / 持続時間:1分
- 危険:10% / 持続時間:1分
-
スワップ
- 警告:50% / 持続時間:1分
- 危険:90% / 持続時間:1分
プロセスイベント設定の追加
ホーム画面> プロジェクト選択 > アラート通知 > イベント設定 > プロセスタップ> + イベント設定追加ボタン選択
特定のプロセスのイベントを設定して、アラート通知を受信できます。主要メトリクスであるプロセス数、プロセスCPUの使用量、プロセスメモリの使用量に基づいて条件を指定すると、そのプロセスが予期せず終了したり、性能が急激に変動した場合はリアルタイムでアラートを受けることがあります。
警告と危険レベル、そして設定したしきい値が維持される持続時間を設定して、イベントの深刻さを評価できます。またイベント受信タグを活用して、特定のプロジェクト メンバーに通知を送信できます。これにより、効率的に優先順位に応じた措置できます。
-
イベント設定追加画面が表示されるとイベント題名を入力します。
-
アラート通知条件タブでサーバーリストのエージェントが選択されていません。ボタンをクリックしてサーバーリスト画面でサーバーを選択します。
ノートプロジェクト基本ポリシーオプショントグルの活性化時、プロジェクトが管理するサーバーに基本の通知ポリシーを適用します。
-
プロセスの選択欄からプロセスまたはプロセスグループを選択します。
ノートプロセスグループの追加方法の詳細については 次の文書を参照してください。
-
プロセス所有者を選択します。
- プロセス所有者を指定しない場合、所有者に関係なく同じ名前のすべてのプロセスにその設定が適用されます。
- イベント条件は、プロセス所有者を省略した場合でも、所有者-プロセス単位で動作します。
-
ご希望のメトリクスのレベル、持続時間、活性化有無を設定します。
-
レベル:警告または危険レベルを選択できます。
-
持続時間:設定したしきい値の持続時間以降のサーバの状態が警告、危険レベルに変更されます。
メトリクスの案内は次を参照してください。
- プロセス数:同じ名前のプロセスの数に対してイベントを設定できます。危険と警告条件の個数を指定します。
- プロセスCPU:CPU使用量に応じてイベントを設定できます。
- プロセスメモリ:メモリ使用量に応じてイベントを設定できます。
-
-
イベント受信タグを設定してください。
-
イベント受信タグを選択すると、そのタグを持つプロジェクトメンバーと3rd-partyプラグインに通知を送信できます。イベント受信タグを選択しない場合は、プロジェクトの全体メンバーにアラート通知を送信します。
-
+ タグ追加をクリックし、タグリストからアラート通知の受信対象を選択してください。+ 新しいタグ作成を選択してタグを追加することもできます。
-
アラート通知 > イベント受信設定メニューからプロジェクトメンバーと3rd-partyプラグインにタグを設定できます。イベント受信設定メニューの詳細は次の文書を参照してください。
-
-
イベント設定後 保存ボタンを選択します。
- プロセス通知の条件を誤って設定した場合は、通知を無効にするか、通知の条件を再設定します。
- プロセスおよびプロセス所有者を誤って指定した場合は、そのアラート通知を無効にして進行中のアラートを解除してから、通知条件を再設定してください。
ログファイルおよびウィンドウイベントの追加
ホーム画面> プロジェクト選択> アラート通知 > イベント設定 > ログファイル / Windowsウイベントタップ> + イベント設定追加ボタン選択
特定のログファイルとウィンドウイベント設定を管理できます。
ログファイル
ログファイルイベントを追加するには、次を確認してイベント発生条件を指定してください。
-
イベント設定追加画面が表示されるとイベント題名を入力します。
-
サーバーリストを確認するか、検索画面からモニタリングするサーバーを選択します。
ノートプロジェクト基本ポリシーオプショントグルの活性化時、プロジェクトが管理するサーバーに基本の通知ポリシーを適用します。
-
アラート通知条件タブからログタイプをログファイルで選択します。
-
例を参照し、ファイルパスを正規表現で入力します。
例)/var/log/mylogfile%Y-%m-%d_%H:%M:%S.log_
-
イベントを発生させる検索キーワードを入力します。複数指定できます。
-
通知から除外する検出除外文字列を入力します。複数指定ができます。
-
数秒間指定したキーワードを検出した時に通知の受信有無の基準で繰返しと期間を入力します。
-
イベントの深刻度を選択してください。危険あるいは警告レベルを選択できます。
-
保存ボタンを選択します。
ウィンドウイベント
Windowsイベントを追加するには、次の内容を参照し、イベント発生条件を指定します。Windows環境でのみ使用できます。
-
イベント設定追加画面が表示されるとイベント題名を入力します。
-
サーバーリストを確認するか、検索画面からモニタリングするサーバーを選択します。
ノートプロジェクト基本ポリシーオプショントグルの活性化時、プロジェクトが管理するサーバーに基本の通知ポリシーを適用します。
-
アラート通知条件タブからログタイプをWindowsイベントで選択します。
-
次の例を参照して、ログ名を選択します。
-
次の例を参照してレベル、イベントソース(イベントソース)、イベントID、検索キーワードを指定します。検索キーワードは複数指定できます。
-
通知から除外する検出除外文字列を入力します。複数指定ができます。
-
イベントの深刻度を選択してください。危険あるいは警告レベルを選択できます。
-
保存ボタンを選択します。
ログファイル処理量
ログファイル処理量は、ログ行数をベースに次のように設定されています。 ログが過負荷になった場合、WhaTapサーバーモニタリングエージェントのCPUが過剰に使用されるのを防ぎます。超過量は処理されません。
- バージョン1.3.6以前:約2秒当たり60行を処理します。
- バージョン1.3.7以降:約2秒当たり1000行を処理します。
次のオプションを使用して、2秒当たりの超過量を調整できます。
-
Linux
/usr/whatap/infra/conf/whatap.conf ファイルに
log.skip.threshold=2秒当たりの処理行数
-
Windows
C:\Program Files\WhatapInfra\whatap.conf ファイルに
log.skip.threshold=2秒当たりの処理行数
イベントの修正
-
イベントリストの右側の修正アイコンを選択します。
-
アラート通知条件タブでメトリクスの条件、レベル、持続時間、活性化の有無を修正します。
-
イベントの修正が終わると、保存ボタンを選択します。
- イベント修正時、特定のメトリクスに変更事項がある場合、メトリクスが停止していた進行状況の通知はDisabledされます。
- 修正後、条件を満たすデータが入ってくると、新しい通知が発生します。
- プロセス通知の題名、プロセス、プロセス所有者のいずれかの値を修正する場合、その条件をもつすべての通知はDisabledされます。
イベントの削除
-
イベントリストの右側の修正アイコンを選択します。
-
修正画面の右上の削除アイコンを選択します。
イベントのコピー
-
イベント一覧の右側の コピーアイコンを選択します。
-
イベント設定コピー画面が表示されたら、希望するプロジェクトを選択するか、下段の現在のプロジェクトにコピーを選択します。
-
イベント設定をコピーするプロジェクトを指定して、コピーボタンを選択します。
-
同じプロジェクト内でイベントを繰り返しコピーをすると、コピー数と同じ数のイベントが作成されます。
-
コピーしたイベント名は形式(copy)サフィックスが追加されます。
例)既存のイベント名Default→コピーしたイベント名Default(copy)