本文へスキップ

トランザクション分析

ヒットマップ

ホーム画面 > プロジェクト選択 > 分析 > ヒットマップ

WhaTapモニタリングサービスの初期画面でプロジェクトを選択した後、分析 > ヒットマップメニューを選択します。

ノート

ヒットマップは、ダッシューボード > アプリケーションヒットマップウィジェットからもアクセスできます。

詳細分析

ヒットマップ

number1エージェント領域

現在のプロジェクトと関連づけられたエージェントを選択し、フィルタリングできます。アイコンボタンを選択すると、number2領域でヒットマップTXチャートが表示します。

number2ヒットマップTXチャート

遅延の問題があるトランザクションが含まれている場合ヒットマップTXチャートに、オレンジで表示されます。通常のトランザクションが含まれている場合、で表示されます。

number3選択

リアルタイムヒットマップチャートをドラッグすると、number4 アプリケーション一覧とトランザクション情報を確認できるnumber5 TXトレース 一覧が表示されます。

number4アプリケーション一覧

チャートで選択された領域に該当するTXの数とエラーの数を確認できます。一覧からアプリケーションを選択すると、該当アプリケーションのnumber5TXトレース一覧に詳細が表示されます。

number5TXトレース一覧

TXトレース一覧には詳細情報が含まれています。一覧からトランザクションを選択すると、トランザクション情報画面が表示されます。トランザクション情報画面から該当トランザクションのトレース分析を確認できます。詳細については、次の文書を参照してください。

ヒットマップパターンを理解する

ヒットマップは、トランザクションの終了時間をX軸、レスポンス時間をY軸とした分布チャートです。通常のWebアプリケーションは、数秒以下の集中分布を表示します。

hitmap-pattern

ヒットマップラインの分析

  • 縦線(LOCK現象) パターン

    トランザクション処理中に一時的なロック(Notonly DB Lock)が発生すると処理が待機されます。ロックが解除されると、処理待機中のトランザクションは同じ時間帯で同時に終了します。これにより、次のように垂直線が作成されます。

    hitmap-lock

    垂直パターンでロックを検知することは非常に強力な概念です。特にマイクロサービスアーキテクチャでは、バックエンドシステムで発生するロックについても同様に検知できます。

    hitmap-front-api-db

    Frontアプリケーションのレスポンスパターンの縦線は、バックエンドシステムが使用するDBでロックが発生した場合も検知されます。

  • 横線(タイムアウト) パターン

    10秒のタイムアウト条件でリソースが不十分な場合、トランザクションは10秒間待機後にタイムアウトエラーが発生します。この時点で、ヒットマップの約10秒後に、次のような横線が作成されます。

    hitmap-timeout

    タイムアウト後に再実行するロジックがある場合は、図のような横線が10秒単位で繰り返されます。以下は、実際のトラブル状況のヒットマップです。

    hitmap-error

    (1) セクションでレスポンス時間が増加し、(2) セクションの赤い線は典型的な横線パターンです。(1) セクションの負荷によりConnectionPoolが使い果たされ、(2) セクションはConnectionPoolの不足で2回目のタイムアウトトラブルが発生した状態です。

パターン分析活用

トランザクションレスポンスの分布に線が表示されている場合は、ボトルネックがあることを意味します。一時的なロッキングの場合は縦線が作成され、ボトルネックがタイムアウトになると横線が作成されます。

hitmap-pattern-analysis

問題を分析する際に特定のラインに含まれるトランザクションのみを選択的に分析して、問題をすばやく発見できます。

機械学習ベースの応答パターン分析

機械学習技術によりヒットマップパターンを分析し、異常を自動検知してアラートを発報する機能です。

Machine learning analytics

異常パターンの例

毎月数百TBのパフォーマンスデータから異常パターンを学習し、学習した異常パターンと同様のパターンが発生するとアラートを発報します。

  • 縦線パターン

    hitmap-abnormal1

  • 横線パターン

    hitmap-abnormal2

  • 複合パターン

    hitmap-abnormal3

  • ヒットマップ通知

    hitmap ai alert

ノート

ヒットマップTXチャートを分析する方法については、次の文書を参照してください。

例外処理(WARNING) の基準

Node.jsアプリケーション環境で発生するエラーをNode.jsエージェントが例外処理する基準について案内します。Node.jsエージェントは、次の基準の場合にのみエラー処理を行います。

  • Status Code 400以上のエラー処理

  • HTTP callエラー処理

  • WhaTapで定義したエラー処理

サービス画面でのエラー表示

hitmap, Trace analysis

ヒットマップウィジェット、トレース分析画面から確認できるエラーレベルは、殆どWARNINGレベルに該当します。

Status Code 400以上のエラー処理

HTTP応答コードが400以上の場合は、例外クラス(Exception Class)が発生しなくてもエラーとして処理します。以下は、HTTPステータスコードベースのエラー処理の有効可否を設定するエージェントオプションです。

whatap.conf
transaction_status_error_enable=true
ノート

transaction_status_error_enableオプションの詳細については、次の文書を参照してください。

HTTP callエラー処理

HTTP呼び出し中に発生するエラーは、SLOW_HTTPChttpc errorなどの形で表示されます。

WhaTapで定義したエラー処理

WhaTapモニタリングサービスでは、特定の条件に従ってエラーとして処理します。

  • TOO_MANY_RECORDS:fetch件数10,000件以上

    関連するエージェントオプションについては、次の文書を参照してください。profile_error_sql_fetch_max=10000

  • SLOW_SQL:SQL時間30,000ms以上

    関連するエージェントオプションについては、次の文書を参照してください。profile_error_sql_time_max=30000

  • SLOW_HTTPC:HTTP call経過時間が10,000ms以上

    関連するエージェントオプションについては、次の文書を参照してください。profile_error_httpc_time_max=10000

  • httpc error:HTTP call status code 400以上の場合

    ノート

    httpc errorはエージェント設定なしで自動収集します。

  • status error:トランザクションstatus code 400以上の場合

    関連するエージェントオプションについては、次の文書を参照してください。transaction_status_error_enable=true

トランザクションエラー段階のINFO処理

エージェント設定により、一部のエラーを正常な状態で表示または無視できます。ヒットマップウィジェットで表示されるレベルは、INFO(青)です。

次の条件に該当する場合、エラー処理は行われません。

  • transaction_status_error_enableオプションの値がfalseである場合

    whatap.conf
    # default true
    transaction_status_error_enable=false
  • status_ignoreオプションに定義したトランザクションのステータスコードである場合

    whatap.conf
    # Separated by commas(,)
    status_ignore=400,404,500
  • status_ignore_setオプションに定義した特定トランザクションのURLとステータスコードの組み合わせの場合

    whatap.conf
    # URL:StatusCode
    status_ignore_set=/api/posts/test/timeout:200,/error:500
  • httpc_status_ignoreオプションに定義したHTTPステータスコードの場合

    whatap.conf
    # Separated by commas(,)
    httpc_status_ignore=400,404,500
  • httpc_status_ignore_setオプションに定義したURLとHTTPステータスコードの組み合わせの場合

    whatap.conf
    httpc_status_ignore_set=/api/posts/test/timeout:408,/api/apache/httpclient/posts/timeout:500
ノート