本文へスキップ

PostgreSQLメトリクス

データベース指標は、データベースの作業量とリソース使用量を包括的に収集します。 WhaTapモニタリングサービスは、継続的にメトリクスを収集してデータベースのボトルネックを特定し、性能問題の根本原因を特定するのに役立つデータを提供します。

その他のメトリクスに関する詳細については、次のリンクを参照してください。

agent_status_summary

エージェントの状態に関するメトリクスを10秒間隔で収集したカテゴリです。

Fields

FieldTypeUnitDescription
inActTime-ミリ秒(ms)エージェントが無効になったままの時間
isActiveBoolean-現在のエージェントの活性化状態
isRestartBoolean-エージェントが最近再起動したかどうか (true / false)
lastActTime-ミリ秒(ms)最後にエージェントが活性化された状態の時刻 (0: 非活性化された場合)
oid--プロジェクトに含まれる各エージェントの固有の識別子
startTime-ミリ秒(ms)エージェントが開始された時点でのタイムスタンプ

db_postgresql_counter

Tags

次はdb_postgresql_counterカテゴリに収集されるタグ値のガイドです。

タグ名説明備考
agentIpエージェントごとのIPアドレスです。-
dbIsMultiマルチテナント対応可否です。-
dbNameデータベース名です。-
dbTypeデータベースの種類です。-
dbVersion利用中のデータベースのバージョンです。-
onameエージェント名です。一意の値

Field

次はdb_postgresql_counterカテゴリに収集されるフィールド値のガイドです。

MetricsDescriptionCategory
active_sessions現在、活性化されているセッションの数です。Connection
CPUUtilizationデータベースインスタンスで使用中のCPUリソースの比率です。Performance
FreeStorageSpaceインスタンスの使用可能なストレージ空間です。I/O
FreeableMemoryシステムですぐに使用できるメモリの量です。I/O
NetworkReceiveThroughputインスタンスが受信するネットワークデータの速度です。Troughput
NetworkTransmitThroughputインスタンスから送信するネットワークデータの速度です。Troughput
blk_read_timeバックエンドでデータブロックを読み取るのにかかった時間(milisecond)です。I/O
blk_write_timeバックエンドでデータブロックを書き込むのにかかった時間(milisecond)です。I/O
blks_hitディスクブロックがすでにバッファキャッシュで検出され、読み取りが不要な合計回数です。I/O
blks_hit_ratio全体照会のうち、キャッシュで照会された割合(%)です。
算出方式:sum(blks_hit)/sum(blks_hit + blks_read) * 100
I/O
blks_readディスクで直接読み取ったデータブロックの数です。I/O
buffers_checkpointチェックポイントの間にフラッシュされたバッファ数です。Info
check_pointデータベースのチェックポイントの発生回数です。Troughput
checkpoint_write_timeチェックポイントの間、データを書き込むのにかかった時間(milisecond)です。Troughput
checkpoints_timedcheckpoint_timeoutの環境設定値によって発生したチェックポイントの数です。Troughput
commit_countトランザクションコミットの回数です。Troughput
confl_bufferpinバッファピンの衝突によるセッションの衝突回数です。Troughput
confl_deadlockデッドロックの衝突回数です。Troughput
confl_lockロック衝突によるセッション衝突の数です。Troughput
confl_snapshotスナップショットの衝突によるセッション衝突の回数です。Troughput
confl_tablespaceテーブルスペースの衝突によるセッション衝突の回数です。Troughput
conflictsデータベース復旧作業との競合エラーでキャンセルされたクエリの数です。Troughput
connect_errorデータベース接続失敗の回数です。Connection
deadlock_count発生したデッドロックの合計回数です。Performance
dml_countDML(データ操作言語) 作業の合計回数です。Troughput
fatal_countクリティカルなエラーが発生した回数です。Info
idle_trxアイドル状態のトランザクションの数です。Connection
idle_trx_timeアイドル状態のトランザクションの累積時間です。Connection
idx_scanインデックスLeafブロックに保存されているキーを利用してテーブルレコードにアクセスする方式です。 このメトリクスは、1分ごとに表示する値です。Performance
index_hit_ratioインデックスでキャッシュ照会された比率(%)です。Performance
lock_wait_sessionsロック待機中のセッションの数です。Performance
long_running_sessions長時間実行中のセッションの数です。Performance
max_connections許可された最大接続数です。 pg_settingsに設定された値で、この値が不足すると、'FATAL ERROR: too many clients already.' エラーが発生する可能性があります。Info
max_runtime最も長く実行されたクエリの実行時間です。Performance
node_stateReplication関係で構成されたデータベースであり、1:Master、2:Slaveを意味します。Info
numbackendsデータベースに接続されている現在のバックエンドプロセスの数です。Info
oldest_cur_xid最も古い現在のトランザクションIDです。Info
per_to_emergency_autovac非常自動vacuumの発生回数です。Performance
per_to_wraparoundトランザクションIDラップアラウンドの防止vacuum作業の回数です。Performance
replication_count有効になっているReplicationデータベース(Slave)の数です。Performance
replication_delay複製の遅延時間です。 Replication構造の場合、replicationデータベースに反映される遅延時間で、Slave DBで測定される指標です。Performance
replication_lag複製されたデータがソースデータに比べて遅れている程度です。Performance
rollback_countトランザクションのロールバック回数です。Performance
seq_scanテーブルをFull Scanしながらレコードを読み取る方式です。 インデックスが存在しない、またはインデックスが存在しても読み取り範囲が広い場合に選択します。 このメトリクスは、1分ごとに表示する値です。Performance
table_hit_ratioテーブルでキャッシュ照会された割合です。Performance
temp_bytesデータベースのクエリによって一時ファイルに記録された合計バイト数です。Performance
temp_filesデータベースでクエリとして生成された一時ファイルの数です。Performance
total_runtimeすべてのクエリの合計実行時間です。Performance
total_sessions現在接続されているセッションの合計数です。Connection
tps1秒当たりのトランザクション処理件数です。Performance
tup_deletedデータベースでクエリによって削除されたタプルの数です。Troughput
tup_fetchedデータベースからクエリに読み込まれたタプルの数です。Troughput
tup_insertedデータベースでクエリによって挿入されたタプルの数です。Troughput
tup_returnedデータベースのクエリから返されたタプルの数です。Troughput
tup_updatedデータベースでクエリによって更新されたタプルの数です。Troughput
uptimeデータベースが実行中の時間です。Info
vacuum_running_count現在実行中のvacuum作業の数です。Performance
wait_sessions待機状態のセッションの数です。Performance
wal_count記録されたWAL(Write-Ahead Logging) 項目の数です。 WALファイル数の急増は、一般的に短期間で多数の変更や一時テーブルおよびオブジェクトを生成するvacuumと類似したメンテナンス作業が原因で発生します。 これはゆっくりと正常レベルに戻る必要があります。 これにより、通常、ディスクI/OとCPUのアクティビティが多くなり、正常に戻るまでアプリケーションクエリの実行速度が遅くなります。 このメトリクスは、1分ごとに表示する値です。Performance
warning_count警告が発生した回数です。Info

XOS関連メトリクス

XOSエージェントから収集されるメトリクスについての説明です。

MetricUnitDescription
cpu(xos)pctCPU使用率
cpu_user + cpu_sys + cpu_iowaitの合計
cpu_idle(xos)pctCPUが遊休状態の時間
cpu_iowait(xos)pctCPUがI/O作業を待機した時間
cpu_sys(xos)pctCPUがカーネルコードの実行に使用された時間
cpu_user(xos)pctCPUがユーザーコードの実行に使用された時間
disk_read_bytes(xos)バイトディスクから読み取ったデータ量
disk_reads(xos)blockディスクで読み取られたブロック数
disk_write_bytes(xos)バイトディスクに記録されたデータ量
disk_writes(xos)blockディスクに記録されたブロック数
mem(xos)pctメモリ使用率
mem_available(xos)MB使用可能なメモリサイズ
mem_buffcache(xos)MBbuff/cache用途に使用中のメモリサイズ
mem_free(xos)MB使用していないメモリサイズ
mem_swapfree(xos)MB未使用のスワップ領域サイズ
スワップはディスク領域を使用するため、使用時に性能が低下する可能性がある
mem_swaptotal(xos)MB全体スワップ(Swap)サイズ
物理メモリ不足時に使用
mem_total(xos)MB全体メモリのサイズ
mem_used(xos)MB使用中のメモリサイズ
net_recv_bytes(xos)バイトネットワークから受信したデータ量
net_recv_packets(xos)countネットワークから受信したパケット数
net_send_bytes(xos)バイトネットワークで送信したデータ量
net_send_packets(xos)countネットワークで送信したパケット数