本文へスキップ

PostgreSQLメトリクス

データベース指標は、データベースの作業量とリソース使用量を包括的に収集します。 WhaTapモニタリングサービスは、継続的にメトリクスを収集してデータベースのボトルネックを特定し、性能問題の根本原因を特定するのに役立つデータを提供します。

その他のメトリクスに関する詳細については、次のリンクを参照してください。

agent_status_summary

エージェントの状態に関するメトリクスを10秒間隔で収集したカテゴリです。

Fields

フィールド名単位説明備考
inActTimeミリ秒(ms)エージェントが無効になったままの時間-
isActive-現在のエージェントの活性化状態true / false
isRestart-エージェントの再起動可否true / false
lastActTimeミリ秒(ms)最後にエージェントが活性化された状態の時刻0: 無効化された場合
oid-プロジェクトに含まれる各エージェントの固有の識別子-
startTimeミリ秒(ms)エージェントが開始された時点でのタイムスタンプ-

db_postgresql_counter

Tags

次はdb_postgresql_counterカテゴリに収集されるタグ値のガイドです。

タグ名説明備考
agentIpエージェントごとのIPアドレスです。-
dbIsMultiMultitenant対応可否です。-
dbNameデータベース名です。-
dbTypeデータベースの種類です。-
dbVersion利用中のデータベースのバージョンです。-
onameエージェント名です。ユニーク値

Field

次はdb_postgresql_counterカテゴリに収集されるフィールド値のガイドです。

MetricsDescriptionCategory
active_sessions現在、活性化されているセッションの数です。Connection
CPUUtilizationデータベースインスタンスで使用中のCPUリソースの比率です。Performance
FreeStorageSpaceインスタンスの使用可能なストレージ空間です。I/O
FreeableMemoryシステムですぐに使用できるメモリの量です。I/O
NetworkReceiveThroughputインスタンスが受信するネットワークデータの速度です。Troughput
NetworkTransmitThroughputインスタンスから送信するネットワークデータの速度です。Troughput
blk_read_timeバックエンドでデータブロックを読み取るのにかかった時間(milisecond)です。I/O
blk_write_timeバックエンドでデータブロックを書き込むのにかかった時間(milisecond)です。I/O
blks_hitディスクブロックがすでにバッファキャッシュで検出され、読み取りが不要な合計回数です。I/O
blks_hit_ratio全体照会のうち、キャッシュで照会された割合(%)です。
算出方式:sum(blks_hit)/sum(blks_hit + blks_read) * 100
I/O
blks_readディスクで直接読み取ったデータブロックの数です。I/O
buffers_checkpointチェックポイントの間にフラッシュされたバッファ数です。Info
check_pointデータベースのチェックポイントの発生回数です。Troughput
checkpoint_write_timeチェックポイントの間、データを書き込むのにかかった時間(milisecond)です。Troughput
checkpoints_timedcheckpoint_timeoutの環境設定値によって発生したチェックポイントの数です。Troughput
commit_countトランザクションコミットの回数です。Troughput
confl_bufferpinバッファピンの衝突によるセッションの衝突回数です。Troughput
confl_deadlockデッドロックの衝突回数です。Troughput
confl_lockロック衝突によるセッション衝突の数です。Troughput
confl_snapshotスナップショットの衝突によるセッション衝突の回数です。Troughput
confl_tablespaceテーブルスペースの衝突によるセッション衝突の回数です。Troughput
conflictsデータベース復旧作業との競合エラーでキャンセルされたクエリの数です。Troughput
connect_errorデータベース接続失敗の回数です。Connection
deadlock_count発生したデッドロックの合計回数です。Performance
dml_countDML(データ操作言語) 作業の合計回数です。Troughput
fatal_countクリティカルなエラーが発生した回数です。Info
idle_trxアイドル状態のトランザクションの数です。Connection
idle_trx_timeアイドル状態のトランザクションの累積時間です。Connection
idx_scanインデックスLeafブロックに保存されているキーを利用してテーブルレコードにアクセスする方式です。 このメトリクスは、1分ごとに表示する値です。Performance
index_hit_ratioインデックスでキャッシュ照会された比率(%)です。Performance
lock_wait_sessionsロック待機中のセッションの数です。Performance
long_running_sessions長時間実行中のセッションの数です。Performance
max_connections許可された最大接続数です。 pg_settingsに設定された値で、この値が不足すると、'FATAL ERROR: too many clients already.' エラーが発生する可能性があります。Info
max_runtime最も長く実行されたクエリの実行時間です。Performance
node_stateReplication関係で構成されたデータベースであり、1:Master、2:Slaveを意味します。Info
numbackendsデータベースに接続されている現在のバックエンドプロセスの数です。Info
oldest_cur_xid最も古い現在のトランザクションIDです。Info
per_to_emergency_autovac非常自動vacuumの発生回数です。Performance
per_to_wraparoundトランザクションIDラップアラウンドの防止vacuum作業の回数です。Performance
replication_count有効になっているReplicationデータベース(Slave)の数です。Performance
replication_delay複製の遅延時間です。 Replication構造の場合、replicationデータベースに反映される遅延時間で、Slave DBで測定される指標です。Performance
replication_lag複製されたデータがソースデータに比べて遅れている程度です。Performance
rollback_countトランザクションのロールバック回数です。Performance
seq_scanテーブルをFull Scanしながらレコードを読み取る方式です。 インデックスが存在しない、またはインデックスが存在しても読み取り範囲が広い場合に選択します。 このメトリクスは、1分ごとに表示する値です。Performance
table_hit_ratioテーブルでキャッシュ照会された割合です。Performance
temp_bytesデータベースのクエリによって一時ファイルに記録された合計バイト数です。Performance
temp_filesデータベースでクエリとして生成された一時ファイルの数です。Performance
total_runtimeすべてのクエリの合計実行時間です。Performance
total_sessions現在接続されているセッションの合計数です。Connection
tps1秒当たりのトランザクション処理件数です。Performance
tup_deletedデータベースでクエリによって削除されたタプルの数です。Troughput
tup_fetchedデータベースからクエリに読み込まれたタプルの数です。Troughput
tup_insertedデータベースでクエリによって挿入されたタプルの数です。Troughput
tup_returnedデータベースのクエリから返されたタプルの数です。Troughput
tup_updatedデータベースでクエリによって更新されたタプルの数です。Troughput
uptimeデータベースが実行中の時間です。Info
vacuum_running_count現在実行中のvacuum作業の数です。Performance
wait_sessions待機状態のセッションの数です。Performance
wal_count記録されたWAL(Write-Ahead Logging) 項目の数です。 WALファイル数の急増は、一般的に短期間で多数の変更や一時テーブルおよびオブジェクトを生成するvacuumと類似したメンテナンス作業が原因で発生します。 これはゆっくりと正常レベルに戻る必要があります。 これにより、通常、ディスクI/OとCPUのアクティビティが多くなり、正常に戻るまでアプリケーションクエリの実行速度が遅くなります。 このメトリクスは、1分ごとに表示する値です。Performance
warning_count警告が発生した回数です。Info

XOS関連メトリクス

次は、XOSエージェントから収集されるメトリクスについての説明です。

MetricUnitDescription
cpu(xos)pctCPU使用率、cpu_user + cpu_sys + cpu_iowaitの合計です。
cpu_user(xos)pctCPUがユーザーコードを実行する際にかかった時間です。
cpu_sys(xos)pctCPUがKernel codeを実行した時間です。
cpu_iowait(xos)pctCPUがIOを待機した時間です。
cpu_idle(xos)pctCPUプロセッサのアイドルタイムです。
disk_reads(xos)blockディスクから読み取ったデータの量です。
disk_read_bytes(xos)バイトディスクから読み取ったデータの量です。
disk_writes(xos)blockディスクに書き込んだデータの量です。
disk_write_bytes(xos)バイトディスクに書き込んだデータの量です。
mem(xos)pctメモリ使用率です。
mem_total(xos)MB全体のメモリ量です。
mem_free(xos)MBシステムで使用していないメモリの量です。
mem_used(xos)MBシステムで使用しているメモリ量です。
mem_buffcache(xos)MBbuff/cacheで使用中のメモリ量です。
mem_swaptotal(xos)MBSwap全体サイズ、物理メモリが不足している場合に備えて設定します。
mem_swapfree(xos)MBSwapの未使用領域、Swap領域はディスク領域が解放されるため、Swapを使用している場合は、システム性能が大幅に低下する可能性があります。
mem_available(xos)MBメモリの可用領域です。
net_recv_bytes(xos)バイトネットワークで受信されたデータの量です。
net_recv_packets(xos)-ネットワークで受信されたデータパケットの数です。
net_send_bytes(xos)バイトネットワークで送信したデータの量です。
net_send_packets(xos)-ネットワークに送信したデータパケットの数です。