쿠버네티스 지표

쿠버네티스에서 수집되는 지표 일부는 서버 모니터링, 애플리케이션과 동일합니다.

컨테이너(`container`) 지표

container 카테고리는 컨테이너의 pod에 설정된 모든 사용자 정의 라벨들을 태그로 수집합니다.

대상: 클러스터 프로젝트, 네임스페이스 프로젝트
수집 간격: 5초
통계 데이터: 5분

Tags

태그명	설명	비고
agentOid	노드 에이전트 고유 ID	고유값
agentPcode	프로젝트 코드	고유값
command	실행 명령어	-
containerId	컨테이너 ID	고유값
containerKey	컨테이너 Key	-
created	컨테이너가 생성된 TimeStamp	-
image	컨테이너 이미지명	-
imageHash	이미지 해시 값	-
imageId	이미지 ID	-
k8s-app	Pod의 레이블 k8s-app에 대한 값	-
microOid	컨테이너에 설치된 와탭 APM 에이전트의 고유 ID	-
name	컨테이너 이름	-
namespace	컨테이너가 소속된 네임스페이스	-
namespaceHash	컨테이너가 소속된 네임스페이스 해시 값	-
okind	컨테이너에 설치된 와탭 APM 에이전트에 지정한 OKIND 고유 ID	-
okindName	컨테이너에 설치된 와탭 APM 에이전트에 지정한 OKIND 이름	-
oname	컨테이너에 설치된 와탭 APM 에이전트 이름	-
onode	컨테이너가 작동 중인 노드 에이전트의 고유 ID	-
onodeName	컨테이너가 작동 중인 노드 이름	-
podHash	컨테이너의 Pod 해시 값	-
podName	컨테이너의 Pod 이름	-
replicaSetHash	컨테이너의 레플리카셋 해시 값	-
replicaSetName	컨테이너의 레플리카셋 이름	-
whatap_project	컨테이너가 속한 와탭 프로젝트 이름	-

Fields

필드명	단위	설명 (Shortname, Name, Description)
blkio_rbps	바이트	IoReadBytes
		Container Block I/O Read Byte
		컨테이너 전체 블럭 디바이스의 초당 읽은 바이트 합
blkio_riops	건수	IoReadIops
		Container Block I/O Read IOPS
		컨테이너 전체 블럭 디바이스의 초당 읽은 건수 합
blkio_wbps	바이트	IoWriteBytes
		Container Block I/O Write Byte
		컨테이너 전체 블럭 디바이스의 초당 쓴 바이트 합
blkio_wiops	건수	IoWriteIops
		Container Block I/O Write IOPS
		컨테이너 전체 블럭 디바이스의 초당 쓴 건수 합
cpu_per_quota	퍼센트	CpuByLimit
		Container CPU Usage by Limit (%)
		CPU Limit 기준 CPU 전체 사용률
cpu_quota	밀리 코어	CpuLimit
		Container CPU Limit (core)
		컨테이너 CPU Limit 할당량 Limit 미설정인 경우 컨테이너가 작동 중인 해당 노드의 CPU 전체 코어가 밀리코어 단위로 표시된다.
cpu_quota_percent	퍼센트	CpuLimitByNode
		Container CPU Limit by Node (%)
		노드 CPU 대비 컨테이너 CPU Limit 할당량 Limit 미설정인 경우 컨테이너가 작동 중인 해당 노드의 CPU 전체 코어가 퍼센트로 표시된다.
cpu_sys	퍼센트	CpuSysByNode
		Container CPU Sys Usage by Node (%)
		노드 CPU 대비 컨테이너 CPU System 사용률
cpu_throttledperiods	건수	CpuThrottledCnt
		Container CPU Throttling Count
		컨테이너 CPU Throttled 건수
cpu_throttledtime	나노세컨드	CpuThrottledTime
		Container CPU Throttling Time
		컨테이너 CPU Throttled 시간
cpu_total	퍼센트	CpuByNode
		Container CPU Usage by Node (%)
		노드 CPU 대비 컨테이너 CPU 사용률
cpu_total_milli	밀리코어	CpuTotUsage
		Container CPU Usage (millicore)
		컨테이너 CPU 사용량
cpu_user	퍼센트	CpuUserByNode
		Container CPU User Usage by Node (%)
		노드 CPU 대비 컨테이너 CPU User 사용률
cpu_request	밀리코어	CpuRequest
		Container CPU Request (core)
		컨테이너 CPU 요청
cpu_per_request	퍼센트	CpuByRequest
		Container CPU Usage by Request (%)
		컨테이너 CPU 요청 대비 사용률 = cpu_total_milli / cpu_request * 100
mem_failcnt	건수	MemFailCnt
		Container Memory Failure Count
		컨테이너 메모리 Limit 도달 건수
mem_limit	바이트	MemLimit
		Container Memory Limit (byte)
		컨테이너 메모리 Limit 크기
mem_maxusage	바이트	MemMaxUsage
		Container Memory Max Usage (byte)
		컨테이너 메모리 최대 사용량 기록 값
mem_percent	퍼센트	MemWsByLimit
		Container Memory Working Set by Limit (%)
		컨테이너 메모리 Limit 기준 working set 사용량 = mem_working_set / mem_limit * 100
mem_totalcache	바이트	MemTotCache
		Container Memory Total Cache (byte)
		컨테이너 전체 캐시 크기
mem_totalpgfault	횟수	MemTotPageFaultCnt
		Container Memory Total Page Fault Count
		컨테이너 Page Fault 횟수
mem_totalrss	바이트	MemTotRss
		Container Memory Total RSS (byte)
		컨테이너 RSS 메모리 전체 크기
mem_totalrss_percent	퍼센트	MemTotRssByLimit
		Container Memory Total RSS by Limit (%)
		컨테이너 RSS 메모리 전체 사용률
mem_totalunevictable	바이트	MemTotUnevictable
		Container Memory Total Unevictable (byte)
		컨테이너 Unevictable Memory 전체 크기
mem_usage	바이트	MemUsage
		Container Memory Usage (byte)
		컨테이너 메모리 사용량
mem_working_set	바이트	MemWs
		Container Memory Working Set (byte)
		컨테이너 메모리 working set = mem_usage - inactive file
mem_working_set_percent	퍼센트	MemWsByLimit
		Container Memory Working Set by Limit (%)
		컨테이너 메모리 Limit 기준 working set 사용량 = mem_working_set / mem_limit * 100
mem_request	바이트	MemRequest
		Container Memory Request (byte)
		컨테이너 메모리 Request 크기
mem_per_request	퍼센트	MemWsByRequest
		Container Memory Working Set by Request (%)
		컨테이너 메모리 Request 기준 working set 사용량 = mem_working_set / mem_request * 100
network_rbps	바이트	NetRxBytes
		Container Network Receive Byte
		컨테이너 전체 블럭 디바이스의 초당 읽기 바이트 합
network_rdropped	바이트	NetRxDropped
		Container Network Receive Dropped
		컨테이너 네트워크 수신 dropped 건수
network_rerror	바이트	NetRxError
		Container Network Receive Error
		컨테이너 네트워크 수신 에러 건수
network_riops	바이트	NetRxIops
		Container Network Receive IOPS
		컨테이너 네트워크 수신 건수
network_wbps	바이트	NetTxByes
		Container Network Transmit Byte
		컨테이너 네트워크 송신 데이터 크기
network_wdropped	건수	NetTxDropped
		Container Network Transmit Dropped
		컨테이너 네트워크 송신 dropped 건수
network_werror	건수	NetTxError
		Container Network Transmit Error
		컨테이너 네트워크 송신 에러 건수
network_wiops	건수	NetTxIops
		Container Network Transmit IOPS
		컨테이너 네트워크 송신 건수
node_cpu	퍼센트	ConNodeCpu
		Container Work Node CPU Usage (%)
		컨테이너가 실행 중인 노드의 CPU 사용량
node_mem	퍼센트	ConNodeMem
		Container Work Node Memory Usage (%)
		컨테이너가 실행 중인 노드의 메모리 사용량
phase	문자열	Pod 라이프사이클 ① PENDING ② RUNNING ③ SUCCEEDED ④ FAILED ⑤ UNKNOWN
restart_count	정수	ConRestartCnt
		Container Restart Count
		컨테이너 다시 시작 횟수
state	정수	ConState
		Container Current State
		컨테이너 상태 코드 ① RUNNING = 114 ② PAUSE = 112 ③ RESTARTING = 101 ④ OOMKILLED = 111 ⑤ DEAD = 100 ⑥ WAITING = 119
status	문자열	ConStatus
		Container Current Status
		컨테이너 상태 정보 ① running 상태: uptime 정보 표시 ② waiting/terminated 상태: 상태에 대한 reason 정보 표시

쿠버네티스 노드(`kube_node`) 지표

kube_node 카테고리는 노드에 설정된 모든 사용자 정의 라벨들을 태그로 수집합니다.

대상: 클러스터 프로젝트, 네임스페이스 프로젝트
수집 간격: 5초
통계 데이터: 5분, 1시간

Tags

태그명	설명	비고
nodeName	노드 이름	-

Fields

필드명	단위	설명	비고
allocatable_cpu	밀리 코어	노드 할당 가능한 CPU량	-
allocatable_memory	바이트	노드 할당 가능한 메모리량	-
allocatable_pods	정수	노드 할당 가능한 Pod 수	-
limit_cpu	밀리 코어	노드 CPU Limit 합계	-
limit_memory	바이트	노드 메모리 Limit 합계	-
pods	정수	노드 Pod 총개수	-
request_cpu	밀리 코어	노드 CPU Request 합계	-
request_memory	바이트	노드 메모리 Request 합계	-

쿠버네티스 이벤트(`kube_event`) 지표

kube_event 카테고리는 클러스터 프로젝트의 경우 클러스터 전체를 대상으로 데이터를 수집하며 네임스페이스 프로젝트는 해당 네임스페이스에서 발생한 이벤트에 대해서만 수집합니다.

대상: 클러스터 프로젝트, 네임스페이스 프로젝트
수집 간격: 5초
통계 데이터: 5분, 1시간

Tags

태그명	설명	비고
field_path	Field Path	-
kind	종류	이벤트가 발생한 오브젝트 종류
name	오브젝트 이름	이벤트가 발생한 쿠버네티스 오브젝트 이름
namespace	네임스페이스 이름	이벤트가 발생한 네임스페이스
reason	이벤트 발생 사유	-
type	이벤트 유형	Warning 또는 Normal
uid	UID	이벤트가 발생한 오브젝트

Fields

필드명	단위	설명	비고
action	문자열	액션 이름	-
count	건수	이벤트 발생 건수	-
event_time	정수	이벤트 최초 발생 TimeStamp	-
first_timestamp	정수	이벤트 최초 발생 시간	-
last_timestamp	정수	이벤트 마지막 발생 시간	-
message	문자열	이벤트 메시지	-
reasonFiled	문자열	이벤트 Reason	-
reporting_component	문자열	현재 이벤트를 보고하는 컴포넌트	-
reporting_instance	문자열	현재 이벤트를 보고하는 인스턴스	-
series_last_observed_time	정수	series last observed time	-

쿠버네티스 클러스터(`kube_stat`) 지표

kube_stat 카테고리는 클러스터 프로젝트의 경우 클러스터 전체 대상으로 수집하고 네임스페이스 프로젝트는 해당 네임스페이스와 연관된 오브젝트를 대상으로만 수집합니다.

대상: 클러스터 프로젝트, 네임스페이스 프로젝트
수집 간격: 5초
통계 데이터: 5분, 1시간

Tags

태그명	설명	비고
name	kube_stat	고정 값

Fields

필드명	단위	설명	비고
alloctable_cpu	밀리 코어	클러스터 전체 코어 수	클러스터 프로젝트 Only
alloctable_ephemeral-storage	바이트	클러스터 전체 할당 가능한 ephemeral storage	클러스터 프로젝트 Only
alloctable_hugepages-1gi	바이트	클러스터 전체 할당 가능한 hugepages-1Gi	클러스터 프로젝트 Only
alloctable_hugepages-2mi	바이트	클러스터 전체 할당 가능한 hugepages-2Mi	클러스터 프로젝트 Only
alloctable_memory	바이트	클러스터 전체 할당 가능한 메모리	클러스터 프로젝트 Only
alloctable_pods	정수	할당 가능한 Pod 수	-
available_pod	정수	Phase가 Running 상태인 Pod의 수	-
desired_pod	정수	`metadata.ownerReferences` 없이 배포된 Pod 수와 쿠버네티스 오브젝트(ReplicaSet, Daemonset, StatefulSet)에 정의된 Desired Pod 수의 합	-
desired_pod	정수	`kubectl get pods -A`로 조회한 Pod 수와 동일	-
nodes	정수	노드 수	-
pod_phase_Pending	정수	Pending 상태 Pod 수	-
pod_phase_Running	정수	Running 상태 Pod 수	-
running_containers	정수	Running 컨테이너 수	-
stopped_containers	정수	Stopped 컨테이너 수	-
total_available_cpu	정수	할당 가능한 CPU 총합	-
total_available_memory	정수	할당 가능한 Memory 총합	-
total_limit_cpu	밀리 코어	Limit CPU 총합	-
total_limit_memory	바이트	Limit Memory 총합	-
total_request_cpu	밀리 코어	Request CPU 총합	-
total_request_memory	바이트	Request Memory 총합	-
unavailable_pod	정수	Phase가 Running 상태가 아닌(Pending, Failed, Succedded) Pod 수	-
waiting_containers	정수	Waiting Container 수	-

Pod(`kube_pod`) 지표

kube_pod 카테고리는 Pod에 설정된 모든 사용자 정의 라벨들을 태그로 수집합니다.

대상: 마스터(클러스터) 프로젝트, 네임스페이스 프로젝트
수집 간격: 5초
통계 데이터: 5분

Tags

태그명	설명	비고
agentOid	노드 에이전트 고유 ID	고유값
agentPcode	프로젝트 코드	고유값
command	실행 명령어	-
containerIds	Pod 에 속해있는 컨테이너 ID	-
containerIdsCount	containerIds 의 개수	-
containerKeys	Pod 에 속해있는 컨테이너 ID 의 해시 값	-
containerKeysCount	containerKeys 의 개수	-
DaemonSet	Pod의 DaemonSet 이름	-
Deployment	Deployment	-
k8s-app	Pod의 레이블 k8s-app에 대한 값	-
microOid	Pod 의 컨테이너 내부 애플리케이션에서 실행중인 에이전트의 id	-
microOids	Pod 안의 복수개 컨테이너 내부 애플리케이션에서 실행 중인 에이전트의 복수개 id	-
microOidsCount	microOids 의 개수	-
name	Pod 이름	-
onames	Pod 의 컨테이너 내부 애플리케이션에서 실행중인 에이전트의 명칭	-
onamesCount	onames 의 개수	-
podName	Pod 이름	-
namespace	Pod가 소속된 네임스페이스	-
namespaceHash	Pod가 소속된 네임스페이스 해시 값	-
replicaSetHash	Pod의 ReplicaSet 해시 값	-
replicaSetName	Pod의 ReplicaSet 이름	-
whatap_project	Pod가 속한 와탭 프로젝트 이름	-

Fields

필드명	단위	(Shortname, Name, Description)
blkio_rbps	바이트	IoReadBytes
		Pod Block I/O Read Byte
		Pod 전체 블럭 디바이스의 초당 읽은 바이트 합
blkio_riops	건수	IoReadIops
		Pod Block I/O Read IOPS
		Pod 전체 블럭 디바이스의 초당 읽은 건수 합
blkio_wbps	바이트	IoWriteBytes
		Pod Block I/O Write Byte
		Pod 전체 블럭 디바이스의 초당 쓴 바이트 합
blkio_wiops	건수	IoWriteIops
		Pod Block I/O Write IOPS
		Pod 전체 블럭 디바이스의 초당 쓴 건수 합
cpu_per_limit	퍼센트	CpuByLimit
		Pod CPU Usage by Limit (%)
		CPU Limit 기준 CPU 전체 사용률
cpu_per_request	퍼센트	CpuByRequest
		Pod CPU Usage by Request (%)
		CPU Request 기준 CPU 전체 사용률
cpu_quota_percent	퍼센트	CpuLimitByNode
		Pod CPU Limit by Node (%)
		노드 CPU 대비 Pod CPU Limit 할당량 Limit 미설정인 경우 Pod가 작동 중인 해당 노드의 CPU 전체 코어가 퍼센트로 표시된다.
cpu_sys	퍼센트	CpuSysByNode
		Pod CPU Sys Usage by Node (%)
		노드 CPU 대비 Pod CPU System 사용률
cpu_throttledperiods	건수	CpuThrottledCnt
		Pod CPU Throttling Count
		Pod CPU Throttled 건수
cpu_throttledtime	나노세컨드	CpuThrottledTime
		Pod CPU Throttling Time
		Pod CPU Throttled 시간
cpu_total	퍼센트	CpuByNode
		Pod CPU Usage by Node (%)
		노드 CPU 대비 Pod CPU 사용률
cpu_total_milli	밀리코어	CpuTotUsage
		Pod CPU Usage (millicore)
		Pod CPU 사용량
cpu_user	퍼센트	CpuUserByNode
		Pod CPU User Usage by Node (%)
		노드 CPU 대비 Pod CPU User 사용률
cpu_request	밀리코어	CpuRequest
		Pod CPU Request (core)
		Pod CPU 요청
cpu_per_request	퍼센트	CpuByRequest
		Pod CPU Usage by Request (%)
		Pod CPU 요청 대비 사용률 = cpu_total_milli / cpu_request * 100
mem_totalcache	바이트	MemTotCache
		Pod Memory Total Cache (byte)
		Pod 전체 캐시 크기
mem_totalpgfault	횟수	MemTotPageFaultCnt
		Pod Memory Total Page Fault Count
		Pod Page Fault 횟수
mem_totalrss	바이트	MemTotRss
		Pod Memory Total RSS (byte)
		Pod RSS 메모리 전체 크기
mem_totalrss_percent	퍼센트	MemTotRssByLimit
		Pod Memory Total RSS by Limit (%)
		Pod RSS 메모리 전체 사용률
mem_totalunevictable	바이트	MemTotUnevictable
		Pod Memory Total Unevictable (byte)
		Pod Unevictable Memory 전체 크기
mem_usage	바이트	MemUsage
		Pod Memory Usage (byte)
		Pod 메모리 사용량
mem_working_set	바이트	MemWs
		Pod Memory Working Set (byte)
		Pod 메모리 working set = mem_usage - inactive file
memory_request	바이트	MemRequest
		Pod Memory Request (byte)
		Pod 메모리 요청량
memory_limit	바이트	MemLimit
		Pod Memory Limit (byte)
		Pod 메모리 Limit 할당량
memory_per_request	퍼센트	MemByRequest
		Pod Memory Working Set By Request (%)
		Pod 메모리 요청량 기준 Working Set 사용량
memory_per_limit	퍼센트	MemByLimit
		Pod MMemory Working Set By Limit (%)
		Pod 메모리 Limit 기준 Working Set 사용량
network_rbps	바이트	NetRxBytes
		Pod Network Receive Byte
		Pod 전체 블럭 디바이스의 초당 읽기 바이트 합
network_rdropped	바이트	NetRxDropped
		Pod Network Receive Dropped
		Pod 네트워크 수신 dropped 건수
network_rerror	바이트	NetRxError
		Pod Network Receive Error
		Pod 네트워크 수신 에러 건수
network_riops	바이트	NetRxIops
		Pod Network Receive IOPS
		Pod 네트워크 수신 건수
network_wbps	바이트	NetTxByes
		Pod Network Transmit Byte
		Pod 네트워크 송신 데이터 크기
network_wdropped	건수	NetTxDropped
		Pod Network Transmit Dropped
		Pod 네트워크 송신 dropped 건수
network_werror	건수	NetTxError
		Pod Network Transmit Error
		Pod 네트워크 송신 에러 건수
network_wiops	건수	NetTxIops
		Pod Network Transmit IOPS
		Pod 네트워크 송신 건수
phase	문자열	Phase
		Pod Current Phase
		Pod 라이프사이클 ① PENDING ② RUNNING ③ SUCCEEDED ④ FAILED ⑤ UNKNOWN

다음 필드는 내부용으로 예약되었습니다.

필드명	설명	비고
kube_sless_normal	쿠버네티스 정보성 이벤트 발생 건수	-
kube_sless_warning	쿠버네티스 경고 이벤트 발생 건수	-
micro_sful_critical	apm 심각 상태 기반 이벤트 발생 건수	-
micro_sful_info	apm 정보성 상태 기반 이벤트 발생 건수	-
micro_sful_warning	apm 경고 상태 기반 이벤트 발생 건수	-
micro_sless_critical	apm 심각 무상태 이벤트 발생 건수	-
micro_sless_info	apm 정보성 무상태 이벤트 발생 건수	-
micro_sless_warning	apm 경고 무상태 이벤트 발생 건수	-
sful_critical	메트릭스 심각 상태 기반 이벤트 발생 건수	-
sful_info	메트릭스 정보성 상태 기반 이벤트 발생 건수	-
sful_warning	메트릭스 경고 상태 기반 이벤트 발생 건수	-
sless_critical	메트릭스 심각 무상태 이벤트 발생 건수	-
sless_info	메트릭스 정보성 무상태 이벤트 발생 건수	-
sless_warning	메트릭스 경고 무상태 이벤트 발생 건수	-

쿠버네티스 Pod 통계(`kube_pod_stat`) 지표

kube_pod_stat 카테고리 클러스터 프로젝트는 클러스터 전체를 대상으로 데이터를 수집하며 네임스페이스 프로젝트는 해당 네임스페이스에 소속된 Pod에 대해서만 수집합니다.

대상: 클러스터 프로젝트, 네임스페이스 프로젝트
수집 간격: 5초
통계 데이터: 5분, 1시간

Tags

태그명	설명	비고
kind	유형	클러스터 프로젝트의 경우 cluster 고정 값을 가지며 네임스페이스 프로젝트의 경우 Deployment 또는 ReplicaSet에 대해서만 수집합니다.
name	쿠버네티스 자원 이름	클러스터 프로젝트는 name 값이 없으며 네임스페이스 프로젝트는 Deployment 또는 ReplicaSet의 이름입니다.

Fields

필드명	단위	설명	비고
available_pod	정수	Phase가 Running 상태인 Pod의 수	-
desired_pod	정수	`metadata.ownerReferences` 없이 배포된 Pod 수와 쿠버네티스 오브젝트(ReplicaSet, Daemonset, StatefulSet)에 정의된 Desired Pod 수의 합	-
desired_pod	정수	`kubectl get pods -A`로 조회한 Pod 수와 동일	-
limit_cpu	밀리 코어	CPU Limit 사용량	-
limit_memory	바이트	Memory Limit 사용량	-
request_cpu	밀리 코어	CPU Request 사용량	-
request_memory	바이트	Memory Request 사용량	-
running_container	정수	Running Container 수	-
stopped_container	정수	Stopped Container 수	-
waiting_container	정수	Waiting Container 수	-

쿠버네티스 Horizontal Pod Autoscaler(HPA)(`kube_hpa_stat`) 지표

와탭에서 사용하는 ClusterRole에 HPA가 추가되어야 지표 수집이 시작됩니다.

대상: 클러스터 프로젝트
수집 간격: 5초
통계 데이터: 5분, 1시간

Tags

태그명	설명	비고
name	HPA 이름	-

Fields

필드명	단위	설명	비고
currentReplicas	정수	현재 레플리카 수	-
desiredReplicas	정수	Desired 레플리카 수	-
lastScaleTime	정수	마지막으로 스케일이 변경된 TimeStamp	-
maxReplicas	정수	최대 레플리카 수	-
minReplicas	정수	최소 레플리카 수	-

프로세스(`kube_process`) 지표

노트

쿠버네티스 에이전트 1.7.12 버전 이상이 필요합니다. 에이전트 업데이트에 대한 자세한 내용은 다음 문서를 참조하세요.

노드에 존재하는 쿠버네티스 관련 프로세스를 모니터링할 때 수집됩니다.

대상: 클러스터 프로젝트, 네임스페이스 프로젝트
수집 간격: 5초
통계 데이터: 5분

Tags

태그명	설명	타입	비고
ppid	부모 프로세스 ID	String	/proc/[pid]/status::PPid
pid	프로세스 ID	String	/proc/[pid]/status::Pid
cmd1	명령어 이름	String	/proc/[pid]/status::Name
cmd2	명령어 라인(전체 명령어와 인자)	String	/proc/[pid]/cmdline
user	사용자 ID 또는 사용자 이름	String	/proc/[pid]/status::Uid
onodeName	프로세스의 노드 이름	String	컨테이너 시스템 환경변수 (`NODE_IP`)
createTime	프로세스 시작 시간	타임스탬프	/proc/uptime 통해 계산된 필드

Fields

필드명	설명	단위	타입	비고
cpu	CPU 사용률	퍼센트 (%)	float	/proc/[pid]/stat 을 통해 계산된 필드
memory	메모리 사용률	퍼센트 (%)	float	/proc/[pid]/statm 을 통해 계산된 필드
rss	실제 메모리 사용량 (Resident Set Size)	바이트 (B)	long	/proc/[pid]/status::VmRSS
uid	사용자 ID 또는 사용자 이름	-	String	/proc/[pid]/status::Uid
state	프로세스 상태	-	String	/proc/[pid]/status::State
SharedMemory	공유 메모리 크기	바이트 (B)	long	/proc/[pid]/statm 을 통해 계산된 필드
openFileDescriptors	프로세스가 열어둔 파일 디스크립터 수	-	int	/proc/[pid]/fd를 통해 계산된 필드
vmSize	가상 메모리 크기 (Virtual Memory Size)	바이트 (B)	long	/proc/[pid]/status의 VmSize
threads	프로세스가 생성한 스레드 수	-	int	/proc/[pid]/status의 Threads

Kubernetes 환경에서의 리눅스 프로세스 상태

리눅스에서 /proc/[pid]/status 파일의 State 필드가 프로세스의 현재 상태를 표시합니다. 각 상태 값의 의미는 다음과 같습니다.

코드	설명	상세 설명
R (Running)	실행 중	프로세스가 실행 중이거나 실행될 준비가 되어 있는 상태
S (Sleeping)	대기 중	인터럽트 가능한 수면 상태로, 대기 중이며 이벤트를 기다리고 있는 상태
D (Disk Sleep)	디스크 수면	인터럽트 불가능한 수면 상태로, 일반적으로 I/O 작업을 기다리는 중인 상태
R (Zombie)	좀비 상태	프로세스가 종료되었으나 아직 부모 프로세스가 종료 상태를 수집하지 않은 상태
T (Stopped)	중지	프로세스가 작업 제어 신호에 의해 중지된 상태 (SIGSTOP 등) 또는 디버거에 의해 중지된 상태
t (Tracing stop)	추적 중지	디버거에 의해 추적 중인 상태 (소문자 t로 표시됨)
X (Dead)	죽은 상태	프로세스가 죽은 상태 (일반적으로 보지 않음)
x (Dead)	죽은 상태	커널 쓰레드의 죽은 상태 (일반적으로 보지 않음)
K (WakeKill)	강제 종료	깨우기 신호를 무시하고 즉시 죽은 상태
W (Waking)	깨우기 중	깨우기 신호를 받아 깨워지는 중인 상태
I (Idle)	유휴 상태	커널 스레드가 유휴 상태 (일반적으로 유저 공간 프로세스에는 보이지 않음)

노트

Kubernetes는 컨테이너와 노드의 리소스를 효율적으로 관리하기 때문에, 컨테이너 내부에서 실행되는 다수의 프로세스가 실제로 대기 상태를 유지합니다. 이에 따라 대부분의 프로세스는 Sleeping 상태일 수 있습니다.

에이전트 상태(`agent_status_summary`) 지표

에이전트 상태와 관련한 지표를 10초 간격으로 수집한 카테고리입니다.

Fields

필드명	단위	설명	비고
`inActTime`	밀리초(ms)	에이전트가 비활성화된 상태로 유지된 시간	-
`isActive`	-	현재 에이전트의 활성 상태 여부	`true` / `false`
`isRestart`	-	에이전트가 재시작되었는지 여부	`true` / `false`
`lastActTime`	밀리초(ms)	마지막으로 에이전트가 활성화된 상태의 시각	`0`: 비활성화된 경우
`oid`	-	프로젝트에 포함된 각 에이전트의 고유 식별자	-
`oType`	-	에이전트 종류	`1`: 애플리케이션 에이전트 / `2`: `subType` 참조
`startTime`	밀리초(ms)	에이전트가 시작된 시점을 나타내는 타임스탬프	-
`subType`	-	에이전트 종류	`9`: 노드 에이전트 / `10`: 마스터 에이전트

Ingress(`kube_ingress`) 지표

노트

쿠버네티스 에이전트 1.7.13 버전 이상이 필요합니다. 에이전트 업데이트에 대한 자세한 내용은 다음 문서를 참조하세요.

Ingress 리소스에 대한 메타 데이터와 관련 정보를 모니터링할 때 수집됩니다.

대상: 클러스터 프로젝트, 네임스페이스 프로젝트
수집 간격: 30초
통계 데이터: 5분

Tags

태그명	설명	단위	타입
`ingressUid`	Ingress 리소스의 고유 ID	-	String
`ingressName`	Ingress 리소스의 이름	-	String
`ingressNamespace`	Ingress 리소스의 네임스페이스	-	String
`creationTimeMillis`	Ingress 리소스 생성 시간	밀리초(ms)	Long
`ingressClassName`	Ingress 클래스 이름	-	String
`ingressLoadBalancerIps`	Ingress 로드밸런서 IP	-	List

Fields

필드명	설명	단위	타입
`host`	Ingress 리소스가 수신하는 호스트 이름 (`*`인 경우 모든 호스트에 대해 적용됨)	-	List
`path`	특정 호스트 하위에서 요청 경로	-	List
`backendServiceName`	백엔드로 전달되는 서비스의 이름	-	List
`backendServicePort`	백엔드로 전달되는 포트 번호	-	List
`backendServiceUid`	백엔드로 전달되는 서비스의 uid	-	List
`pathType`	경로 일치 방식 (예, `Prefix`, `Exact`)	-	List

컨테이너(container) 지표​

Tags​

Fields​

쿠버네티스 노드(kube_node) 지표​

Tags​

Fields​

쿠버네티스 이벤트(kube_event) 지표​

Tags​

Fields​

쿠버네티스 클러스터(kube_stat) 지표​

Tags​

Fields​

Pod(kube_pod) 지표​

Tags​

Fields​

쿠버네티스 Pod 통계(kube_pod_stat) 지표​

Tags​

Fields​

쿠버네티스 Horizontal Pod Autoscaler(HPA)(kube_hpa_stat) 지표​

Tags​

Fields​

프로세스(kube_process) 지표​

Tags​

Fields​

Kubernetes 환경에서의 리눅스 프로세스 상태​

에이전트 상태(agent_status_summary) 지표​

Fields​

Ingress(kube_ingress) 지표​

Tags​

Fields​

컨테이너(`container`) 지표

Tags

Fields

쿠버네티스 노드(`kube_node`) 지표

Tags

Fields

쿠버네티스 이벤트(`kube_event`) 지표

Tags

Fields

쿠버네티스 클러스터(`kube_stat`) 지표

Tags

Fields

Pod(`kube_pod`) 지표

Tags

Fields

쿠버네티스 Pod 통계(`kube_pod_stat`) 지표

Tags

Fields

쿠버네티스 Horizontal Pod Autoscaler(HPA)(`kube_hpa_stat`) 지표

Tags

Fields

프로세스(`kube_process`) 지표

Tags

Fields

Kubernetes 환경에서의 리눅스 프로세스 상태

에이전트 상태(`agent_status_summary`) 지표

Fields

Ingress(`kube_ingress`) 지표

Tags

Fields