쿠버네티스 에이전트 옵션 설정
-
와탭 쿠버네티스 에이전트 배포 시 컨테이너
env
필드를 통해 설정할 수 있습니다. -
컨테이너 내부 whatap.conf 파일을 수정해 설정할 수 있습니다.
-
whatap.conf 파일 내 옵션이 컨테이너
env
필드에 설정된 옵션보다 높은 우선순위를 가집니다. -
whatap.conf 또는 컨테이너
env
에 설정된 값이 없는 경우 기본값이 사용됩니다.
컨테이너 내 애플리케이션 에이전트 옵션 설정
컨테이너 내 Java, Python, Node.js 등 애플리케이션의 모니터링을 위해 필요 설정을 whatap.conf 파일에 작성합니다. whatap.conf 파일을 통해 설정할 수 있는 옵션에 대한 자세한 내용은 다음 링크를 참조하세요.
컨테이너별 옵션 설정
whatap-node-helper
-
collect_volume_detail_enabled bool
기본값
true
노드 에이전트에서 모든 컨테이너에 대한
exec df
명령어를 이용해 컨테이너 볼륨 정보 조회를 활성화합니다. 노드에 실행 중인 모든 컨테이너의 스토리지 사용량 및 볼륨 정보를 수집하는 기능을 활성화합니다. -
inject_container_id_to_apm_agent_enabled bool
기본값
true
와탭 APM 컨테이너에
exec
를 이용한 container ID 주입을 활성화합니다. 와탭 APM으로 식별되는 컨테이너의 ID를 자동으로 추출합니다. 이를 APM 도구에 주입해 성능 모니터링 데이터와 컨테이너를 연결할 수 있습니다. -
debug bool
기본값
false
디버그 모드의 활성화 여부를 설정합니다. 디버그 모드 활성화 시 로그 레벨을
DEBUG
로, 그렇지 않을 경우INFO
로 설정합니다. -
kube_config_path string
기본값
~/.kube/config
Kubernetes 설정 파일 경로를 지정합니다. 미설정 시~/.kube/config 를 사용합니다.
-
log_sys_out bool
기본값
true
로그 시스템 출력을 설정합니다. 옵션 값을
true
로 설정 시 표준 출력(stdOut)과 파일에 동시에 로깅을 남깁니다. 변경 시 로깅 시스템에 즉시 반영됩니다. -
collect_kube_node_process_metric_enabled bool
기본값
true
노드에서 Kubernetes 관련 프로세스 모니터링을 활성화하거나 비활성화하는 플래그입니다.
true
로 설정하면 모니터링이 활성화되고,false
로 설정하면 모니터링이 비활성화됩니다. -
collect_kube_node_process_metric_target_list list
기본값
"kubelet,containerd-shim,containerd,docker,dockerd,crio,metrics-server, coredns,aws-k8s-agent,kube-proxy"
기본적으로 Kubernetes 관련 프로세스를 모니터링합니다. 사용자가 특정 프로세스 리스트를 수정하여 임의로 모니터링할 프로세스를 설정할 수 있습니다.
노트와탭에서 기본 설정된 모니터링 대상 프로세스 목록
-
kubelet
각 노드에서 실행되는 컨트롤러로, 컨테이너의 상태를 지속적으로 모니터링하며 Kubernetes 마스터와 통신하여 워크로드가 올바르게 스케줄링되고 실행되도록 합니다. 컨테이너 상태 체크 및 노드 자원 관리를 담당합니다.
-
containerd
컨테이너 실행을 위한 고성능 컨테이너 런타임입니다. 이미지 관리, 컨테이너 생성 및 실행, 네트워킹 등을 처리합니다.
-
dockerd
Docker 컨테이너의 생성을 관리하는 주요 프로세스입니다. 이 프로세스는 컨테이너 이미지의 빌드, 배포, 실행, 네트워크 및 데이터 관리를 포함합니다.
-
crio
Kubernetes를 위해 설계된 경량화된 컨테이너 런타임으로, CRI(Container Runtime Interface)를 구현하여 컨테이너 워크로드를 효율적으로 관리합니다.
-
coredns
Kubernetes 클러스터 내부에서 DNS 서비스를 제공하는 프로세스로, 클러스터 내 서비스에 대한 네임 리졸루션을 처리합니다. 또한 서비스 디스커버리 및 로드 밸런싱 기능을 수행하며, 클러스터 내 서비스 간 통신을 원활하게 지원합니다.
-
aws-k8s-agent
AWS 환경에서 Kubernetes 네트워크 인터페이스(VPC CNI)를 관리하는 에이전트입니다. 이 프로세스는 포드 간 통신을 위해 AWS 네트워크 자원(ENI)을 할당하고 해제하는 역할을 합니다. 문제가 발생하면 네트워크 연결 장애나 리소스 할당 오류가 발생할 수 있습니다.
-
kube-proxy
Kubernetes 클러스터 내에서 네트워크 트래픽을 라우팅하는 프로세스입니다. 이 프로세스는 각 노드에서 실행되며, 서비스와 포드 간의 통신을 가능하게 합니다. 또한 iptables 혹은 IPVS와 같은 리눅스 네트워킹 기술을 사용하여 클러스터 내부의 요청을 올바른 포드로 전달합니다. 이를 통해 Kubernetes 클러스터 내의 서비스 디스커버리 및 로드 밸런싱을 지원합니다.
-
kube-apiserver
Kubernetes API 서버로, 클러스터의 모든 요청을 처리하고 리소스 상태를 관리하는 중앙 구성 요소입니다. 인증, 권한 부여, 애드미션 컨트롤 등 클러스터의 전반적인 요청 처리를 담당합니다.
-
etcd
Kubernetes 클러스터 상태 정보를 저장하는 분산 키-값 데이터베이스입니다. 클러스터의 상태 저장 및 복구에 중요한 역할을 합니다.
-
kube-controller
여러 컨트롤러를 관리하고 실행하는 프로세스로, 클러스터 리소스의 상태를 유지하고 자동화 작업을 수행합니다. 노드 및 파드 상태 관리, 레플리케이션 유지 등 다양한 역할을 담당합니다.
-
kube-scheduler
클러스터에서 파드를 적절한 노드에 배치하는 역할을 합니다. 파드의 요구 사항과 각 노드의 상태를 고려하여 최적의 노드를 선택합니다.
-
whatap-node-agent
-
shutdown bool
기본값
false
수집 서버와 연결을 강제로 중단합니다. 통신 중지를 의미합니다.
-
license string
프로젝트에 발급된 라이센스를 사용해 에이전트를 식별합니다.
-
whatap.server.host string
기본값
13.124.11.223
혹은13.209.172.35
수집 서버의 IP를 설정합니다.
delimiter
의 경우/:
을 사용합니다. -
whatap.server.port number
기본값
6600
수집 서버의 데이터 수신 Port를 설정합니다.
-
ONODE_NAME string
기본값
NODE_NAME
orNODE_IP
환경 변수값에이전트 노드 식별을 위한 이름을 설정합니다.
-
tcp_connection_timeout number
기본값
3000
whatap-master-agent와 수집 서버 소켓 연결 시 타임아웃 시간을 설정합니다.
-
tcp_so_timeout number
기본값
60000
소켓 연결 후 데이터 송수신 타임아웃 시간을 설정합니다.
-
debug bool
기본값
false
디버그 모드의 활성화 여부를 설정합니다.
-
gpuEnabled bool
기본값
false
GPU 모니터링의 활성화 여부를 설정합니다.
-
count_interval number
기본값
5000
메트릭스(
kube_pod
,container
)를 수집 서버에 전송하는 주기를 설정합니다. 기본값의 단위는 ms입니다.노트해당 옵션은 화면상 데이터 갱신 주기에 영향을 줄 수 있습니다. 자세한 내용은 다음 메트릭스별 영향을 받는 화면 구성요소를 참고하세요.
-
collect_interval number
기본값
5000
에이전트가 apiserver에 요청해 메트릭스(
kube_pod
,container
)를 수집하는 주기를 설정합니다.노트해당 옵션은 화면상 데이터 갱신 주기에 영향을 줄 수 있습니다. 자세한 내용은 다음 메트릭스별 영향을 받는 화면 구성요소를 참고하세요.
-
collect_apiserver_metric_by_leader bool
기본값
false
해당 옵션이 활성화 된 경우 노드 에이전트는 메트릭 수집을 마스터 에이전트에 위임합니다. whatap-master-agent의
collect_apiserver_metric_by_leader
옵션 활성화 선행이 필요합니다. 메트릭 수집 위임을 통해 기존 whatap-node-agent가 발생시킨 apiserver 부하를 낮출 수 있습니다.
whatap-control-plane-helper
-
port string
기본값
9496
whatap-control-plane-helper의 웹 서버 포트를 설정합니다.
-
cycle number
기본값
5
control-plane-helper가 지표를 스크래핑하는 주기를 설정합니다. 기본값의 단위는 s입니다.
-
collect_control_plane_monitoring_enabled bool
기본값
false
control-plane-monitoring 기능의 활성화 여부를 설정합니다.
-
kube_config_path string
기본값
~.kube/config
Kubernetes 설정 파일 경로를 지정합니다. 미설정 시 ~/.kube/config 를 사용합니다.
-
kube_master_url string
기본값
~/.kube/config
스크래핑을 위해 요청할 control-plane 의 url을 설정합니다. 미설정 시 ~/.kube/config 를 사용합니다.
-
debug bool
기본값
false
whatap-control-plane-helper의 디버깅(로깅)의 활성화 여부를 설정합니다.
-
kube_client_tls_verify bool
기본값
true
옵션값을
false
로 설정하면 TLS 인증을 강제하지 않고, 인증 절차를 생략할 수 있습니다.
whatap-master-agent
-
shutdown bool
기본값
false
수집 서버와 연결을 강제로 중단합니다. 통신 중지를 의미합니다.
-
license string
프로젝트에 발급된 라이센스를 사용해 에이전트를 식별합니다.
-
whatap.server.host string
기본값
13.124.11.223
혹은13.209.172.35
수집 서버의 IP를 설정합니다.
delimiter
의 경우/:
을 사용합니다. -
whatap.server.port number
기본값
6600
수집 서버의 데이터 수신 Port를 설정합니다.
-
tcp_connection_timeout number
기본값
3000
whatap-master-agent와 수집 서버 소켓 연결 시 타임아웃 시간을 설정합니다.
-
tcp_so_timeout number
기본값
60000
whatap-master-agent와 수집 서버 소켓 통신 시 타임아웃 시간을 설정합니다.
-
debug bool
기본값
false
whatap-master-agent에서
DEBUG
레벨 로깅 활성화 여부를 설정합니다. -
collect_apiserver_metric_by_leader bool
기본값
false
whatap-master-agent가 스크래퍼의 리더로 동작 활성화 여부를 설정합니다. 활성화 시 whatap-master-agent 단독으로 apiserver에 메트릭을 요청합니다.
-
collect_control_plane_monitoring_enabled bool
기본값
false
컨트롤 플레인 모니터링 기능의 활성화 여부를 설정합니다.
-
master_to_control_plane_connection_timeout number
기본값
5000
whatap-master-agent가 whatap-control-plane-helper와 통신 시 connection timeout이 발생할 때까지의 시간을 설정합니다. 기본값의 단위는 ms입니다.
-
master_to_control_plane_read_timeout number
기본값
20000
whatap-master-agent가 whatap-control-plane-helper와 통신 시 read timeout이 발생할 때까지의 시간을 설정합니다. 기본값의 단위는 ms입니다.
-
control_plane_debug bool
기본값
false
컨트롤 플레인 모니터링에 대한 whatap-master-agent에서의 모든 디버그 로그 기능의 활성화 여부를 설정합니다.
-
store_k8s_object_manifest_enabled bool
기본값
true
오브젝트 매니페스트 수집 기능의 활성화 여부를 설정합니다. 활성화 시 하루에 한번 클러스터 오브젝트들의 매니페스트 정보를 수집합니다.
-
store_k8s_object_manifest_timezone string
기본값
UTC
오브젝트 매니페스트 수집을 위한 타임존을 설정합니다. 별도 설정이 없을 경우 기본값 UTC 기준 자정에 수집을 시작합니다.
예, 한국 시간 기준으로 자정에 실행하고 싶을 경우
GMT+9
혹은Asia/Seoul
과 같이 타임존 설정 -
store_k8s_object_manifest_max_fetch_limit number
기본값
50
한 번에 수집할 오브젝트의 조회 개수를 설정합니다. 별도 설정이 없을 경우 기본값
50
기준으로 1회 요청당 50개씩 요청합니다.예, 전체 Pod 개수가 90개인 클러스터에서 해당 옵션
30
설정 시 Pod 정보를 30개씩 3회 요청
메트릭스별 영향을 받는 화면 구성요소
kube_pod
-
대시보드 > 컨테이너 맵
다음 예시 이미지의 Pod 뷰 기준 데이터는
kube_pod
메트릭스 수집 주기 및 수집 서버 전송 주기에 영향을 받습니다. -
워크로드 > Pod 목록
다음 예시의 데이터는
kube_pod
메트릭스 수집 주기 및 수집 서버 전송 주기에 영향을 받습니다. -
대시보드 > 퍼포먼스 요약
kube_pod
메트릭스를 이용하는 에이전트 설치 노드에서 실행 중인 Pod 수 차트 갱신 주기에 영향을 받습니다.
container
-
대시보드 > 컨테이너 맵
다음 예시의 컨테이너 뷰 기준 화면 데이터 갱신 주기는
container
메트릭스의 영향을 받습니다. -
컨테이너 > 컨테이너 이미지
다음 예시의 데이터는
container
메트릭스의 영향을 받습니다. -
대시보드 > 퍼포먼스 요약
container
메트릭스를 이용하는 다음 차트의 갱신 주기에 영향을 받습니다.-
에이전트 설치 노드에서 실행 중인 컨테이너 수
-
에이전트 설치 노드 수
-
Total Container CPU Request
-
Total Container CPU Usage
-
Node CPU
-
Node Memory
-
Container CPU Usage by Request
-
Container CPU Usage by Node
-
Container Memory Working Set by Request
-
Container Memory Failure Count
-
Container CPU Throttling Time
-
Container Network Receive Byte
-
Container Network Transmit Byte
-
-
클러스터 > 노드 상세
다음 예시의 노드 상세 화면에서 컨테이너 목록의 갱신 주기는
container
메트릭스의 영향을 받습니다.