Pod 시작 분석

홈 화면 > 프로젝트 선택 > 분석 > Pod 시작 분석

노트

와탭 노드 에이전트 버전 1.4.2 이상에서 지원합니다. 해당 버전 미만인 경우 기존 메뉴(구 Pod 초기화 성능) 화면을 제공합니다.

원활한 클러스터 운영을 위해 Pod가 안정적으로 동작하기까지의 성능을 분석하고 Pod에 할당된 리소스 크기를 최적화할 필요가 있습니다. Pod 시작 분석 메뉴는 Pod가 시작한 후 약 5분 동안의 변화를 추적합니다. Pending 상태에서 Running 상태로, 그리고 안정적인 Stable Running 상태로 이어지는 3단계 구간의 자원 사용량을 분석해 리소스 할당량을 최적화할 수 있습니다.

이를 통해 운영자는 자원 효율성 향상 및 비용 절감, 확장성 향상, 스케일 용이성 등의 이점을 얻을 수 있습니다.

기본 화면 안내

Pod 시작 분석

상단 옵션 영역

상단 영역에서 다음과 같은 옵션을 활용할 수 있습니다.

새로 고침 아이콘을 선택해 영역의 Pod 목록을 다시 불러올 수 있습니다.
30일 이내 생성된 Pod만 표시 토글을 활성화해 영역의 Pod 목록에서 30일 이내의 Pod만을 조회할 수 있습니다.

노트
Pod 시작 분석 메뉴는 Pod 생성일로부터 최근 30일 이내의 범위 안에서 5분간의 Pod 시작 데이터를 분석합니다. 즉 생성 후 30일이 지난 Pod의 경우 시작 성능을 분석할 수 없습니다.
Pod 검색 입력창에 문자를 입력해 원하는 Pod를 검색할 수 있습니다.

Pod 목록 영역

영역에서 Pod 목록을 확인할 수 있습니다. Pod 목록이 펼쳐진 테이블의 헤더 컬럼은 다음의 정보를 포함하고 있습니다.

QoS Class: Pod의 Quality of Service를 의미합니다. QoS 클래스는 리소스 부족 시 Pod의 우선 순위를 결정합니다. 우선 순위가 높은 Pod가 우선 순위가 낮은 Pod보다 먼저 종료됩니다.
- Guaranteed: 노드에서 사용 가능한 리소스를 보장받고 다른 Pod보다 우선적으로 할당합니다. 가장 마지막에 종료됩니다.
  - Pod의 모든 컨테이너가 CPU 및 메모리 request를 가지고 있는 경우입니다.
  - Pod의 모든 컨테이너가 CPU 및 메모리 limit을 가지고 있으며 해당 값이 request와 동일한 경우입니다.
- Burstable: Pod는 노드 리소스가 부족한 경우에는 일부 리소스를 할당합니다.
  - Guaranteed 클래스의 조건을 충족하지 못하는 경우입니다.
  - Pod의 컨테이너 중 하나라도 CPU 및 메모리에 대한 request 또는 limit이 설정된 경우입니다.
- BestEffort: 리소스 request나 limit이 없기에 다른 Pod보다 우선 순위가 낮습니다. 가장 먼저 종료됩니다.
  - Pod의 모든 컨테이너가 CPU및 메모리에 대한 request와 limit이 없는 경우입니다.
Restart Count: Pod 내 컨테이너의 총 재시작 횟수입니다.
CPU/Memory Limits: Pod 내 컨테이너에 설정된 CPU/Memory Limits 총합(resources.limits)입니다.
CPU/Memory Requests: Pod 내 컨테이너에 설정된 CPU/Memory Requests 총합(resources.requests)입니다.
Start Time: Pod 생성 시각(metadata.startTime)입니다.

노트

QoS Class에 대한 자세한 내용은 다음 링크를 참조하세요.
Pod 및 컨테이너 리소스 관린에 대한 자세한 내용은 다음 링크를 참조하세요.

상세 보기 안내

영역 Pod 목록에서 분석을 원하는 항목의 가장 왼쪽에 상세 보기 버튼을 선택하세요. 선택한 Pod의 컨테이너별 시작 성능을 구간별로 분석한 내용을 다음과 같이 확인할 수 있습니다.

Pod 시작 분석

Pending: Pod를 생성한 후 Running 상태로 진입하는 구간입니다.
Running: Pod가 Pending 상태를 지나 안정화되기 전까지의 구간입니다.
Stable Running: Pod가 Running 상태를 지나 안정화된 구간입니다.

노트

안정화된 상태(Stable Running)

와탭에서는 Pod 생성 직후 약 5분 동안 컨테이너의 CPU Limit 대비 사용량의 평균을 계산합니다. 이 평균값보다 CPU 사용량이 적어지는 시점을 안정화 시작 상태라고 정의합니다.

상세 분석하기

5분 동안 한 컨테이너가 여러 번 재시작했다면 가장 처음 시작한 컨테이너의 정보만 표기합니다. 컨테이너별 재시작 횟수를 확인하세요. 재시작 횟수가 많다면 해당 컨테이너가 정상 실행되고 있는지 점검하세요.
Pending 구간이 길어진다면 Pod가 Running 상태로 진입하기까지 오랜 시간이 걸렸다는 의미입니다. Pod의 Pending 상태를 유발할 수 있는 요인이 있는지 점검해 보세요.

노트
Pod의 pending 상태에 대한 자세한 내용은 다음 링크를 참조하세요.
Running 구간이 길다면 Pod 내 컨테이너가 처음 실행될 때 리소스 사용량이 많은 구간이 있다는 의미입니다. 컨테이너 실행 과정에 문제가 없는지 살펴보세요.
전반적인 초기 자원 사용량이 많다면 컨테이너 리소스 요청 및 제한을 늘리는 것을 고려해 보세요.

기본 화면 안내​

상단 옵션 영역​

Pod 목록 영역​

상세 보기 안내​

상세 분석하기​

기본 화면 안내

상단 옵션 영역

Pod 목록 영역

상세 보기 안내

상세 분석하기