본문으로 건너뛰기

주요 메뉴 알아보기

와탭 에이전트 설치를 완료했다면 와탭 모니터링 서비스에 로그인하세요. 와탭 모니터링 서비스는 원활한 서비스 제공과 안정적 운영, 이상 징후 감시 및 파악을 위한 정보를 제공합니다.

쿠버네티스에는 마이크로 서비스를 효율적으로 운영할 수 있는 다양한 기능이 포함되어 있습니다. 컴퓨팅 리소스를 효율적으로 사용하기 위한 스케줄링 기능과 애플리케이션 업데이트를 위한 배포 기능, 컨테이너 실행에 필요한 스토리지와 네트워크 관리 등 서비스 운영에 필요한 모든 기능을 제공합니다.

모니터링 서비스는 사용자가 쿠버네티스를 운영하는 모든 과정에 도움을 주고자 합니다. 실시간으로 문제 상황을 감시하여 장애 상황을 알리고 문제를 해결에 도움을 주는 모니터링의 기본적인 기능 뿐만 아니라, 자원을 분배하고 인프라 비용을 절약하고자 하는 운영 업무 시, 또는 쿠버네티스로 통합된 여러 마이크로 서비스와 이와 관련된 업무 부서 간 협업 도구로서 모니터링 서비스를 활용할 수 있습니다.

쿠버네티스의 활용성이 다양한만큼 운영 환경과 비지니스 상황에 따라 사용자의 모니터링 니즈도 다양합니다. 이를 위해 와탭의 모니터링 서비스는 애플리케이션 트랜잭션과 리소스 사용량, 로그와 이벤트 등 쿠버네티스가 관리하거나 생산하는 모든 정보를 수집하고 통합적으로 관제할 수 있는 기능을 제공합니다.

실시간 모니터링

  • 멀티 클라우드, 하이브리드 클라우드 상의 쿠버네티스 통합 모니터링
  • 컨테이너 맵 - 노드(호스트), 컨테이너, 애플리케이션, 로그, 이벤트 정보를 제공하는 동적 대시보드
    • Namespace, Deployment, ReplicaSet, Pod 등의 쿠버네티스 구성요소를 개별 / 그룹화하여 표시
    • 개별 대상 / 사용자 지정 그룹 별 정보 실시간 확인
      • 컨테이너 상태 및 핵심 리소스 지표별 실시간 상태를 3단계 색상으로 구분 (Normal, Warning, Critical)
      • 컨테이너에 할당된 CPU Limit, Request 및 실 사용량 (core)
      • 컨테이너에 할당된 Memory Limit, Request 및 실 사용량 (MiB, GiB)
      • 컨테이너가 사용 중인 Disk I/O, Network I/O 정보
      • 히트맵 기반 애플리케이션 모니터링
      • Pod / 컨테이너 내에서 발생 중인 Stdout/Stderr 정보
      • 컨테이너 / 애플리케이션 로그 기간별 검색
      • 컨테이너 / 애플리케이션에 사용자가 지정한 경고
      • 쿠버네티스 클러스터 내 이벤트 정보
  • 리소스 모니터링 - 컨테이너 및 노드 상세 모니터링
    • 컨테이너
      • 전체 컨테이너 목록 및 사용률 현황
      • 개별 컨테이너의 CPU, Memory, Disk(Volume), Network 사용률
      • 컨테이너에 연결된 볼륨 정보
    • 노드
      • 전체 노드 목록 및 사용률 현황
      • 개별 노드(호스트)의 CPU, Memory, Disk, Network 사용률
  • 애플리케이션 모니터링 - 쿠버네티스 상에서 컨테이너화된 애플리케이션 모니터링
    • 지원 애플리케이션 : Java. Node.js, Python
    • 필터링을 이용한 특정 애플리케이션 모니터링
    • 진행중 트랜잭션 정보, 종료된 트랜잭션 정보 모니터링
    • 애플리케이션 그룹 및 개별 애플리케이션의 TPS 및 응답시간 추이
    • 5분간 집계된 사용자 수 추이
  • 쿠버네티스 마스터 메타 정보 확인
    • ETCD에 저장된 마스터 메타 정보를 와탭 콘솔 상에서 확인 가능
    • 주요 쿠버네티스 구성요소 리스트 및 각 구성요소 몇 상세 스펙(YAML) 정보

성능 분석

  • 쿠버네티스 Pod 피크 사용량 및 초기화 시간
  • 기간별 Out of Memory 발생 컨테이너 정보 및 메모리 차트
  • 애플리케이션(APM)과 동일 기능
    • 메트릭스 차트
    • MSA 분석
    • 스택

이벤트 알림

  • 이메일, 문자, SNS(Telegram, Slack) 발송
  • 이벤트 지속 기간 및 임계치 설정에 의한 이벤트 발생
  • 무음 설정 시간 등록에 의한 동일 이벤트 알림 억제 기능
  • CPU, Memory, Disk 알림 기능
  • 실시간 트랜잭션 개수 임계치 설정에 의한 알림
  • 트랜잭션 에러 개수 임계치 설정에 의한 알림
  • 응답시간 임계치 초과 트랜잭션 개수에 의한 알림
  • 응답시간 분포의 가로 및 세로 분포 패턴에 의한 알림

통계 및 보고

  • 일간/주간 보고서 : 실시간 사용자, TPS, 응답시간, CPU 추이 등
  • 월간 보고서
    • 실시간 사용자, TPS, 응답시간, CPU 추이 등
    • 일간 방문자 수 추이, 월간 방문자 수, 고객 충성도 지표
  • 애플리케이션 단위 일간 보고서
  • 애플리케이션 피크 성능 비교 보고서 : 전일, 전주 피크 타임과의 비교
  • Pod 별 주간 CPU, Memory 보고서