주요 기능 추가 및 개선 사항
2026년 1분기
적용 버전: Service 2.25.X ~ 2.27.X
와탭 서비스는 1분기에 LLM부터 데이터베이스, 인프라 영역까지 기능을 확장했습니다. 단순한 기능 추가를 넘어, 개별 지표가 아닌 전체 흐름을 기준으로 시스템을 분석할 수 있도록 분석 방식이 강화되었습니다.
LLM Observability 출시
LLM Observability는 LLM 기반 애플리케이션의 요청 흐름을 트랜잭션 단위로 수집하고, 성능, 비용, 토큰 사용량, 에러를 통합적으로 분석할 수 있는 기능입니다. 기존 APM에서는 확인하기 어려웠던 LLM 요청 흐름과 응답 품질 문제까지 함께 분석할 수 있습니다.
-
사용자 요청부터 응답 생성까지 전체 호출 흐름을 트랜잭션으로 시각화
-
응답 시간, 호출 횟수, 비용 및 토큰 사용량 분석
-
프롬프트 로그와 응답 데이터를 기반으로 문제 요청 추적
-
모델별 토큰 사용량 기반 비용 구조 및 사용 패턴 분석
-
GPU 지표와 연계해 LLM 성능 저하와 인프라 영향 관계 분석
특히, 시스템 지표에는 문제가 없지만 응답 품질이 저하되는 경우에도 LLM 요청 흐름과 GPU 사용 패턴을 함께 분석하여 문제 원인을 파악할 수 있습니다. 또한 응답 코드가 정상(200 OK)이더라도 사용자 관점에서 응답 품질이 적절하지 않은 경우까지 분석할 수 있어, 기존 APM과 차 별화된 분석이 가능합니다. 현재 Python과 Java를 지원하며, 향후 Node 등 다양한 언어와 오픈텔레메트리 환경까지 지원할 예정입니다.
참고 문서
애플리케이션 AI 분석 기능 확장
애플리케이션(APM) 영역에서 AI 분석 기능이 확장되어, 스레드 분석에 이어 액티브 스택 분석(Beta)이 추가되었습니다. 기존에는 성능 이슈 발생 시 로그, 트랜잭션, 메트릭을 사람이 직접 비교해야 했지만, 이제는 AI가 스파이크 원인과 해당 트랜잭션을 자동으로 연결해 보여줍니다.
-
성능 이상 발생 시점의 트랜잭션을 AI가 자동 분석
-
스택 덤프 기반 병목 구간 식별 및 심각도(High/Medium/Low) 분류
-
데드락, 락 경합, I/O 대기 등 주요 성능 이슈 자동 감지
-
우선순위 기반 개선 방향 제시
실행 흐름의 상위 수준부터 세부 실행 단위까지 AI 기반으로 분석할 수 있어, 복잡한 스택 분석 경험이 없는 사용자도 원인 파악과 대응 방향을 빠르게 확인할 수 있습니다. 프롬프트 로그를 통해 문제가 될 수 있는 프롬프트나 토큰 이상 요청을 확인하고, 해당 프롬프트에서 트랜잭션 상세 화면으로 바로 이동해 분석을 이어갈 수 있습니다.
데이터베이스 모니터링 개선
멀티 인스턴스 및 시각화 강화
기존에는 단일 인스턴스 중심의 제한적인 모니터링이었다면, 이제는 멀티 인스턴스 환경에서도 다양한 방식으로 데이터를 확인할 수 있습니다.
-
여러 인스턴스를 하나의 화면에서 다양한 차트 형태로 통합 모니터링
-
다양한 위젯을 활용한 자유로운 대시보드 구성
-
CPU, 메모리 게이지 차트 등 직관적인 시각화 지원
SQL 분석, Top SQL 중심으로 통합
기존 SQL 통계가 개별 SQL 중심이었다면, 이제는 Top SQL 중심으로 통합되어 성능에 영향을 주는 쿼리를 보다 빠르게 식별할 수 있습니다.
-
수행 시간, 트렌드, 웨이트 정보 통합 제공
-
실행 계획 및 플랜 히스토리로 변경 이력 비교
-
바인드 값 기반 SQL 재현으로 문제 상황 분석