본문으로 건너뛰기

메트릭스 경고 알림

홈 화면 > 프로젝트 선택 > 경고 알림 > 이벤트 설정 > 메트릭스 탭 선택

메트릭스 이벤트란?

메트릭스 이벤트는 기본 이벤트(애플리케이션 이벤트, 서버 이벤트 등)보다 구체적이고 복잡한 이벤트를 설정할 때 사용합니다. 프로젝트에서 실시간으로 수집 중인 메트릭스 데이터를 기반으로 이벤트를 설정할 수 있습니다. 사용에 따라 두 가지 설정 방법 중 하나를 선택해 이벤트를 설정할 수 있습니다.

  • 메트릭스 이벤트
  • 복합 메트릭스 이벤트
노트
  • 메트릭스에 대한 자세한 내용은 다음 문서를 참조하세요.

  • 새로운 UI를 적용하여 사용자 편의성이 강화된 이벤트 설정 New 메뉴에서 메트릭스 이벤트를 추가할 수 있습니다. 자세한 내용은 다음 문서를 참조하세요.

  • 알림 설정 권한이 있는 멤버만 이용할 수 있습니다. 멤버 권한에 대한 자세한 설명은 다음 문서를 참조하세요.

메트릭스 이벤트

경고 알림 > 이벤트 설정 메뉴에서 화면 위에 메트릭스를 선택하세요. 화면 오른쪽 위에 이벤트 추가를 선택하세요. 메트릭스 이벤트 창이 나타납니다.

메트릭스 이벤트

기본 정보 입력

  • 이벤트명: 추가하려는 이벤트 이름을 입력하세요.

  • 이벤트 활성화: 이벤트를 활성화 여부를 선택하세요.

  • 템플릿: 만들어진 템플릿을 선택해 빠르고 쉽게 이벤트를 설정할 수 있습니다. 템플릿을 사용하지 않을 경우 사용 안 함을 선택하세요.

  • 카테고리: 메트릭스 데이터를 구분하는 단위입니다. 메트릭스 이벤트 설정 시 필수 선택 값입니다.

    메트릭스 이벤트 - 카테고리

    • 카테고리 선택 옵션에는 이름 데이터 수집 간격, 정보를 표시합니다. 이벤트 설정 시 해당 카테고리의 키 값을 사용합니다.

    • 카테고리는 최근 3시간 범위 내 프로젝트에서 수집 중인 메트릭스 데이터를 조회해 목록에 표시합니다. 카테고리 선택 옵션에 수집 간격이 표시되지 않는 경우 직접 입력하기 옵션을 선택해 카테고리 키를 입력할 수 있습니다.

  • 레벨
    • 이벤트 발생 시 경고 수준을 나타냅니다. Critical, Warning, Info 수준으로 나눕니다. Critical, Warning 레벨 설정 시 이벤트 상태가 해소되면 추가 알림 선택 옵션이 활성화됩니다.

    • 이벤트 상태가 해소되면 추가 알림: 이벤트 항목 중 발생한 이벤트 상태가 해소되면 추가 알림 송신 여부를 선택할 수 있습니다. 토글 버튼을 선택해 기능을 켜거나 끌 수 있습니다.

  • 메시지
    • 이벤트 발생 시 출력하는 알림 메시지를 입력합니다. ${Tag} 또는 ${Field} 입력으로 메시지에 변수를 적용할 수 있습니다. 변수에 입력할 키는 선택한 메트릭스 데이터 카테고리에 포함된 값이여야 합니다. 메트릭스 조회 메뉴에서 입력할 수 있는 태그 또는 필드키를 확인할 수 있습니다.

      Message example

    • 시간 아이콘 버튼을 클릭하면 이전에 입력한 메시지 기록을 확인할 수 있습니다.

  • 수신 테스트

    필수 항목인 이벤트명, 카테고리, 레벨, 메시지 정보를 기준으로 알림을 발생시켜 메시지를 점검하는 기능입니다.

    노트
    • 테스트 중에는 실제 메트릭스 값이나 변수에 대한 치환 기능이 작동하지 않습니다.

    • 이벤트 수신 옵션에서 수신자 태그가 설정된 사용자에게만 테스트 알림을 보냅니다. 전체 수신을 선택했다면 모든 사용자에게 테스트 알림을 보냅니다.

    • 수신 테스트를 이용하려면 필수 항목(이벤트명, 카테고리, 레벨, 메시지)에 값을 입력하거나 선택해야 합니다.

  • 이벤트 발생 조건

    이벤트 발생 조건

    지시선 4 필드, 지시선 5 연산자 선택, 지시선 6 임계값을 입력해 이벤트 발생 조건을 설정하세요.

  • 이벤트 대상 필터링

    이벤트 대상 필터링

    지시선 7 태그, 지시선 8 연산자 선택, 지시선 9 필터링값을 입력해 대상을 필터링합니다. 입력값이 없을 경우 전체 에이전트를 대상으로 경고 알림을 보냅니다.

노트
  • 이벤트 발생 조건이벤트 대상 필터링에서 사용할 수 있는 기본 문법과 연산자 목록은 다음 문서를 참조하세요.

  • 이벤트 발생 조건이벤트 대상 필터링 옵션은 선택 입력 또는 직접 입력 옵션을 선택할 수 있습니다.

  • 이벤트 설정 내용이 저장된 이후에는 해당 옵션값은 직접 입력 옵션으로 관리합니다. 이후 선택 입력 옵션으로 전환하면 옵션값이 초기화될 수 있습니다.

  • 이벤트 발생 조건과 대상 입력 시 특수 문자(~!@#$%^&*()_+=-[]`)를 포함하거나 숫자로 시작하는 필드명을 입력하면 오류가 발생할 수 있습니다. 이런 경우 직접 입력 옵션을 선택한 다음 예시와 같이 중괄호(${})로 묶어서 입력하세요.

    ${4xxErrorType} == '401'

이벤트 수신 설정

이벤트 수신 설정

  • 발생 횟수: 선택한 시간 동안 이벤트 발생 조건에서 설정한 이벤트가 입력 횟수만큼 발생하면 경고 알림을 보냅니다.

    노트
    • 선택 시간을 사용 안 함으로 설정하면 입력한 횟수만큼 연속 발생할 때 알림을 보냅니다.
    • 이벤트 상태가 해소되면 추가 알림 옵션을 활성화한 경우 선택 시간은 사용 안 함으로 선택할 것을 권장합니다.
    • 카테고리 옵션에서 선택한 항목의 수집 주기는 5초입니다.
  • 이벤트 발생 일시 중지: 과도한 경고 알림 발생을 방지할 수 있는 옵션입니다. 첫번째 경고 알림 이후 선택한 시간 동안 경고 알림을 보내지 않습니다. 또한 이벤트 기록 메뉴에 기록되지 않습니다.

  • 관련 카테고리: 관련 카테고리를 5개까지 설정하고 알림 조회 시 참조합니다.

  • 이벤트 수신 태그: 이벤트 수신 태그를 선택하면 해당 태그를 가진 프로젝트 멤버와 3rd-party 플러그인에 알림을 전송할 수 있습니다. 이벤트 수신 태그를 선택하지 않으면 프로젝트 전체 멤버에게 경고 알림을 보냅니다.

    노트

    경고 알림 > 이벤트 수신 설정 메뉴에서 프로젝트 멤버와 3rd-party 플러그인에 태그를 설정할 수 있습니다.

알림 규칙 테스트

경고 알림 테스트

선택한 시간 동안 설정한 이벤트 조건을 실행해 몇 번의 경고 알림이 발생했는지 확인할 수 있습니다. 실행 버튼을 선택하면 오른쪽 상단에 알림 발생 건수 정보가 표시됩니다. 이벤트 발생 조건에서 선택한 필드와 임계치를 차트상에 표시합니다.

노트
  • 이벤트 발생 조건에 대한 자세한 내용은 다음 문서를 참조하세요.

  • 알림 규칙 테스트 기능은 최대 24시간 동안의 데이터를 기준으로 테스트할 수 있습니다.

복합 메트릭스 이벤트

복합 메트릭스 이벤트를 이용하려면 다음의 개념에 대한 이해가 필요합니다.

복합 메트릭스 이벤트는 메트릭스 데이터에 보다 복잡한 규칙을 활용해 이벤트를 생성하고 경고 알림을 보낼 수 있습니다. 복합 메트릭스은 다음과 같은 상황에서 효과적으로 사용할 수 있습니다.

  • 여러 에이전트에서 수신된 데이터에 대해 종합적인 이벤트 판정을 해야할 때
  • 과거 데이터와 현재 데이터를 비교해 이벤트 판정을 해야할 때

메트릭스 이벤트는 에이전트로부터 메트릭스를 수신할 때마다 이벤트 판정을 합니다. 반면, 복합 메트릭스 이벤트는 각 에이전트에서 수집한 메트릭스들을 데이터베이스에 저장합니다. 그리고 다시 조회해서 이벤트 판정을 합니다. 이와 같은 특성 때문에 여러 에이전트의 데이터를 종합적으로 활용하거나 과거의 데이터를 활용할 수 있습니다. 하지만 MXQL이라는 와탭 고유의 데이터 조회 언어를 사용해야한다는 진입장벽이 존재합니다. 따라서 사용자들이 기초적인 MXQL만 이해하더라도 효과적으로 이벤트를 설정할 수 있도록 이벤트 템플릿을 제공합니다. MXQL 기초 사용자는 이벤트 대상 필터링과 이벤트 조건에 대한 쿼리만 수정해서 이벤트를 적용할 수 있습니다.

  1. 경고 알림 > 이벤트 설정 메뉴에서 화면 위에 메트릭스를 선택하세요.

  2. 복합 메트릭스 섹션에서 오른쪽에 이벤트 추가를 선택하세요.

  3. 복합 메트릭스 창이 나타나면 차트로 생성하기를 선택하세요.

이벤트 설정 창이 나타납니다.

복합 메트릭스 이벤트 설정

노트

복합 메트릭스에 이벤트 템플릿에 대한 자세한 내용은 다음 문서를 참조하세요.

이벤트 데이터 조회

복합 메트릭스 이벤트는 메트릭스 데이터 질의 언어인 MXQL을 기반으로 이벤트 조건을 생성합니다. 차트로 생성하기 기능은 MXQL의 자동완성을 위한 콤보박스 기능을 제공합니다. 이벤트 데이터를 조회하여 차트를 구성한 다음 이벤트 발행 조건을 직접 입력하기 위한 템플릿입니다. 위젯 또는 텍스트 옵션을 선택해 이벤트를 설정하세요.

시계열 차트를 구성하는 옵션을 통해 이벤트 설정 시 사용할 MXQL을 자동완성할 수 있습니다.

이벤트 데이터 조회

  • 필터: 이벤트 조건 대상을 선택합니다. 연산식, 태그, 필터링값을 입력해 필터링 조건을 생성합니다.

    필터

  • 그룹화: 그룹화된 메트릭스 데이터를 선택합니다. 다중 선택할 수 있습니다.

  • 타임 유닛: 그룹화된 데이터를 나눌 시간 기준을 설정합니다. , , 시간 단위로 선택하고 설정할 수 있습니다.

  • 필드: 이벤트 발행 조건에 사용할 필드를 선택합니다. 다중 선택할 수 있습니다.

알림

경고 알림 설정의 기본 정보를 입력합니다.

  • 이벤트 활성화: 토글 버튼을 클릭해 이벤트를 활성활 여부를 선택할 수 있습니다.

  • 레벨: 위험(Critical), 경고(Warning), 정보 수준 중 하나의 레벨을 선택하세요.

    이벤트 상태가 해소되면 추가 알림: 이벤트 항목 중 발생한 이벤트 상태가 해소되면 추가 알림 송신 여부를 선택할 수 있습니다. 토글 버튼을 선택해 기능을 켜거나 끌 수 있습니다.

  • 제목: 경고 알림의 제목을 입력하세요.

  • 메시지: 이벤트 발생 시 출력하는 알림 메시지를 입력합니다. ${Tag} 또는 ${Field} 입력으로 메시지에 변수를 적용할 수 있습니다. 변수에 입력할 키는 선택한 메트릭스 데이터 카테고리에 포함된 값이여야 합니다. 메트릭스 조회 메뉴에서 입력할 수 있는 태그 또는 필드키를 확인할 수 있습니다.

    Message example

알림 정책

경고 알림을 보낼 조건을 입력합니다.

  • 데이터 조회 범위: 이벤트 조건에 사용할 MXQL의 실시간 데이터 조회 범위를 설정합니다. 이벤트 데이터 조회에 포함된 필드만 사용할 수 있습니다.

    복합 메트릭스 이벤트는 DB에 저장된 메트릭스를 조회해서 활용합니다. 따라서 데이터를 조회할 시간 범위를 먼저 지정해야 합니다. 데이터 조회 시간을 5분으로 선택하면 최근 5분동안 수집된 데이터를 조회해서 이벤트 발생 조건을 확인합니다. 최근 데이터에 대해서 이벤트를 설정할 때에는 짧게, 넓은 시간에 대해서 통계적으로 접근하고 싶을 때에는 길게 설정할 수 있습니다.

  • 조건: MXQL에 반영한 필드와 연산 규칙, 임계치를 입력합니다.

부가 정보

경고 알림 수신과 관련한 부가적인 옵션을 설정합니다.

  • 인터벌: 선택한 시간 간격으로 알림 조건을 확인합니다.

  • 무음: 과도한 경고 알림 발생을 방지할 수 있는 옵션입니다. 첫번째 경고 알림 이후 선택한 시간 동안 경고 알림을 보내지 않습니다. 또한 이벤트 기록 메뉴에 기록되지 않습니다.

  • 이벤트 수신 태그: 이벤트 수신 태그를 선택하면 해당 태그를 가진 프로젝트 멤버와 3rd-party 플러그인에 알림을 전송할 수 있습니다. 이벤트 수신 태그를 선택하지 않으면 프로젝트 전체 멤버에게 경고 알림을 보냅니다.

    노트

    경고 알림 > 이벤트 수신 설정 메뉴에서 프로젝트 멤버와 3rd-party 플러그인에 태그를 설정할 수 있습니다.

이벤트 규칙 테스트

이벤트 규칙 테스트

선택한 시간 동안 설정한 이벤트 조건을 실행해 몇 번의 경고 알림이 발생했는지 확인할 수 있습니다. 실행 버튼을 선택하면 알림 발생 건수 정보를 알 수 있으며, 이벤트 발생 조건에서 선택한 필드와 임계치를 차트상에 표시합니다.

이벤트 설정에 포함된 대부분의 내용들이 MXQL을 사용해서 지정됩니다. MXQL이 적절하게 작성되었는지 시뮬레이션할 수 있는 기능을 제공합니다. 시뮬레이션 기능은 과거의 24시간 데이터를 조회해서 이벤트 판정을 한 다음 몇 건의 메트릭스가 조회되었고 그 중 몇 건에서 이벤트 판정이 성공했는지 알려줍니다.

메트릭스 이벤트 수정 및 삭제

  1. 경고 알림 > 이벤트 설정 메뉴로 이동한 다음 메트릭스 탭을 선택하세요.

  2. 이벤트 목록에서 수정 또는 삭제하려는 항목의 가장 오른쪽에 편집 아이콘 버튼을 선택하세요.

  3. 메트릭스 또는 복합 메트릭스 이벤트 설정 창이 나타나면 각 옵션을 수정한 다음 저장 버튼을 선택하세요.

    선택한 이벤트를 삭제하려면 이벤트 설정 창의 오른쪽 위에 삭제 아이콘 삭제 버튼을 선택하세요.

발생 조건, 대상 선택 가이드

메트릭스 경고 알림의 이벤트 발생 조건과 이벤트 대상 선택은 동일한 문법을 사용합니다. 단, 이벤트 발생 조건은 태그(Tag)의 Key를 변수로 사용하고, 이벤트 대상 선택은 필드(Field)의 Key를 변수로 사용합니다.

기본 문법

  • 문자열을 그냥 입력하면 변수, 작은 따옴표('') 또는 큰 따옴표("")로 감싸면 text로 인식합니다.

    oid == "oid"
    1. oid : 변수
    2. == : 함수
    3. "oid" : text
    // oname가 ott-1235일 경우

    // 정상적인 경우
    onname = 'ott-1235' 또는 onname = "ott-1235"

    // 비정상적인 경우, 알림이 동작하지 않습니다.
    onname = ott-1235
  • 숫자를 그냥 입력하면 number, 작은 따옴표('') 또는 큰 따옴표("")로 감싸면 text로 인식합니다.

    oid == 123
    1. oid : 변수
    2. == : 함수
    3. 123 : number
    // oid가 123일 경우

    // 정상적인 경우
    oid = 123

    // 비정상적인 경우, 알림이 동작하지 않습니다.
    id == '123' 또는 oid == "123"

사용 가능한 연산자 목록

연산자사용법설명
==operand1 == operand2operand1과 operand2의 값이 동일한지 확인합니다.
!=operand1 != operand2operand1과 operand2의 값이 다른지 확인합니다.
>operand1 > operand2operand1의 값이 operand2의 값보다 큰지 확인합니다.
>=operand1 >= operand2operand1의 값이 operand2의 값보다 큰거나 같은지 확인합니다.
<operand1 < operand2operand1의 값이 operand2의 값보다 작은지 확인합니다.
<=operand1 <= operand2operand1의 값이 operand2의 값보다 작거나 같은지 확인합니다.
likeoperand1 like operand2operand1에 operand2가 포함되어 있는 지를 패턴으로 검색합니다.
&&expression1 && expression2expression1과 expression2이 모두 true인지 확인합니다.
andexpression1 and expression2expression1과 expression2이 모두 true인지 확인합니다.
&&와 동일한 역할을 수행하는 연산자입니다.
||expression1 || expression2expression1 또는 expression2이 true인지 확인합니다.
orexpression1 or expression2expression1 또는 expression2이 true인지 확인합니다.
||와 동일한 역할을 수행하는 연산자입니다.

like 사용법

와일드카드(*)를 통해 포함 문자열을 편리하게 검색할 수 있습니다.

  • 특정 키워드로 시작하는 문자열 검색


    Key like "Value*"

  • 특정 키워드로 끝나는 문자열 검색


    Key like "*Value"

  • 특정 키워드가 포함된 문자열 검색


    Key like "*Value*"

  • 키워드 중간에 와일드카드(*)를 사용할 수 없습니다.


    // 지원하지 않는 문법
    Key like "Va*lue"

  • like 연산자에서 와일드카드(*)를 생략하는 경우 equals(==)로 동작합니다.


    // 아래의 두 문장은 완전히 같은 결과를 가집니다.
    Key like "Value"
    Key == "Value"

사용 가능한 함수 목록

함수사용법설명
startsWithstartsWith(param1, param2)param1을 Key로 하는 Value가 param2로 시작하면 true, 반대의 경우 false
endsWithendsWith(param1, param2)param1을 Key로 하는 Value가 param2로 끝나면 true, 반대의 경우 false
isNullisNull(param1)param1이 null이면 true, 반대의 경우 false
isNotNullisNotNull(param1)param1이 null이 아니면 true, 반대의 경우 false
isEmptyisEmpty(param1)param1이 null 또는 EmptyString("")이면 true, 반대의 경우 false
isNotEmptyisNotEmpty(param1)param1이 null도 아니고 EmptyString("")도 아니면 true, 반대의 경우 false

startsWith

startsWith(Key, "Value")

endsWith

endsWith(Key, "Value")

isNull

isNull(Key)

isNotNull

isNotNull(Key)

isEmpty

isEmpty(Key)

isNotEmpty

isNotEmpty(Key)

복합 메트릭스 이벤트 템플릿

복합 메트릭스 이벤트 추가 시 + 차트로 생성하기 외 템플릿을 선택해 사용할 수 있습니다. CPU, Disk I/O, Network I/O 지표가 설정한 임계치 기준에 따라 알림을 발생시키는 템플릿을 제공합니다.

서버 복합 메트릭스 이벤트 템플릿

CPU

노트

CPU 관련 지표는 다음과 같습니다. cpu, user_cpu, system_cpu

CPU % is too high

최근 1분 동안 가장 높게 측정된 CPU 관련 지표가 임계치 설정값(${_rule_})의 조건(>, <, =)과 일치 시 알림이 발생합니다. 해당 알림은 에이전트(oname)별로 발생합니다. 메시지 예시는 다음과 같습니다.

CPU utilization rate of the ${oname} in the last minute > ${_rule_} %

CPU User % is too high

최근 1분 동안 가장 높게 측정된 user_cpu 지표가 임계치 설정값(${_rule_})의 조건(>, <, =)과 일치 시 알림이 발생합니다. 해당 알림은 에이전트(oname)별로 발생합니다. 메시지 예시는 다음과 같습니다.

CPU User utilization rate of the ${oname} in the last minute > ${_rule_} %

The number of agents with high CPU SYS % is too large

system_cpu 지표가 70% 이상인 서버의 개수가 관련 지표가 임계치 설정값(${_rule_})의 조건(>, <, =)과 일치 시 알림이 발생합니다. 해당 알림은 에이전트(oname)별로 발생합니다. 메시지 예시는 다음과 같습니다.

The number of agents with a CPU SYS of 70% or more in the last minute > ${_rule_}

Disk

The Disk I/O is too high

최근 1분 동안 가장 높게 측정된 Disk I/O가 관련 지표가 임계치 설정값(${_rule_})의 조건(>, <, =)과 일치 시 알림이 발생합니다. 해당 알림은 에이전트(oname)별로 발생합니다. 메시지 예시는 다음과 같습니다.

In the last minute, ${oname}'s Disk I/O > ${_rule_} %

The Disk Used % is too high

최근 1분 동안 가장 높게 측정된 Disk User I/O가 관련 지표가 임계치 설정값(${_rule_})의 조건(>, <, =)과 일치 시 알림이 발생합니다. 해당 알림은 에이전트(oname)별로 발생합니다. 메시지 예시는 다음과 같습니다.

In the last minute,${oname}'s Disk Used > ${_rule_} %

Network

Network Traffic I/O is too high

최근 1분 동안 가장 높게 측정된 Network I/O 지표가 임계치 설정값(${_rule_})의 조건(>, <, =)과 일치 시 알림이 발생합니다. 해당 알림은 에이전트(oname)별로 발생합니다. 메시지 예시는 다음과 같습니다.

In the last minute, ${oname}'s Network Traffic I/O > ${_rule_} %

Network Packet I/O is too high

최근 1분 동안 가장 높게 측정된 Network Packet I/O 지표가 임계치 설정값(${_rule_})의 조건(>, <, =)과 일치 시 알림이 발생합니다. 해당 알림은 에이전트(oname)별로 발생합니다. 메시지 예시는 다음과 같습니다.

In the last minute, ${oname}'s Network Packet I/O > ${_rule_} %

Network Error I/O is too high

최근 1분 동안 가장 높게 측정된 Network Error I/O 지표가 임계치 설정값(${_rule_})의 조건(>, <, =)과 일치 시 알림이 발생합니다. 해당 알림은 에이전트(oname)별로 발생합니다. 메시지 예시는 다음과 같습니다.

In the last minute, The maximum value of the ${oname}'s Network Error I/O > ${_rule_} %