이상 현상 감지 시스템이 발견할 수 있는 데이터 이상 현상 유형은 비의도적 이상 현상과 의도적 이상 현상, 이렇게 두 가지의 일반적인 유형 중 하나에 속합니다.

비의도적 이상 현상은 데이터 수집 과정에서의 오류나 노이즈로 인해 표준에서 벗어난 데이터 포인트를 말합니다. 이러한 오류는 센서 결함이나 데이터 입력 중 인적 오류와 같은 문제에서 비롯되며, 체계적일 수도 무작위적일 수도 있습니다. 비의도적 이상 현상은 데이터 세트를 왜곡하여 정확한 인사이트를 도출하기 어렵게 만들 수 있습니다.

반면, 의도적 이상 현상은 특정 작업이나 이벤트로 인해 표준에서 벗어난 데이터 포인트입니다. 이러한 이상 현상은 특이한 발생 사례나 추세를 부각시킬 수 있으므로 데이터 세트에 대한 귀중한 인사이트를 제공할 수 있습니다.

예를 들어 연휴 시즌에 갑자기 매출이 급증하는 것은 일반적인 매출 패턴과는 다르지만 실생활의 이벤트로 인해 예상되는 것이기 때문에 의도적 이상 현상으로 간주할 수 있습니다.

비즈니스 데이터의 경우 세 가지 주요 시계열 데이터 이상 현상, 즉 포인트 이상 현상, 맥락적 이상 현상, 집단 이상 현상이 존재합니다.

포인트 이상 현상은 글로벌 이상값이라고도 하며, 나머지 데이터 세트에서 멀리 떨어진 외부에 존재하는 개별 데이터 포인트입니다. 이는 의도적일 수도 비의도적일 수도 있으며 오류, 노이즈 또는 특이한 발생 사례로 인해 발생할 수 있습니다.

포인트 이상 현상의 예로는 사용자의 모든 이전 인출액보다 훨씬 큰 금액이 은행 계좌에서 인출된 경우를 들 수 있습니다.

맥락적 이상 현상은 특정 맥락 내에서 표준에서 벗어난 데이터 포인트를 말합니다. 이러한 이상 현상은 개별적으로 고려할 때는 꼭 이상값이라 할 수는 없지만 특정 맥락 내에서 보면 이상값이 됩니다.

예를 들어, 가정 내 에너지 사용량을 생각해 보시길 바랍니다. 일반적으로 집에 가족 구성원이 없는 정오에 에너지 소비가 갑자기 증가하는 경우, 해당 이상 현상은 맥락적 이상 현상이 될 것입니다. 이 데이터 포인트는 아침이나 저녁(사람들이 주로 집에 있는 시간대)의 에너지 사용량과 비교하면 이상값이 아닐 수도 있지만, 하루 중 이 현상이 발생하는 시간대라는 맥락에서 보면 비정상적인 수치입니다.

집단 이상 현상은 개별 인스턴스가 정상으로 보일지라도, 총체적으로 보면 표준에서 벗어난 데이터 인스턴스 세트를 포함합니다.

이러한 유형의 이상 현상의 예로는 동시에 여러 IP 주소에서 트래픽이 갑자기 급증하는 현상을 보이는 네트워크 트래픽 데이터 세트가 있습니다.