Les types d'anomalies de données qu'un système de détection d'anomalies peut mettre au jour se classent en deux catégories générales : involontaires et intentionnelles.

Les anomalies involontaires sont des points de données qui s'écartent de la norme en raison d'erreurs ou de bruit dans le processus de collecte des données. Ces erreurs peuvent être systématiques ou aléatoires et provenir de problèmes tels que des capteurs défectueux ou des erreurs humaines lors de la saisie des données. Elles peuvent fausser l'ensemble des données, ce qui rend difficile l'obtention d'informations précises.

D’autre part, les anomalies intentionnelles sont des points de données qui s’écartent de la norme en raison d’actions ou d’événements spécifiques. Elles peuvent fournir des informations précieuses sur l'ensemble des données, car elles peuvent mettre en évidence des occurrences ou des tendances uniques.

Par exemple, un pic soudain des ventes pendant les fêtes de fin d'année peut être considéré comme une anomalie intentionnelle, car il s'écarte du modèle de vente habituel mais est attendu en raison d'un événement réel.

En ce qui concerne les données commerciales, il existe trois principales anomalies dans les ensembles temporels : ponctuelles, contextuelles et collectives.

Les anomalies ponctuelles, également connues sous le nom de données aberrantes globales, sont des points de données individuels qui se distinguent nettement des autres. Elles peuvent être intentionnelles ou non et résulter d'erreurs, de bruit ou d'événements uniques.

Un exemple d'anomalie ponctuelle est un retrait sur un compte bancaire qui est nettement plus important que tous les retraits précédents de l'utilisateur.

Les anomalies contextuelles sont des points de données qui s'écartent de la norme dans un contexte spécifique. Ces anomalies ne sont pas nécessairement aberrantes lorsqu'elles sont considérées séparément, mais elles deviennent anormales lorsqu'elles sont considérées dans leur contexte spécifique.

Prenons l'exemple de la consommation d'énergie d'un foyer. Si l'on constate une augmentation soudaine de la consommation d'énergie à midi, alors qu'aucun membre de la famille n'est habituellement à la maison, l'anomalie est contextuelle. Ce point de données n'est peut-être pas aberrant par rapport à la consommation d'énergie du matin ou du soir (lorsque les gens sont habituellement à la maison), mais il est anormal compte tenu du moment de la journée où il se produit.

Les anomalies collectives impliquent un ensemble de données qui s'écartent de la norme, même si les données individuelles peuvent sembler normales.

Un exemple de ce type d'anomalie serait un ensemble de données sur le trafic réseau qui indiquerait une augmentation soudaine du trafic en provenance de plusieurs adresses IP en même temps.