La matrice de confusion (ou matrice d’erreur) est une méthode qui permet de visualiser les résultats d’un algorithme de classification. Plus précisément, il s’agit d’une table qui décompose le nombre d’instances de vérité terrain d’une classe donnée par rapport au nombre d’instances de classes prédites. La matrice de confusion est l’un des nombreux indicateurs qui permettent d’évaluer la performance des modèles de classification. On peut s’en servir pour calculer un certain nombre d’autres indicateurs de performance des modèles, tels que la précision et le rappel.

Les matrices de confusion peuvent être utilisées avec n’importe quel algorithme de classification, tel que le classificateur Bayes naïf, les modèles de régression logistique , les arbres de décision, etc. En raison de leur vaste applicabilité dans les modèles de science des données et de machine learning, nombre de packages et bibliothèques sont préchargés avec des fonctions permettant de créer des matrices de confusion, comme le module sklearn.metrics de scikit-learn pour Python.