Ces catégories incluent, entre autres, les noms d’individus, d’organisations et de lieux, les expressions temporelles, les quantités, les codes médicaux, les valeurs monétaires et les pourcentages. Concrètement, la NER désigne le processus qui consiste à examiner une chaîne de texte (c’est-à-dire une phrase, un paragraphe ou un document entier) pour identifier et classer les entités catégorisables.

Lorsque le terme « NER » a été inventé lors de la Sixth Message Understanding Conference (MUC-6), l’objectif était de rationaliser les tâches d’extraction d’informations, qui nécessitaient le traitement de grandes quantités de texte non structuré et l’identification des informations clés. Depuis, la NER s’est développée et a évolué, en grande partie grâce aux progrès des techniques de machine learning et d’apprentissage profond.