La NER a fait du chemin depuis sa création. Elle intègre désormais des technologies innovantes et son utilisation s’est considérablement étendue. Cependant, il existe quelques défis notables à prendre en compte lors de l’évaluation de ces technologies.
Bien que de nombreux progrès aient été réalisés pour des langues comme l’anglais, la NER n’offre pas le même niveau de précision pour toutes les langues. Cela est principalement dû au manque de données étiquetées dans certaines langues. La NER multilingue, qui implique le transfert de connaissances d’une langue à une autre, est un domaine de recherche actif qui pourrait contribuer à combler ce fossé.
Certaines entités peuvent aussi être imbriquées dans d’autres, ce qui complique leur analyse. Par exemple, dans la phrase « Le campus Pierre-et-Marie-Curie de l’université de la Sorbonne été inauguré en 1959 », « université de la Sorbonne » et « Le campus Pierre-et-Marie-Curie de l’université de la Sorbonne » sont deux entités valides.
En outre, si les modèles de NER classiques sont capables d’identifier des entités courantes telles que les noms et les lieux, ils peuvent rencontrer des difficultés avec les entités propres à un domaine spécifique. Par exemple, dans le domaine médical, il peut être difficile d’identifier des termes complexes tels que des noms de maladies ou de médicaments. Des modèles de NER spécifiques peuvent être entraînés sur des données spécialisées, mais encore faut-il parvenir à rassembler ces informations.
Les modèles de NER peuvent également rencontrer des difficultés en cas d’ambiguïté (par exemple, « Apple » pourrait faire référence à un fruit - pomme, en anglais - ou à l’entreprise technologique), de variantes d’un nom d’entité (par exemple, « USA », « U.S.A. », « États-Unis » et « États-Unis d’Amérique » font tous référence au même pays) ou d’informations contextuelles limitées (car les textes et/ou les phrases ne contiennent pas suffisamment de contexte pour identifier et catégoriser les entités avec précision).
Bien que la NER présente certains défis, les avancées continues améliorent constamment sa précision et son applicabilité, et contribuent donc à minimiser l’impact des lacunes technologiques existantes.