Qu’est-ce que la génération automatique de texte en langage naturel (GAT) ?

Auteurs

Ivan Belcic

Staff writer

Cole Stryker

Staff Editor, AI Models

IBM Think

Qu’est-ce que la génération automatique de texte en langage naturel (GAT) ?

La génération de langage naturel (NLG) est l’utilisation de l’IA pour créer des productions en langage naturel à partir de données structurées et de données non structurées. Le NLG permet aux ordinateurs et aux applications logicielles d’IA générative d’interagir avec les utilisateurs dans un langage humain compréhensible. Avec la Natural Language Understanding (NLU), le NLG est une sous-catégorie du traitement automatique du langage naturel (NLP). 

Les systèmes NLG sont déjà largement utilisés dans les produits d’entreprise et de consommation, tels que les outils de Business Intelligence et les chatbots. Les assistants vocaux communiquent avec les utilisateurs via NLG.

Les responsables d’entreprise utilisent le NLG pour transformer des données complexes en texte généré afin d’en extraire des informations clés. Chaque fois qu’un modèle IA génère une production en langage humain, c’est la NLG qui est à l’œuvre. 

Les dernières tendances en matière d’IA, vues par des experts

Obtenez des informations sur les actualités les plus importantes et les plus intrigantes en matière d’intelligence artificielle. Abonnez-vous à notre newsletter hebdomadaire Think. Lire la Déclaration de confidentialité d’IBM.

Merci ! Vous êtes abonné(e).

Vous recevrez votre abonnement en anglais. Vous trouverez un lien de désabonnement dans chaque newsletter. Vous pouvez gérer vos abonnements ou vous désabonner ici. Consultez la Déclaration de confidentialité d’IBM pour plus d’informations.

Types de TAL

Les deux principaux types de NLG sont l’extraction et l’abstraction : 

  • La NLG extractif extrait des mots et des phrases exacts directement du texte source. Il est utilisé dans les cas où une formulation spécifique est critiquée, comme dans les documents juridiques. Par rapport au NLG abstractif, la NLG extractif est plus simple, car il copie des documents sources plutôt que de produire un nouveau contenu. 

  • La NLG abstractif crée de nouvelles sorties basées sur les documents sources, en paraphrasant et en générant un nouveau contenu. Il s’agit d’un processus plus complexe qui nécessite des modèles plus avancés, tels que des transformateurs. Alors que la NLG extractif est préféré dans les environnements techniques, la NLG abstractif brille dans les applications plus créatives.

Mixture of Experts | 28 août, épisode 70

Décryptage de l’IA : Tour d’horizon hebdomadaire

Rejoignez notre panel d’ingénieurs, de chercheurs, de chefs de produits et autres spécialistes de premier plan pour connaître l’essentiel de l’actualité et des dernières tendances dans le domaine de l’IA.

Fonctionnement du NLG

La NLG fonctionne en progressant à travers un processus en plusieurs étapes pour affiner les entrées de données non structurées et générer des résultats en langage naturel. Comme décrit par l’informaticien Reiter,1, les étapes du processus NLG typique sont les suivantes : 

  • Analyse du signal : le système NLG détermine quelles données d’entrée sont nécessaires pour la production finale. Dans l’étape de l’analyse du signal ou des données, la reconnaissance de schémas identifie le sujet du contenu et les relations entre les sujets. Les données d’entrée comprennent les prompts de l’utilisateur, le contenu de la base de données et le contenu en langage non structuré tel que les PDF, les documents et les enregistrements en langage parlé. La reconnaissance d’entités aide les systèmes NLP à comprendre ce qui est discuté. 

  • Interprétation des données : les modèles NLP génèrent des informations à partir des résultats de l’étape d’analyse des données. Si les données ont déjà subi un prétraitement avec les informations disponibles, cette étape est ignorée. Les systèmes NLP identifient les parties du discours et utilisent la NLU pour évaluer la syntaxe et la sémantique, créant ainsi une compréhension du sens. 

  • Planification des documents : cette étape identifie les informations à communiquer et la façon de les formater. Le système NLG détermine son approche pour la sortie finale, en fonction des données dont il dispose et du prompt utilisateur. 

  • Microplanification : après avoir défini le contenu et le format de la communication, le système NLG planifie la structure des phrases et des paragraphes pour le résultat final. 

  • Réalisation de surface : le système NLG met son plan en œuvre et génère des productions en langage naturel selon les résultats des étapes précédentes. 

GAT et TAL

La NLG fait partie de la discipline informatique du traitement automatique du langage naturel (NLP) : l’utilisation de modèles de machine learning (ML) pour comprendre et travailler avec le langage humain.

La NLG est la partie du NLP qui s’occupe de la génération de contenu, en particulier de la production de nouvelles langues écrites ou parlées. Par exemple, les chatbots d’IA conversationnelle utilisent la NLG pour répondre aux entrées des utilisateurs en temps réel. 

Le NLP convertit les entrées en langage naturel en données, et le NLG utilise les données pour générer des sorties en langage naturel. 

Le NLP fait partie du domaine de la linguistique informatique : l’étude de la façon dont les ordinateurs analysent et comprennent le langage humain. Le NLP est une linguistique informatique en pratique.

Le développement du deep learning et des grands modèles de langage (LLM) a permis aux progrès du NLP d’alimenter les nombreuses applications d’IA générative qui gèrent la création de contenu.

NLG ou NLU

La NLU est un autre sous-ensemble du NLP. Plutôt que de se concentrer sur le sens grammatical et linguistique, la NLU essaie d’appréhender le langage humain de manière holistique. La NLU utilise l’analyse sémantique et syntaxique pour comprendre de manière complète et contextuelle les entrées en langage naturel, y compris les émotions, les sentiments et les intentions.

La NLU permet aux ordinateurs de comprendre les entrées en langage naturel avec une précision similaire à celle des humains. Lorsque les gens communiquent entre eux, ils traitent bien plus que la simple définition des mots utilisés. Ils sont capables de comprendre naturellement le sens profond des mots prononcés par leur interlocuteur. 

Lorsqu’une application logicielle offre des options de texte prédictif, elle utilise la NLU pour comprendre l’intention de l’utilisateur, puis applique le NLG pour terminer la phrase. Le NLP, la NLU et le NLG fonctionnent de concert pour aider les ordinateurs à communiquer avec les utilisateurs.

Modèles et méthodologies GAT

De nombreux systèmes NLG utilisent des modèles IA avancés tels que les transformateurs pour créer des textes nouveaux à partir de données d’entraînement et d’entrées utilisateur.

Cependant, avant que ces modèles ne soient développés, la NLG a été rendue possible par d’autres moyens. Voici les modèles et techniques de NLG : 

  • Modèles

  • Systèmes basés sur des règles 

  • Transformateurs

Templates

Les systèmes basés sur des modèles utilisent des modèles de phrases prédéfinis avec des variables pour les données d’entrée. Les modèles sont l’un des types de NLG les plus anciens et les plus simples, adaptés aux contextes dans lesquels les structures des phrases et des documents sont cohérentes. Cependant, les systèmes basés sur des modèles ne peuvent pas s’adapter en dehors de leurs cas d’utilisation prédéfinis. 

Voici un exemple de modèle : en [mois], [année], notre magasin [emplacement] a vendu [montant] unités de [article].

Bien que ce modèle soit excellent pour signaler les ventes géolocalisées, il n’est pas possible de l’appliquer pour générer une recette de cuisine.

Systèmes basés sur des règles

Les systèmes basés sur des règles génèrent du texte selon une série de règles et de logiques prédéfinies. Les premiers systèmes basés sur des règles ont été créés pour refléter la façon dont les experts du domaine parlent ou écrivent. Les programmeurs interrogeaient des experts, puis créaient les règles correspondantes pour la génération de texte

Les systèmes « si-alors » sont un exemple courant de programmation basée sur des règles. Par exemple, le logiciel NLG de prévision peut être chargé de décrire le temps comme « en dessous de zéro » si la température est inférieure à 32 degrés Fahrenheit ou 0 degré Celsius.

Algorithmes statistiques de machine learning

Les algorithmes de machine learning statistique, tels que les chaînes de Markov cachées, identifient des modèles dans de grands jeux de données pour faire des prédictions et prendre des décisions à partir de nouvelles données.

Ils génèrent de nouvelles instances basées sur l’instance actuelle. Pour la NLG, les chaînes de Markov et d’autres modèles statistiques génèrent des mots susceptibles de se suivre. 

Les modèles statistiques sont plus flexibles que les modèles et les systèmes basés sur des règles, mais nécessitent de grandes quantités de données d’entraînement.

Modèles d’apprentissage profond

Les modèles d’apprentissage profond sont une avancée de la technologie de l’IA par rapport aux algorithmes statistiques et peuvent générer un texte d’apparence plus naturelle. Les réseaux de neurones récurrents (RNN) sont un exemple de modèles d’apprentissage profond appliqués à la GAT.

Les RNN traitent des données séquentielles telles que les mots d’une phrase, et peuvent transférer des connaissances, comme avec la traduction automatique.

Transformateurs

L’architecture du modèle de transformer alimente certaines des technologies NLG les plus efficaces disponibles. Les modèles basés sur des transformers tels que GPT et BERT utilisent des mécanismes d’auto-attention pour capturer les dépendances à longue portée dans les séquences d’entrée afin d’améliorer la compréhension contextuelle.

ChatGPT, Claude et d’autres chatbots alimentés par transformateur peuvent générer des résultats de langage humain réalistes.

Cas d’utilisation de la génération automatique de texte en langage naturel

La GAT est présente dans l’IA générative, partout où l’IA est utilisée pour communiquer directement avec les humains en langage naturel. De Siri à l’analyse des sentiments, les cas d’utilisation de la GAT sont nombreux : 

  • Assistants vocaux : Siri, Alexa et d’autres assistants vocaux utilisent la NLG pour répondre aux demandes des utilisateurs avec un langage parlé. Ils utilisent également le NLP et la NLU pour la reconnaissance vocale afin de comprendre ce que veulent les utilisateurs. 

  • Assistants virtuels : les chatbots et les assistants virtuels utilisent la NLG pour automatiser les interactions avec les clients. De nombreuses entreprises utilisent des assistants virtuels pour répondre aux demandes initiales du service client avant de les transmettre aux représentants humains si nécessaire. Les agents conversationnels communiquent également avec les utilisateurs via la NLG.

  • Traduction automatique : la traduction automatique est l’utilisation de modèles de machine learning pour traduire automatiquement d’une langue à l’autre. Les systèmes NLG gèrent la génération de sorties et rationalisent le processus de traduction qui prend du temps. Les traducteurs humains et les experts en localisation peuvent ensuite vérifier et modifier les sorties selon les besoins. 

  • Résumés des données et rapports : les systèmes NLG convertissent les données complexes en résumés et en schémas facilement compréhensibles. La rationalisation de l’agrégation et de la synthèse des articles et des rapports permet d’améliorer l’efficacité des prévisions. Les responsables d’entreprise utilisent des outils de BI basés sur la NLG pour la prise de décision fondée sur les données. D’autres entreprises utilisent l’IA et la NLG pour créer ce contenu pour leurs clients. 

  • Génération de contenu : chaque fois qu’un modèle d’IA générative produit du contenu en langage naturel, c’est la NLG à l’œuvre. Les entreprises peuvent choisir d’utiliser la NLG pour automatiser les descriptions de produits, les campagnes de marketing par e-mail, les publications sur les réseaux sociaux et d’autres types de contenu court. 

  • Analyse des sentiments : les systèmes NLG créent des résumés de texte et des rapports basés sur les commentaires et les communications du public. Les entreprises peuvent extraire du contenu généré par les utilisateurs à partir d’avis sur les produits, de plateformes de réseaux sociaux, de messages de forum et d’autres emplacements en ligne, puis utiliser le NLP et la NLG pour identifier ce que ressentent les utilisateurs. 

Solutions connexes
IBM watsonx Orchestrate

Concevez facilement des assistants et des agents IA évolutifs, automatisez les tâches répétitives et simplifiez les processus complexes avec IBM watsonx Orchestrate.

Découvrir watsonx Orchestrate
Outils et API de traitement automatique du langage naturel

Accélérez la valeur métier de l’intelligence artificielle grâce à un portefeuille puissant et flexible de bibliothèques, de services et d’applications.

Découvrir les solutions NLP
Conseils et services en matière d’IA

Réinventez les workflows et les opérations critiques en ajoutant l’IA pour optimiser les expériences, la prise de décision et la valeur métier en temps réel.

Découvrir les services d’IA
Passez à l’étape suivante

Concevez facilement des assistants et des agents IA évolutifs, automatisez les tâches répétitives et simplifiez les processus complexes avec IBM watsonx Orchestrate.

Découvrir watsonx Orchestrate Découvrir les solutions NLP
Notes de bas de page

1 Natural Language Generation, Ehud Reiter, Springer, 2024.