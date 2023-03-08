Comme son nom l’indique, l’IA générative génère des images, de la musique, de la parole, du code, des vidéos ou du texte, tout en interprétant et en manipulant les données préexistantes.L’IA générative n’est pas un concept nouveau : les techniques de machine learning qui sous-tendent l’IA générative ont évolué au cours des dix dernières années. La dernière approche repose sur une architecture de réseau neuronal, appelée « transformatrice ». En combinant l’architecture transformatrice avec l’apprentissage non supervisé, de grands modèles de fondation sont apparus, plus performants que les références existantes capables de gérer de multiples modalités de données.

Ces grands modèles sont appelés modèles de fondation, car ils servent de point de départ au développement de modèles plus avancés et complexes. En partant d’un modèle de fondation, nous pouvons créer des modèles plus spécialisés et plus sophistiqués, adaptés à des cas d’utilisation ou à des domaines spécifiques. Les premiers exemples de modèles, comme GPT-3, BERT, T5 ou DALL-E, ont montré ce qui est possible : entrez un prompt court et le système génère un essai complet ou une image complexe, en fonction de vos paramètres.

Les grands modèles de langue (LLM) ont été explicitement entraînés sur de grandes quantités de données textuelles pour des tâches de NLP et contenaient un nombre important de paramètres, généralement supérieur à 100 millions. Ils facilitent le traitement et la génération de texte en langue naturelle pour diverses tâches. Chaque modèle a ses forces et ses faiblesses, et le choix de celui à utiliser dépend de la tâche spécifique du NLP et des caractéristiques des données analysées. Pour choisir le bon LLM à utiliser pour une tâche spécifique, il faut une expertise en matière de LLM.

BERT est conçu pour comprendre les relations bidirectionnelles entre les mots d'une phrase et est principalement utilisé pour la classification des tâches, la réponse aux questions et la reconnaissance des entités nommées. Le GPT, quant à lui, est un modèle unidirectionnel basé sur un transformateur, principalement utilisé pour les tâches de génération de texte telles que la traduction, la synthèse et la création de contenu. T5 est également un modèle basé sur les transformateurs, mais il diffère de BERT et de GPT en ce sens qu'il est formé à l'aide d'une approche texte à texte et qu'il peut être affiné pour diverses tâches de traitement automatique du langage naturel telles que la traduction, le résumé et la réponse à des questions.