L’IA générative fait référence aux modèles de deep learning qui peuvent prendre des données brutes (comme l’intégralité de Wikipédia ou l’ensemble des œuvres de Rembrandt) et « apprendre » à générer des résultats statistiquement probables lorsqu’on leur demande de le faire. À un niveau élevé, les modèles génératifs codent une représentation simplifiée de leurs données d’apprentissage et s’en servent pour créer un travail similaire, sans être identique, aux données d’origine.

Les modèles génératifs sont utilisés depuis des années dans les statistiques pour analyser les données numériques. L’essor du deep learning a toutefois permis de les étendre aux images, à la parole et à d’autres types de données complexes. Les autoencodeurs variationnels (VAE), introduits en 2013, font partie de la première catégorie de modèles d’IA à avoir réussi ce croisement. Les VAE ont été les premiers modèles de deep learning à être largement utilisés pour générer des images et des discours réalistes.

« Les VAE ont ouvert la voie à une modélisation générative approfondie en facilitant la mise à l’échelle des modèles », explique Akash Srivastava, expert en IA générative au MIT-IBM Watson AI Lab. Une grande partie de ce que nous considérons aujourd’hui comme l’IA générative a commencé ici. »

Les premiers exemples de modèles, notamment GPT-3, BERT ou DALL-E 2, ont montré ce qui est possible. Le futur, ce sont des modèles formés sur un large ensemble de données non étiquetées qui peuvent être utilisées pour différentes tâches, avec un minimum d’ajustements. Les systèmes qui exécutent des tâches spécifiques dans un seul domaine cèdent la place à de vastes systèmes d’IA qui apprennent de manière plus générale et fonctionnent dans plusieurs domaines et problèmes. Les modèles de fondation, formés sur de vastes jeux de données non étiquetées et adaptés à toute une série de cas d’utilisation, sont à l’origine de cette évolution.

Quant à l’avenir de l’IA, en ce qui concerne l’IA générative, on prévoit que les modèles de fondation accéléreront considérablement l’adoption de l’IA au sein des entreprises. La réduction des exigences en matière d’étiquetage facilitera grandement la tâche des entreprises, et l’automatisation hautement précise et efficace optimisée par l’IA qu’ils permettent signifiera que de plus en plus d’entreprises pourront déployer l’IA dans un plus grand nombre de situations critiques. Pour IBM, l’espoir est que la puissance de calcul des modèles de fondation puisse finalement être apportée à chaque entreprise dans un environnement cloud-hybride sans friction.