Il y a deux ans, OpenAI, une startup de San Francisco fondée en 2015 à but non lucratif par Sam Altman, Greg Brockman, Elon Musk, Ilya Sutskever, Wojciech Zaremba et John Schulman, a lancé son chatbot IA pour des tests. Le lancement a suscité de l'enthousiasme, des questions et même des expériences (vous vous souvenez de cet épisode du Daily ?). En novembre 2024, ChatGPT compte désormais plus de 200 millions d’utilisateurs actifs hebdomadaires, tandis qu’OpenAI continue de se développer grâce à des partenariats avec des géants de la technologie tels que Microsoft et Apple.
Comment le lancement de ChatGPT a-t-il modifié l'environnement de l'IA ? Nous avons parlé avec des experts d'IBM de la façon dont l'IA a évolué ces deux dernières années et continue de se transformer.
L'intelligence artificielle remonte à plusieurs décennies. Dans les années 50, par exemple, IBM entraînait déjà certains des premiers réseaux de neurones, en utilisant des dames et un backgammon pour entraîner des machines à battre les plus grands joueurs. Mais la sortie de ChatGPT, avec son interface en langage naturel simple et gratuite, a marqué un tournant majeur.
« Ce qui distinguait ChatGPT, c'est qu'il offrait vraiment une expérience exceptionnelle aux consommateurs et permettait à des personnes sans connaissances techniques d'utiliser l'IA pour réaliser des choses incroyables », explique Chris Hay, ingénieur émérite chez IBM.
Cela a eu pour effet de mettre une technologie puissante, qui n'était auparavant accessible qu'aux entreprises les plus riches, à la disposition de toute personne disposant d'un ordinateur et d'une connexion Internet. Entre-temps, l'initiative d'OpenAI a contraint d'autres entreprises à publier leurs propres outils puissants, ce qui a favorisé l'émergence d'une nouvelle classe de programmeurs et d'entrepreneurs axés sur l'innovation en matière d'IA dans le monde entier.
« Le paysage économique mondial change fondamentalement lorsque l’IA devient aussi accessible que l’électricité », explique Shobhit Varshney, vice-président et associé principal chez IBM Consulting. L’un des signes de ce changement, selon M. Varshney, est le nombre sans précédent de programmeurs qui rejoignent GitHub en provenance du monde entier, Python, un langage de programmation principalement utilisé pour l’IA et le machine learning, devenant le langage le plus populaire sur la plateforme.
« Aujourd'hui, les gens peuvent tirer parti de ces outils sans avoir besoin d'investir des millions de dollars », explique-t-il. « Nous assisterons bientôt à la naissance de licornes. »
Chris Hay explique qu'il a découvert ChatGPT quelques semaines seulement après la sortie du chatbot, alors qu'il essayait de travailler sur son propre langage de programmation. Il s'est rapidement retrouvé à demander des commentaires à GPT.
« C’est là que je me suis dit : « Oh la vache ! » Je suis en train d'avoir une conversation sérieuse ici au sujet de la conception de mon langage de programmation. J'ai un collaborateur ! ».
Deux ans plus tard, 92 % des dirigeants d'entreprise sondés par l'IBM Institute for Business Value disent qu'ils intégreront l'IA dans leurs workflows d'ici 2025. L'intégration de l'IA dans les services et produits destinés aux consommateurs a déjà fait l'objet d'efforts, comme Intelligence Apple, Adobe et IA Meta.
« Maintenant, tout ce que nous touchons est de l’IA générative », déclare M. Hay.
Les LLM portaient initialement sur le texte. Cependant, le secteur s'est depuis orienté vers des modèles multimodaux, capables d'intégrer et de traiter plusieurs types de données, notamment des images, des fichiers audio, des vidéos, du texte ou du code.
Les modèles peuvent désormais traiter et exploiter plusieurs types de données au-delà du texte écrit, ce qui ouvre un tout nouveau champ d'applications pour l'IA, comme la découverte de médicaments et le suivi climatique.
« Il ne s'agit pas nécessairement uniquement de texte ou de code, ce qui explique l'explosion des différentes modalités que les modèles d'IA peuvent comprendre, représenter, puis créer », explique M. Varshney.
Les êtres humains combinent tous leurs sens pour prendre une décision, et c'est vers cela que tend l'IA, affirme-t-il.
L'une des évolutions majeures de cette année a été l'émergence de ce que l'on appelle des « modèles de raisonnement ». Ces modèles, tels que la série o1 d'OpenAI, appliquent le raisonnement par chaîne de pensée, ce qui signifie qu'ils peuvent refléter le raisonnement humain et utiliser des déductions logiques pour résoudre des problèmes complexes.
« Nous constatons actuellement que les modèles commencent à réfléchir davantage et à trouver des réponses », explique M. Hay. « Il ne s'agit pas encore de raisonnement humain, et le terme « raisonnement » est souvent utilisé à tort, mais au moins, ils sont capables de réfléchir à ce qu'ils font et de trouver des réponses de meilleure qualité en y consacrant plus de temps. »
Le GPT-3 original comptait 175 milliards de paramètres. Aujourd'hui, des modèles plus petits, dont certains ne comptent que 2 milliards de paramètres,surpassent les meilleurs modèles d'il y a 18 mois.
« Les modèles sont de plus en plus petits et de plus en plus performants parce qu'ils sont mieux entraînés », explique M. Hay. « C'est la voie que je veux suivre : plus un modèle est grand, plus il est lent. Je veux des modèles qui fonctionnent sur mon propre appareil. »
L'IA atteint-elle ses limites ? La question plane toujours, et un récent article de Reuters citant un cofondateur d’OpenAI sur le pré-entraînement et la mise à l’échelle de l’IA a suscité de nombreux commentaires publics sur les retards dans l'entraînement de nouveaux modèles linguistiques à utiliser des méthodes de « réflexion » plus humaines.
Toutefois, M. Varshney estime que l'évaluation de l'IA en termes de capacités humaines est une erreur.
« L'IA ne devrait pas être évaluée selon les critères de l'intelligence humaine, car les humains excellent dans certains domaines et sont moins performants dans d'autres », explique-t-il. « Nous ne souhaitons pas que l'IA imite les humains ; nous souhaitons qu'elle excelle dans ses propres domaines. »
À titre d'exemple, il évoque l'histoire d'un appareil électroménager courant. « Nous ne nous attendions pas à ce qu'un lave-vaisselle se mette à laver la vaisselle comme le ferait un être humain », explique-t-il. Il estime que nous avons besoin de meilleurs moyens pour évaluer les domaines dans lesquels l'IA excelle réellement.
Loin d'avoir atteint ses limites, M. Hay estime que l'IA dispose encore d'un important potentiel de croissance, en grande partie grâce aux données synthétiques. « Nous aurons besoin de moins de données pour entraîner les modèles, et les modèles seront axés sur différents types de changements architecturaux », affirme-t-il. « Il y aura des avancées significatives et le matériel va s'améliorer. Je ne pense donc pas qu'il y aura d'obstacle. »
OpenAI est toujours considéré comme un leader dans la course à l'innovation et au déploiement de l'IA. M. Varshney estime qu'OpenAI n'a toujours pas de concurrent sérieux, deux ans après la sortie de ChatGPT. M. Hay est d'accord, en grande partie parce qu'il pense qu'OpenAI offre toujours la meilleure expérience utilisateur aux consommateurs.
« J'utilise toujours ChatGPT, parce que c'est une meilleure expérience pour les consommateurs », confie-t-il. Néanmoins, il reconnaît que le domaine évolue rapidement. Plusieurs anciens dirigeants et scientifiques d'OpenAI ont déjà fondé de nouvelles entreprises, telles que Anthropic et Safe Superintelligence Inc. et le marché continue d'être inondé de nouvelles caractéristiques et fonctionnalités.
« Qui gagnera cette course ? Personne, j'espère », déclare M. Hay. Dans un monde où [une seule entreprise] gagne la course et nous perdons tous, tandis que [quand] la concurrence est saine, nous avons tous accès à de grandes innovations en matière d'IA. »