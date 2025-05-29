L’état d’esprit d’OpenAI n’était pas simplement une conclusion technique. C'était le résultat d'un système de croyances cohérent, bien que peu orthodoxe, partagé par ses dirigeants, souligne M. Hao. Elle a déclaré qu'Ilya Sutskever, le scientifique en chef d'OpenAI, était un absolutiste de l'apprentissage profond. Il pensait qu’un réseau neuronal suffisamment grand, s’il fournissait suffisamment de données, développerait à terme une intelligence humaine. D'autre part, Sam Altman, PDG d'OpenAI, a abordé l'intelligence artificielle en tant qu'entrepreneur, considérant la croissance exponentielle comme le chemin le plus rapide vers la domination. Greg Brockman, le président d'OpenAI, était l'ingénieur qui s'occupait de la mise à l'échelle.

L'architecture qui a permis cette doctrine est le transformateur, un type de Neural Networks introduit pour la première fois en 2017. Les transformateurs excellent dans la modélisation de séquences de données, telles que le texte, car ils peuvent suivre les relations entre les mots sur de longues distances dans une phrase. Surtout, ils peuvent être mis à l’échelle efficacement. L'ajout de couches et de paramètres améliore les performances.

L’équipe de recherche d’OpenAI a compris que si elle entraînait les transformers sur un jeu de données suffisamment massif et doté d’une puissance de calcul suffisante, elle pourrait contourner le besoin de fonctionnalités artisanales, de raisonnement symbolique ou de conception modulaire. Le renseignement, à leur avis, émergerait des données.

Pour entraîner des modèles comme le GPT-4, l'OpenAI avait besoin non seulement d'idées, mais aussi d'infrastructures. Les modèles de langage de cette taille nécessitent des clusters de dizaines de milliers d’unités de traitement graphique. Conçus initialement pour le rendu d'images tridimensionnelles, les GPU se sont révélés exceptionnellement utiles pour les multiplications de matrices au cœur des neural networks. Mais les relier pour agir comme un système unifié nécessitait une orchestration logicielle et matérielle personnalisée.

Les ingénieurs d'OpenAI ont développé des techniques permettant de partitionner les modèles en fragments, qui pouvaient être répartis sur plusieurs puces et entraînés en parallèle. Ils ont créé des protocoles de point de contrôle pour préserver les parcours d'entraînement partiels, réduisant ainsi le risque de défaillance catastrophique. Ils ont élaboré des protocoles de communication personnalisés pour synchroniser les mises à jour entre les machines. Il ne s'agissait pas d'avancées prestigieuses, mais essentielles.

« Personne n’avait entraîné 10 000 puces auparavant », explique Mme Hao. « Il fallait les résoudre en temps réel. »

Ces avancées ont permis de développer des modèles plus rapidement et plus efficacement que les concurrents. Mais elles ont également contribué à créer un nouveau type de confidentialité. OpenAI a cessé de publier de nombreux détails sur ses avancées. Selon l'entreprise, en divulguer trop reviendrait à renoncer à un avantage concurrentiel.

En 2024, la plupart des grandes entreprises technologiques avaient rattrapé leur retard. IBM, Google, Meta, Amazon, Anthropic et les nouveaux entrants, tels que Mistral, ont tous produit de grands modèles de langage en utilisant des architectures transformatrices et des techniques d’entraînement similaires. Nombre d'entre eux ont utilisé l'apprentissage par renforcement avec commentaires humains, une méthode dans laquelle les humains évaluent la qualité de la production d'un modèle, ce qui permet d'affiner le modèle pour qu'il corresponde mieux aux préférences humaines.

Pour les observateurs extérieurs, les différences entre ces systèmes devenaient plus difficiles à discerner. Les développeurs d'applications ont commencé à concevoir des interfaces qui pouvaient fonctionner avec n'importe quel modèle en coulisses, ce qui leur permettait de changer de fournisseur si nécessaire. En matière de renseignements, la tarification, la latence et le temps de fonctionnement sont devenus plus importants que les différences marginales en matière d’intelligence.

« Tout le monde essaie d'être indépendant des modèles maintenant », explique Mme Hao. « OpenAI ne détient plus le monopole des bons modèles. »

L'échelle n'étant plus un facteur de différenciation, les entreprises ont commencé à investir dans un paradigme différent : l'agence. En intelligence artificielle, l'agence fait référence à la capacité d'un système à prendre des initiatives, à persister dans le temps et à agir pour atteindre ses objectifs. Plutôt que de réagir à un prompt, un agent planifie ses actions, surveille les résultats et ajuste son comportement.

Cela nécessitait de nouvelles capacités. Les modèles devaient conserver la mémoire d'une session à l'autre, s'intégrer à des outils tiers et prendre des décisions sans instructions explicites. L'objectif était de déplacer d'un chatbot passif à un collaborateur actif.

OpenAI s'inspire depuis longtemps du film « Her », dans lequel un utilisateur tombe amoureux d'une assistante IA qui s'adapte de façon fluide à ses besoins. Pour créer un tel système, il fallait développer non seulement l'intelligence, mais aussi la présence. Mme Hao a fait remarquer que les équipes internes d'OpenAI ont poursuivi ce rêve dans les domaines des produits et de la recherche.

« On ne peut pas construire ce genre d’assistant sans donner au modèle mémoire, persévérance et autonomie », dit-elle.

Mais pour que les agents soient véritablement efficaces, OpenAI avait besoin de plus que de simples algorithmes. Il fallait de nouveaux types de données et de nouveaux moyens de les collecter. L'internet, qui était autrefois une source abondante de données de formation, est aujourd'hui saturé de contenus synthétiques. La plupart des documents désormais disponibles en ligne ont été générés par les modèles précédents.

Cela crée une boucle de rétroaction dans laquelle la formation en ligne devient de moins en moins utile. Pour briser la boucle, les entreprises se tournent vers une collecte de données plus intime. Mme Hao a indiqué qu'OpenAI découvre des appareils mobiles capables de capturer le comportement des utilisateurs en temps réel, qu'il s'agisse d'interactions mobiles, de conversations vocales ou de contextes environnementaux.

« Il y a trop de contenu généré par l'IA en ligne », explique Mme Hao. « Si vous voulez des données de haute qualité, vous devez les obtenir directement auprès des gens. »

Le flot croissant de contenus générés par l’IA, explique Mme Hao, soulève des questions difficiles sur le consentement, la surveillance et le contrôle. Les gens peuvent-ils vraiment choisir de ne pas laisser leurs données être collectées ? Et que disent-elles par rapport aux modèles entraînés sur leurs mots, leurs images ou leur comportement ?

Pour Mme Hao, la réponse ne réside pas dans l'optimisme technologique ou l'alarmisme, mais dans la transparence. Elle ne s'abonne pas aux idéologies dominantes en matière d'IA, qu'elle appelle les « boomers », qui pensent que l'intelligence artificielle va sauver l'humanité, ou les « doomers » qui craignent qu'elle ne nous détruise.

« Je suis dans le camp de la responsabilité », affirme-t-elle. « Ces systèmes reflètent le pouvoir institutionnel. Nous devons savoir comment ils sont fabriqués et qui en profite. »

Les entreprises doivent expliquer comment leurs modèles sont testés, quelles données elles utilisent et comment elles interprètent les résultats, explique Mme Hao. Ils doivent garder une trace des erreurs et partager leurs découvertes afin que d'autres puissent y jeter un coup d'œil plus attentif.

Sans ce type d'ouverture, prévient Mme Hao, l'IA risque de devenir une boîte noire propriétaire, puissante mais non responsable.