Aujourd'hui, l'attention de l'IA se porte essentiellement sur les résultats, c'est-à-dire sur ce qu'un modèle génère, sur son degré de précision ou de conviction, sur ses performances par rapport à des critères de référence. Mais pour M. Hagerty, la véritable tension éthique commence plus tôt, au niveau du modèle de base. Il s’agit de l’infrastructure brute de l’IA moderne, la couche de base du machine learning entraînée sur de vastes jeux de données collectés sur le Web. C'est ce qui alimente les grands modèles linguistiques (LLM) tels que ChatGPT et Claude.

« C'est à la fondation que tout se passe », m'a confié M. Hagerty. « C'est la première chose que le système apprend, et s'il est plein de déchets, ces déchets ne disparaissent pas. »

Ces modèles de base sont conçus pour être à usage général. C'est ce qui les rend à la fois puissantes et dangereuses, a déclaré M. Hagerty. Parce qu'ils ne sont pas conçus en fonction de tâches ou de contraintes spécifiques, ils ont tendance à tout absorber, qu'il s'agisse de structures sémantiques précieuses ou de boues toxiques de l'internet. Et une fois entraînés, les modèles sont difficiles à auditer. Même leurs créateurs ne peuvent souvent pas dire avec certitude ce qu'un modèle sait ou comment il répondra à un prompt donné.

M. Hagerty compare cette situation au coulage d'une base en béton défectueuse pour un gratte-ciel. Si le mélange n'est pas correct dès le départ, vous ne verrez peut-être pas les fissures immédiatement. Mais avec le temps, la structure devient instable. Dans le domaine de l'IA, l'équivalent est un comportement fragile, un biais involontaire ou une utilisation abusive catastrophique une fois qu'un système est déployé. S'il n'est pas façonné avec soin dès le départ, un modèle transmet les risques qu'il a absorbés pendant la formation à toutes les applications en aval.

Il n'est pas le seul à partager cette préoccupation. Des chercheurs du Centre de recherche sur les modèles de fondation (CRFM) de Stanford ont à plusieurs reprises mis en garde contre les risques émergents de l’entraînement à grande échelle, notamment la propagation des biais, l’hallucination, la contamination des données et la difficulté à identifier les échecs. Ces problèmes peuvent être atténués mais pas éliminés, ce qui rend les choix de conception précoces, tels que la curation des données, le filtrage et la gouvernance, plus critiques.

Selon M. Hagerty, l'un des principaux obstacles éthiques à des progrès significatifs est l'imprécision du terme « IA » utilisé par les entreprises. Demandez à cinq équipes produit ce qu’elles entendent par « alimenté par l’IA », et vous obtiendrez probablement cinq réponses différentes. M. Hagerty considère cette erreur de définition comme l'un des principaux échecs éthiques de notre époque.

« La plupart du temps, quand les gens parlent d’IA, ils pensent à l’automatisation. Ou un arbre de décision. Ou bien une déclaration si/alors », a-t-il dit.

Le manque de clarté des termes n'est pas une querelle universitaire. Lorsque les entreprises présentent un logiciel déterministe comme un raisonnement intelligent, les utilisateurs ont tendance à lui faire confiance. Lorsque les startups proposent des outils rudimentaires de recherche et de filtrage comme modèles génératifs, les investisseurs investissent dans des scénarios. M. Hagerty qualifie cela de « fuite de battage médiatique » et y voit une source croissante de confusion et de dommages à la réputation.

Dans des secteurs réglementés comme la finance ou la santé, les conséquences peuvent être plus graves. Si un utilisateur est induit en erreur en pensant qu'un système a une sensibilisation plus approfondie que celle qu'il possède, il peut déléguer des décisions qui auraient dû rester humaines. La frontière entre l'outil et l'agent devient floue, et avec elle, la responsabilité.

Ce problème entraîne également une perte d'efforts. M. Hagerty a cité recherche récente sur la mauvaise utilisation des LLM pour la prévision de séries chronologiques, une méthode statistique utilisée pour prédire les valeurs futures à partir de données historiques, une tâche pour laquelle les méthodes classiques restent plus précises et efficaces. Pourtant, certaines entreprises continuent à utiliser les LLM de toute façon, pour rechercher des nouveautés ou signaler l'innovation.

« Vous brûlez des GPU pour obtenir de mauvaises réponses », a-t-il dit. « Et pire encore, vous appelez ça le progrès. »

Le problème éthique n’est pas seulement l’inefficacité. Il s'agit d'une fausse déclaration. Les équipes construisent des produits autour d'une technologie qu'elles comprennent à peine, y ajoutent un marketing qui surestime leurs capacités et les déploient auprès d'utilisateurs qui n'ont aucun moyen d'évaluer ce qu'ils utilisent.