L’essor de l’IA générative a eu des retombées positives, depuis les chatbots jusqu’aux évaluations de plusieurs milliards de dollars. Mais le fondement éthique qui sous-tend tout cela reste terriblement fragile.
En un seul mois, OpenAI a gagné et perdu des affaires de marques déposées devant un tribunal fédéral et Anthropic a discrètement annulé un blog généré par son propre modèle Claude après que des utilisateurs ont critiqué l’écriture comme étant vague et trompeuse. Les systèmes d’IA s’étendent à tous les secteurs et interfaces, les questions relatives à la responsabilité, à la sécurité et à l’intégrité ne sont plus théoriques. Ils sont opérationnels.
Ce fossé entre capacité et crédibilité est au cœur d'une réflexion éthique croissante dans le monde de l'IA. L'éthique est généralement traitée comme une couche de recouvrement, plutôt que comme une couche structurelle. Cependant, au sein d'IBM, certaines équipes tentent d'inverser ce schéma en intégrant les contraintes éthiques directement dans la formation, le marketing et le déploiement des systèmes.
PJ Hagerty, un vétéran de la communauté des développeurs ayant une solide expérience dans le domaine des outils open source et de la promotion de produits, est l'une des personnes impliquées dans ce travail. En tant que responsable de la promotion de l'IA chez IBM, son travail consiste à aider les développeurs à utiliser l'IA de manière plus efficace et plus responsable. Dans la pratique, cependant, cela signifie quelque chose de plus large : défier le battage médiatique, clarifier les limites et fixer des attentes réalistes. « Nous ne construisons pas des esprits », m'a-t-il dit. « Nous construisons des outils. Agissons en conséquence. »
Aujourd'hui, l'attention de l'IA se porte essentiellement sur les résultats, c'est-à-dire sur ce qu'un modèle génère, sur son degré de précision ou de conviction, sur ses performances par rapport à des critères de référence. Mais pour M. Hagerty, la véritable tension éthique commence plus tôt, au niveau du modèle de base. Il s’agit de l’infrastructure brute de l’IA moderne, la couche de base du machine learning entraînée sur de vastes jeux de données collectés sur le Web. C'est ce qui alimente les grands modèles linguistiques (LLM) tels que ChatGPT et Claude.
« C'est à la fondation que tout se passe », m'a confié M. Hagerty. « C'est la première chose que le système apprend, et s'il est plein de déchets, ces déchets ne disparaissent pas. »
Ces modèles de base sont conçus pour être à usage général. C'est ce qui les rend à la fois puissantes et dangereuses, a déclaré M. Hagerty. Parce qu'ils ne sont pas conçus en fonction de tâches ou de contraintes spécifiques, ils ont tendance à tout absorber, qu'il s'agisse de structures sémantiques précieuses ou de boues toxiques de l'internet. Et une fois entraînés, les modèles sont difficiles à auditer. Même leurs créateurs ne peuvent souvent pas dire avec certitude ce qu'un modèle sait ou comment il répondra à un prompt donné.
M. Hagerty compare cette situation au coulage d'une base en béton défectueuse pour un gratte-ciel. Si le mélange n'est pas correct dès le départ, vous ne verrez peut-être pas les fissures immédiatement. Mais avec le temps, la structure devient instable. Dans le domaine de l'IA, l'équivalent est un comportement fragile, un biais involontaire ou une utilisation abusive catastrophique une fois qu'un système est déployé. S'il n'est pas façonné avec soin dès le départ, un modèle transmet les risques qu'il a absorbés pendant la formation à toutes les applications en aval.
Il n'est pas le seul à partager cette préoccupation. Des chercheurs du Centre de recherche sur les modèles de fondation (CRFM) de Stanford ont à plusieurs reprises mis en garde contre les risques émergents de l’entraînement à grande échelle, notamment la propagation des biais, l’hallucination, la contamination des données et la difficulté à identifier les échecs. Ces problèmes peuvent être atténués mais pas éliminés, ce qui rend les choix de conception précoces, tels que la curation des données, le filtrage et la gouvernance, plus critiques.
Selon M. Hagerty, l'un des principaux obstacles éthiques à des progrès significatifs est l'imprécision du terme « IA » utilisé par les entreprises. Demandez à cinq équipes produit ce qu’elles entendent par « alimenté par l’IA », et vous obtiendrez probablement cinq réponses différentes. M. Hagerty considère cette erreur de définition comme l'un des principaux échecs éthiques de notre époque.
« La plupart du temps, quand les gens parlent d’IA, ils pensent à l’automatisation. Ou un arbre de décision. Ou bien une déclaration si/alors », a-t-il dit.
Le manque de clarté des termes n'est pas une querelle universitaire. Lorsque les entreprises présentent un logiciel déterministe comme un raisonnement intelligent, les utilisateurs ont tendance à lui faire confiance. Lorsque les startups proposent des outils rudimentaires de recherche et de filtrage comme modèles génératifs, les investisseurs investissent dans des scénarios. M. Hagerty qualifie cela de « fuite de battage médiatique » et y voit une source croissante de confusion et de dommages à la réputation.
Dans des secteurs réglementés comme la finance ou la santé, les conséquences peuvent être plus graves. Si un utilisateur est induit en erreur en pensant qu'un système a une sensibilisation plus approfondie que celle qu'il possède, il peut déléguer des décisions qui auraient dû rester humaines. La frontière entre l'outil et l'agent devient floue, et avec elle, la responsabilité.
Ce problème entraîne également une perte d'efforts. M. Hagerty a cité recherche récente sur la mauvaise utilisation des LLM pour la prévision de séries chronologiques, une méthode statistique utilisée pour prédire les valeurs futures à partir de données historiques, une tâche pour laquelle les méthodes classiques restent plus précises et efficaces. Pourtant, certaines entreprises continuent à utiliser les LLM de toute façon, pour rechercher des nouveautés ou signaler l'innovation.
« Vous brûlez des GPU pour obtenir de mauvaises réponses », a-t-il dit. « Et pire encore, vous appelez ça le progrès. »
Le problème éthique n’est pas seulement l’inefficacité. Il s'agit d'une fausse déclaration. Les équipes construisent des produits autour d'une technologie qu'elles comprennent à peine, y ajoutent un marketing qui surestime leurs capacités et les déploient auprès d'utilisateurs qui n'ont aucun moyen d'évaluer ce qu'ils utilisent.
Une grande partie de l'inquiétude du public concernant l'IA s'est concentrée sur la possibilité d'une perte massive d'emplois. L'IA remplacera-t-elle les avocats, les enseignants, les programmeurs et les écrivains ? M. Hagerty considère que cette question est à la fois prématurée et mal formulée.
« La plupart de ces outils ne remplacent pas les gens », a-t-il déclaré. « Ils remplacent des tâches, et seulement les plus fastidieuses. »
Il a cité des assistants de code comme watsonx Code Assistant et GitHub Copilot, ainsi que des outils comme Cursor et Amazon's CodeWhisperer. Ces systèmes n’écrivent pas d’applications entières à partir de zéro. Ils permettent de remplir des blocs de code prévisibles, de suggérer des modèles standard et de réduire la charge de travail liée à l'écriture d'une logique répétitive. Le gain n'est pas la créativité, mais la rapidité.
Hagerty estime que c'est un avantage net. Les développeurs juniors peuvent se lancer plus rapidement. Les ingénieurs seniors peuvent se concentrer sur l'architecture plutôt que sur la syntaxe. La barrière à l'entrée est plus basse et les difficultés liées à la maintenance sont réduites. Mais il met en garde contre la tentation d'imaginer que ce problème est résolu.
« Ces modèles sont entraînés sur le Web ouvert », explique-t-il. « Et il y a beaucoup de place dans ces jeux de données, y compris le mien. »
Ces déchets incluent du code non sécurisé, des pratiques obsolètes et des hacks spécifiques au contexte. Il inclut également le plagiat, les violations de licence et les bogues fantômes qui peuvent refaire surface dans les résultats générés. Ainsi, si un modèle permet de gagner du temps, il risque également de réintroduire les problèmes qu'il était censé réduire. Ce n’est pas la qualité qui est mise à l’échelle ; tous les éléments auxquels le modèle a été exposé.
C'est là que M. Hagerty pense que les révisions humaines restent essentiels. L'outil peut vous aider, mais la responsabilité incombe toujours au développeur.
L’une des défaillances les plus notoires en matière de sécurité de l’IA a eu lieu il y a près de dix ans, lorsque le chatbot Tay a été publié sur Twitter. En quelques heures, il a été détourné pour publier du contenu offensant et des théories de complot. Ses créateurs l’ont mis hors ligne et ont émis des excuses. Mais cet épisode est devenu un symbole durable de ce qui se passe lorsque les développeurs publient des systèmes sans garde-fous.
Aujourd’hui, la plupart des entreprises ont appris à encapsuler leurs modèles génératifs dans des couches de modération. Les filtres, les classificateurs, les nettoyeurs de prompt et le réglage du renforcement peuvent être utiles, mais ils ne sont pas infaillibles. Selon Hagerty, ces mesures ont tendance à se concentrer sur des problèmes superficiels, tels que le ton du langage ou les blasphèmes, plutôt que sur des vulnérabilités plus profondes, comme une injection de prompt ou une réaffectation malveillante. Il considère plutôt la sécurité comme une question de conception plus large. « Ce modèle sera-t-il utilisé à mauvais escient ? Vont-elles être hors contexte ? Les résultats seront-ils fiables alors qu’ils ne devraient pas l’être ? » dit-il. « Si vous n’avez pas réfléchi à ces questions, vous n’avez pas terminé. » Votre production n’est pas prête. »
M. Hagerty a cité l'exemple des outils qui manipulent ou génèrent des médias, tels que les générateurs d'images, les éditeurs vidéo et les clones vocaux. Non seulement ces systèmes produisent du contenu, mais ils modifient également la perception. Selon lui, lorsque les résultats sont suffisamment réalistes, ils commencent à affecter la mémoire, le jugement et l'attribution.
Dans ces cas, la sécurité ne repose pas sur la justesse technique, mais sur la sensibilisation contextuelle. Que se passe-t-il avec cette sortie une fois qu’elle quitte votre interface ? Qui la voit ? Qu'est-ce qu'ils supposent ?
Ces questions ont rarement une seule réponse. Mais les ignorer complètement, selon M. Hagerty, est une erreur.
Dans les environnements technologiques en constante évolution, la gouvernance peut sembler fastidieuse. Ceci ralentit les libérations. Ceci ajoute de la paperasserie. Ceci crée une ambiguïté. Mais pour M. Hagerty, ce point de vue n'est pas pertinent.
« On n’enverrait pas de code non testé », dit-il. « Pourquoi expédier un modèle non audité ? »
Il considère des outils comme watsonx.governance d’IBM comme une infrastructure nécessaire, et non comme des extras optionnels. Ces systèmes permettent aux équipes de suivre les données de formation, de surveiller les changements de modèle et de signaler les écarts au fil du temps. Ils aident les entreprises à se conformer aux nouvelles réglementations, mais plus important encore, ils créent une mémoire institutionnelle. Ils permettent aux équipes de voir ce qu’elles ont fait, comment elles l’ont fait et pourquoi.
Cela n'est pas seulement important pour la conformité, mais aussi pour la qualité. Si les performances d'un modèle seront différentes le mois prochain, vous devez savoir ce qui a changé. S'il commence à halluciner en cours de production, vous devez trouver un moyen de retracer le problème jusqu'à sa source. La bonne gouvernance est l'équivalent du contrôle de version en termes d'IA.
Et ceci va au-delà des modèles. M. Hagerty a souligné l'intérêt croissant pour le « désapprentissage automatique », la capacité à supprimer chirurgicalement des données ou des comportements problématiques sans repartir de zéro. Cette approche, bien qu'encore précoce, reflète un changement d'état d'esprit plus large. L'objectif n'est pas de construire des modèles plus intelligents, mais de construire des modèles capables de s'adapter, de se corriger et de rendre des comptes.
Rien de tout cela n'exige la perfection. M. Hagerty n’hésite pas à avouer que les biais persisteront, que la sécurité échouera et que les outils seront mal utilisés. Mais la différence entre une défaillance acceptable et un dommage causé par négligence se résume au processus.
« Ne vous inquiétez pas. Ne faites pas trop confiance. Posez de meilleures questions dès le début », dit-il.
Il recommande d’intégrer des avis éthiques dans les cycles de planification, et non seulement de lancer des listes de contrôle. Utiliser des outils comme IA Fairness 360 et Granite Guardian d'IBM, ainsi qu'ARX, pour détecter les problèmes évidents. Exécuter des tests en équipe rouge pour détecter les edge avant que les utilisateurs ne le fassent. Et surtout, des systèmes de construction qui facilitent la correction de trajectoire.
Selon lui, le travail ne consiste pas à arrêter les dégâts. Il s'agit de façonner l'impact.
« Vous ne construirez pas un système parfait », dit-il. « Mais vous pouvez en construire une qui échoue plus lentement, qui échoue de la manière que vous comprenez. »
Dans cette optique, l'éthique n'est pas une contrainte mais un principe de conception. C'est un moyen de créer de meilleurs logiciels, des systèmes plus prévisibles, des attentes plus claires et, en fin de compte, plus de valeur.
Interrogé sur ce qui lui donne de l’espoir, M. Hagerty n’a pas parlé d’alignement, d’AGI ou de cadres politiques. Il a parlé de Code Assistant.
« Ça fonctionne », a-t-il dit. « Ça réduit la friction. Il ne prétend pas faire plus que ce dont il est capable. C’est le modèle à suivre. »
Il veut que l'IA soit ennuyeuse. Utile. Étroite. Honnête sur ce qu’il fait et sur son fonctionnement. Il ne s'agit pas de limiter les ambitions, mais de les clarifier. Miser sur la fiabilité plutôt que sur la surprise. Concevoir des systèmes qui se comportent bien non seulement dans les démonstrations, mais aussi dans les déploiements.
L’IA ne disparaît pas. Les outils continueront d'évoluer, tout comme les attentes. Selon M. Hagerty, les équipes qui réussiront seront celles qui sauront allier puissance technique et discipline éthique. Parce que ça marche.
