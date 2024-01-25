Pour citer un aphorisme courant, tous les modèles sont faux. Cela vaut pour les domaines des statistiques, des sciences et de l’IA. Les modèles créés sans expertise dans le domaine peuvent conduire à des résultats erronés.

Aujourd’hui, un petit groupe homogène de personnes détermine les données à utiliser pour entraîner les modèles d’IA générative, qui proviennent de sources largement dominées par l’anglais. « Pour la plupart des plus de 6 000 langues existant dans le monde, les données textuelles disponibles ne sont pas suffisantes pour entraîner un modèle de fondation à grande échelle » (extrait de « On the Opportunities and Risks of Foundation Models », Bommasani et al., 2022).

De plus, les modèles eux-mêmes sont créés à partir d’architectures limitées : « Presque tous les modèles de TALN de pointe sont désormais adaptés à partir de l’un des quelques modèles de fondation, tels que BERT, RoBERTa, BART, T5, etc. Si cette homogénéisation produit un effet de levier extrêmement élevé (toute amélioration des modèles de fondation peut entraîner des avantages immédiats pour l’ensemble du TALN), elle constitue également un inconvénient : tous les systèmes d’IA pourraient hériter des mêmes biais problématiques de quelques modèles de fondation (Bommasani et al.) ».

Pour que l’IA générative reflète mieux les diverses communautés qu’elle sert, un éventail beaucoup plus large de données humaines doit être représenté dans les modèles.

L’évaluation de la précision des modèles va de pair avec l’évaluation des biais. Nous devons donc nous demander quel est l’objectif du modèle et pour qui il est optimisé. Prenons par exemple les algorithmes de recommandation de contenu et les algorithmes des moteurs de recherche : qui en tire le plus grand bénéfice ? Les parties prenantes peuvent avoir des intérêts et des objectifs très différents. Les algorithmes et les modèles nécessitent des cibles ou des proxys pour l’erreur de Bayes : l’erreur minimale qu’un modèle doit améliorer. Ce proxy est souvent une personne, telle qu’un expert en la matière possédant une expertise dans le domaine.