Les modèles d’IA boîte noire apparaissent pour deux raisons : soit leurs développeurs les transforment volontairement en boîtes noires, soit ils deviennent des boîtes noires en tant que sous-produit de leur entraînement.

Certains développeurs et programmeurs d’IA masquent le fonctionnement interne des outils d’IA avant de les rendre accessibles au public. Cette tactique sert souvent à protéger la propriété intellectuelle. Les créateurs du système savent exactement comment il fonctionne, mais ils gardent le code source et le processus de prise de décision secret. C’est pourquoi de nombreux algorithmes d’IA traditionnels basés sur des règles sont des boîtes noires.

Cependant, bon nombre des technologies d’IA les plus avancées, y compris les outils d’IA générative, sont ce que l’on pourrait appeler des « boîtes noires organiques ». Les créateurs de ces outils ne masquent pas intentionnellement leurs opérations. En fait, les systèmes d’apprentissage profond qui alimentent ces modèles sont si complexes que même leurs créateurs ne comprennent pas exactement ce qui se passe à l’intérieur.

Les algorithmes d’apprentissage profond sont un type d’algorithme de machine learning qui utilise des réseaux neuronaux multicouches. Alors qu’un modèle de machine learning traditionnel peut utiliser un réseau à une ou deux couches, les modèles d’apprentissage profond peuvent en exploiter des centaines, voire des milliers. Chaque couche contient plusieurs neurones, qui sont des paquets de code conçus pour imiter les fonctions du cerveau humain.

Les réseaux neuronaux profonds peuvent consommer et analyser des jeux de données bruts et non structurés avec peu d’intervention humaine. Ils peuvent accepter des quantités massives de données, identifier des modèles, apprendre de ces modèles et utiliser ce qu’ils ont appris pour générer de nouvelles sorties, telles que des images, des vidéos et du texte.

Cette capacité d’apprentissage à grande échelle sans supervision permet aux systèmes d’IA de réaliser des tâches comme le traitement avancé du langage, la création de contenus originaux et d’autres prouesses qui peuvent sembler proches de l’intelligence humaine.

Cependant, ces réseaux de neurones profonds sont intrinsèquement opaques. Les utilisateurs, y compris les développeurs d’IA, peuvent voir ce qui se passe au niveau des couches d’entrée et de sortie, également appelées « couches visibles ». Ils peuvent voir les données qui entrent et les prédictions, les classifications ou tout autre contenu qui en sort. Mais ils ne savent pas ce qui se passe dans toutes les couches du réseau intermédiaires, ou « couches cachées ».

Les développeurs d’IA savent globalement comment les données circulent à travers chaque couche du réseau et ils ont une idée générale de ce que les modèles font avec les données qu’ils ingèrent. Mais ils ne connaissent pas tous les détails. Par exemple, ils ne savent pas vraiment ce que cela signifie lorsqu’une certaine combinaison de neurones s’active, ou la manière exacte dont le modèle trouve et combine des embeddings vectoriels pour répondre à un prompt.

Même les modèles d’IA open source qui partagent leur code sous-jacent sont en fin de compte des boîtes noires, car les utilisateurs ne peuvent toujours pas interpréter ce qui se passe dans chaque couche du modèle une fois actif.