Alors que les modèles d’IA générative grand public intègrent des barrières de sécurité, les alternatives open source ne comportent aucune restriction de ce type. Voici ce que cela signifie sur le plan de la cybercriminalité.
Il ne fait aucun doute que l’open source est l’avenir des logiciels. Selon le rapport State of Open Source 2024, plus des deux tiers des entreprises ont augmenté leur utilisation de logiciels open source au cours de l’année écoulée.
L’IA générative ne fait pas exception. Le nombre de développeurs contribuant aux projets open source sur GitHub et d’autres plateformes est en pleine expansion. Les entreprises investissent des milliards dans l’IA générative pour un large éventail de cas d’utilisation, allant des chatbots de service client à la génération de code. Nombre d’entre elles construisent des modèles IA propriétaires à partir de zéro ou en s’appuyant sur des projets open source.
Mais les entreprises légitimes ne sont pas les seules à investir dans l’IA générative. Celle-ci constitue également une véritable mine d’or pour les acteurs malveillants, qu’il s’agisse d’États voyous déterminés à répandre de fausses informations parmi leurs rivaux ou de cybercriminels développant des codes malveillants ou des escroqueries de phishing ciblées.
Pour l’instant, les garde-fous mis en place par les développeurs pour protéger leurs modèles d’IA contre les abus sont l’un des rares éléments qui freinent les acteurs malveillants. ChatGPT ne générera pas sciemment un e-mail de phishing, et Midjourney ne créera pas d’images abusives. Cependant, ces modèles appartiennent à des écosystèmes entièrement fermés, où les développeurs qui les ont créés ont le pouvoir de dicter leur utilisation.
Il n’a fallu que deux mois à ChatGPT pour atteindre 100 millions d’utilisateurs après sa sortie publique. Depuis, des milliers d’utilisateurs ont tenté de franchir ses barrières de sécurité et de le débrider pour faire ce qu’ils voulaient, avec plus ou moins de succès.
L’essor irrésistible des modèles open source rendra de toute façon ces garde-fous obsolètes. Bien que leurs performances soient généralement inférieures à celle des modèles à code source fermé, il ne fait aucun doute que les modèles open source s’amélioreront. La raison est simple : les développeurs peuvent utiliser les données de leur choix pour les entraîner. Sur le plan positif, cela peut favoriser la transparence et la concurrence tout en soutenant la démocratisation de l’IA, au lieu de la laisser uniquement entre les mains des grandes entreprises et des régulateurs.
Toutefois, en l’absence de garde-fous, l’IA générative sera la prochaine cible des cybercriminels. Des IA malveillantes comme FraudGPT et WormGPT sont largement disponibles sur les marchés du dark web. Les deux sont fondées sur le grand modèle de langage (LLM) open source GPT-J, développé par EleutherAI en 2021.
Les acteurs malveillants utilisent également des synthétiseurs d’images open source tels que Stable Diffusion dans le but de créer des modèles spécialisés dotés de la capacité de générer des contenus abusifs. Le contenu vidéo généré par l’IA est à nos portes. À ce jour, ses capacités sont uniquement limitées par la disponibilité de modèles open source hautement performants et par la puissance de calcul considérable nécessaire à leur fonctionnement.
Newsletter sectorielle
Restez au fait des tendances les plus étonnantes du secteur dans le domaine de l’IA, de l’automatisation, des données et bien d’autres avec la newsletter Think. Consultez la déclaration de confidentialité d’IBM.
Lire la Déclaration de confidentialité d’IBM.
Vous recevrez votre abonnement en anglais. Vous trouverez un lien de désabonnement dans chaque newsletter. Vous pouvez gérer vos abonnements ou vous désabonner ici. Consultez la Déclaration de confidentialité d’IBM pour plus d’informations.
Il peut être tentant de considérer ces problèmes comme des menaces externes qu’une équipe suffisamment formée devrait être capable de gérer. Cependant, à mesure que de plus en plus d’entreprises investissent dans la création de modèles d’IA générative propriétaires, elles risquent également d’élargir leur surface d’attaque interne.
L’une des plus grandes sources de menace dans le développement de modèles est le processus d’entraînement lui-même. Par exemple, si le jeu de données d’entraînement contient des données confidentielles, protégées par le droit d’auteur ou incorrectes, celles-ci pourraient réapparaître plus tard en réponse à un prompt. Or, une telle situation peut être le résultat d’une négligence de la part de l’équipe de développement ou d’une attaque délibérée par empoisonnement des données menée par un acteur malveillant.
Les attaques par injection de prompts constituent une autre source de risque. Elles consistent à tromper ou à débrider un modèle afin qu’il génère du contenu contraire aux conditions d’utilisation du fournisseur. C’est un risque auquel sont confrontés tous les modèles d’IA générative, mais les risques sont sans doute plus importants dans les environnements open source qui ne bénéficient pas d’une surveillance suffisante. Une fois que les outils d’IA sont open source, les entreprises dont ils sont issus perdent le contrôle du développement et de l’utilisation de la technologie.
Le moyen le plus simple de comprendre les menaces posées par l’IA non réglementée est de demander à celles à code source fermé de mal se comporter. Dans la plupart des cas, elles refuseront de coopérer, mais comme il a été démontré à de nombreuses reprises, il suffit généralement de prompts créatifs ainsi que d’essais et d’erreurs. Cependant, vous ne rencontrerez pas de telles restrictions avec les systèmes d’IA open source développés par des entreprises comme Stability AI, EleutherAI ou Hugging Face, ni avec un système propriétaire créé en interne.
En fin de compte, la menace que représentent les modèles d’IA open source réside dans leur vulnérabilité à une utilisation abusive. Si la démocratisation du développement des modèles est en soi un objectif noble, la menace ne fera que croître, et les entreprises ne peuvent pas compter sur les organismes de réglementation pour suivre le rythme. C’est pourquoi l’IA elle-même est également devenue un outil essentiel dans l’arsenal des professionnels de la cybersécurité. Pour comprendre pourquoi, lisez notre guide sur la cybersécurité basée sur l’IA.