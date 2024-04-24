Des chercheurs ont créé un nouveau type de logiciel malveillant inédit qu’ils ont appelé « Morris II ». Ce ver utilise des services d’IA populaires pour se propager, infecter de nouveaux systèmes et voler des données. Ce nom fait référence au ver informatique Morris original qui a semé la pagaille sur Internet en 1988.
Le ver démontre les dangers potentiels des menaces de sécurité de l’IA et crée une nouvelle urgence autour de la sécurisation des modèles d’IA.
Des chercheurs de Cornell Tech, l’Institut de Technologie d’Israël et Intuit, ont utilisé ce que l’on appelle une « invite contradictoire auto-répliquant » pour créer le ver. Il s’agit d’une invite qui, lorsqu’elle est intégrée à un grand modèle de langage (LLM) (ils l’ont testé sur ChatGPT d’OpenAI, Gemini de Google et le modèle open source LLaVA développé par des chercheurs de l’Université du Wisconsin-Madison, de Microsoft Research et de l’Université de Columbia), incite le modèle à créer une autre invite. Il déclenche le chatbot pour qu’il génère ses propres invites malveillantes, auxquels il répond ensuite en exécutant ces instructions (similaire à l’injection SQL et aux attaques par dépassement de tampon).
Le ver a deux capacités principales :
1. Exfiltration des données : le ver peut extraire des données personnelles sensibles des e-mails des systèmes infectés, notamment les noms, les numéros de téléphone, les informations de carte de crédit et les numéros de sécurité sociale.
2. Propagation de spam : le ver peut générer et envoyer des spams et d’autres e-mails malveillants via des assistants de messagerie alimentés par l’IA, ce qui l’aide à se propager et à infecter d’autres systèmes.
Les chercheurs ont réussi à démontrer ces capacités dans un environnement contrôlé, en montrant comment le ver pouvait s’infiltrer dans les écosystèmes d’IA générative et voler des données ou distribuer des logiciels malveillants. Le ver IA « Morris II » n’a jamais été observé dans la nature et les chercheurs ne l’ont pas testé sur un assistant d’e-mail accessible au public.
Ils ont découvert qu’ils pouvaient utiliser des invites auto-répliquantes dans les invites textuelles et les invites intégrées dans les fichiers d’images.
Lors de la démonstration de l’approche de l’invite, les chercheurs ont écrit un e-mail incluant le prompt contradictoire, « empoisonnant » la base de données de l’assistant de messagerie IA à l’aide de la génération augmentée de récupération (RAG), qui permet au LLM de récupérer des données externes. La RAG a reçu l’e-mail et l’a envoyé au fournisseur de LLM, qui a généré une réponse qui a jailbreaké le service d’IA, volé des données dans les e-mails et infecté de nouveaux hôtes lorsque le LLM a été utilisé pour répondre à un e-mail envoyé par un autre client.
Lorsqu’on utilise une image, les chercheurs ont encodé l’invite auto-répliquante dans l’image, ce qui a permis à l’assistant e-mail de transférer le message vers d’autres adresses e-mail. L’image sert à la fois de contenu (spam, escroquerie, propagande, désinformation ou matériel d’abus) et de charge utile d’activation qui propage le ver.
Toutefois, les chercheurs estiment qu’il s’agit d’un nouveau type de menace pour la cybersécurité, les systèmes d’IA étant de plus en plus avancés et interconnectés. Les logiciels malveillants créés en laboratoire ne sont que le dernier événement de l’exposition des services de chatbot basés sur les LLM qui révèlent leur vulnérabilité à être exploités pour des cyberattaques malveillantes.
OpenAI a reconnu la vulnérabilité et affirme qu’elle s’efforce de rendre ses systèmes résistants à ce type d’attaque.
L’IA générative devenant de plus en plus omniprésente, les acteurs malveillants pourraient tirer parti de techniques similaires pour voler des données, diffuser des fausses informations ou perturber les systèmes à plus grande échelle. Elle pourrait également être utilisée par des acteurs étatiques étrangers pour s’immiscer dans les élections ou pour fomenter des troubles sociaux.
Nous entrons clairement dans une ère où les outils de cybersécurité de l’IA (détection des menaces par IA et autres IA de cybersécurité) sont devenus une partie essentielle et vitale de la protection des systèmes et des données contre les cyberattaques, tout en présentant un risque lorsqu’ils sont utilisés par des pirates.
Le moment est venu d’adopter les outils de cybersécurité basés sur l’IA et de sécuriser les outils IA qui pourraient être utilisés pour des cyberattaques.