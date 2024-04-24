Los investigadores de Cornell Tech, el Israel Institute of Technology e Intuit, utilizaron lo que se llama una "instrucción de autorreplicación adversaria" para crear el gusano. Este es un mensaje que, cuando se introduce en un modelo de lenguaje grande (LLM) (lo probaron en ChatGPT de OpenAI, Gemini de Google y el modelo LLaVA de código abierto desarrollado por investigadores de la Universidad de Wisconsin-Madison, Microsoft Research y la Universidad de Columbia), engaña al modelo para que cree una instrucción adicional. Activa el chatbot para que genere sus propias instrucciones maliciosas, a las que luego responde llevando a cabo esas instrucciones (similar a los ataques de inyección SQL y desbordamiento de búfer).

El gusano tiene dos capacidades principales:

1. Exfiltración de datos: el gusano puede extraer datos personales confidenciales del correo electrónico de los sistemas infectados, incluidos nombres, números de teléfono, detalles de tarjetas de crédito y números de seguro social.

2. Propagación de spam: el gusano puede generar y enviar spam y otros correos electrónicos maliciosos a través de asistentes de correo electrónico impulsados por IA comprometidos, lo que ayuda a propagarse para infectar otros sistemas.

Los investigadores demostraron con éxito estas capacidades en un entorno controlado, mostrando cómo el gusano podría penetrar en los ecosistemas de IA generativa y robar datos o distribuir malware. El gusano IA “Morris II” no se ha visto en la naturaleza, y los investigadores no lo probaron en un asistente de correo electrónico disponible públicamente.

Descubrieron que podían utilizar instrucciones autorreplicantes tanto en instrucciones de texto como en instrucciones incrustadas en archivos de imagen.