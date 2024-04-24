Los investigadores de Cornell Tech, el Instituto de Tecnología de Israel e Intuit, utilizaron lo que se llama una "instrucción autorreplicante adversarial" para crear el gusano. Este es una instrucción que, cuando se introduce en un modelo de lenguaje de gran tamaño (LLM) (lo probaron en ChatGPT de OpenAI, Gemini de Google y el modelo LLaVA de código abierto desarrollado por investigadores de la Universidad de Wisconsin-Madison, la investigación de Microsoft y la Universidad de Columbia), engaña al modelo para que cree una instrucción adicional. Activa que el chatbot genere sus propias instrucciones maliciosas, a las que responde ejecutando esas instrucciones (similar a los ataques de inyección SQL y desbordamiento de búfer).

El gusano tiene dos capacidades principales:

1. Exfiltración de datos: el gusano puede extraer datos personales confidenciales del correo electrónico de los sistemas infectados, incluidos nombres, números de teléfono, datos de tarjetas de crédito y números de la seguridad social.

2. Propagación de spam: el gusano puede generar y enviar spam y otros correos electrónicos maliciosos a través de asistentes de correo electrónico con IA, lo que ayuda a propagarse para infectar otros sistemas.

Los investigadores demostraron con éxito estas capacidades en un entorno controlado, mostrando cómo el gusano podía introducirse en los ecosistemas de IA generativa y robar datos o distribuir malware. El gusano de IA "Morris II" no se ha visto en la naturaleza, y los investigadores no lo probaron en un asistente de correo electrónico disponible públicamente.

Descubrieron que podían utilizar instrucciones autorreplicantes tanto en instrucciones de texto como en instrucciones incrustadas en archivos de imagen.