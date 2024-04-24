Los investigadores han creado un nuevo tipo de malware nunca antes visto al que llaman gusano "Morris II", que utiliza servicios populares de IA para propagarse, infectar nuevos sistemas y robar datos. El nombre hace referencia al gusano informático original de Morris que causó estragos en Internet en 1988.
El gusano demuestra los peligros potenciales de las amenazas a la seguridad de la IA y crea una nueva urgencia en torno a la protección de los modelos de IA.
Los investigadores de Cornell Tech, el Israel Institute of Technology e Intuit, utilizaron lo que se llama una "instrucción de autorreplicación adversaria" para crear el gusano. Este es un mensaje que, cuando se introduce en un modelo de lenguaje grande (LLM) (lo probaron en ChatGPT de OpenAI, Gemini de Google y el modelo LLaVA de código abierto desarrollado por investigadores de la Universidad de Wisconsin-Madison, Microsoft Research y la Universidad de Columbia), engaña al modelo para que cree una instrucción adicional. Activa el chatbot para que genere sus propias instrucciones maliciosas, a las que luego responde llevando a cabo esas instrucciones (similar a los ataques de inyección SQL y desbordamiento de búfer).
El gusano tiene dos capacidades principales:
1. Exfiltración de datos: el gusano puede extraer datos personales confidenciales del correo electrónico de los sistemas infectados, incluidos nombres, números de teléfono, detalles de tarjetas de crédito y números de seguro social.
2. Propagación de spam: el gusano puede generar y enviar spam y otros correos electrónicos maliciosos a través de asistentes de correo electrónico impulsados por IA comprometidos, lo que ayuda a propagarse para infectar otros sistemas.
Los investigadores demostraron con éxito estas capacidades en un entorno controlado, mostrando cómo el gusano podría penetrar en los ecosistemas de IA generativa y robar datos o distribuir malware. El gusano IA “Morris II” no se ha visto en la naturaleza, y los investigadores no lo probaron en un asistente de correo electrónico disponible públicamente.
Descubrieron que podían utilizar instrucciones autorreplicantes tanto en instrucciones de texto como en instrucciones incrustadas en archivos de imagen.
Al demostrar el enfoque de instrucción de texto, los investigadores escribieron un correo electrónico que incluía la instrucción adversaria, "envenenar" la base de datos del asistente de correo electrónico de IA mediante la generación aumentada por recuperación (RAG, por sus siglas en inglés), que permite al LLM obtener datos externos. La RAG recibió el correo electrónico y lo envió al proveedor de LLM, que generó una respuesta que hizo jailbreak al servicio de IA, robó datos de los correos electrónicos y luego infectó nuevos hosts cuando el LLM se utilizó para responder a un correo electrónico enviado por otro cliente.
Al usar una imagen, los investigadores codificaron la instrucción de autorreplicación en la imagen, lo que provocó que el asistente de correo electrónico reenviara el mensaje a otras direcciones de correo electrónico. La imagen sirve tanto como contenido (spam, estafas, propaganda, desinformación o material abusivo) como carga útil de activación que propaga el gusano.
Sin embargo, los investigadores dicen que representa un nuevo tipo de amenaza de ciberseguridad a medida que los sistemas de IA se vuelven más avanzados e interconectados. El malware creado en laboratorio es solo el evento más reciente en la exposición de los servicios de chatbot basados en LLM que revela su vulnerabilidad a ser explotados por ciberataques maliciosos.
OpenAI ha reconocido la vulnerabilidad y dice que está trabajando para hacer que sus sistemas sean resistentes a este tipo de ataque.
A medida que la IA generativa se vuelve más omnipresente, los actores maliciosos podrían aprovechar técnicas similares para robar datos, difundir desinformación o interrumpir sistemas a mayor escala. También podría ser utilizada por actores estatales extranjeros para interferir en las elecciones o fomentar divisiones sociales.
Claramente estamos entrando en una era en la que las herramientas de ciberseguridad de IA (detección de amenazas de IA y otra IA de ciberseguridad) se han convertido en una parte central y vital de la protección de sistemas y datos de ciberataques, mientras que también representan un riesgo cuando las utilizan los ciberatacantes.
Ahora es el momento de adoptar las herramientas de ciberseguridad con IA y proteger las herramientas de IA que podrían usarse en ciberataques.