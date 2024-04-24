Los investigadores han creado un nuevo tipo de malware nunca antes visto al que denominan gusano "Morris II", que utiliza servicios populares de IA para propagarse, infectar nuevos sistemas y robar datos. El nombre hace referencia al gusano informático original Morris que causó estragos en internet en 1988.
El gusano demuestra los peligros potenciales de las amenazas a la seguridad de la IA y crea una nueva urgencia en torno a la seguridad de los modelos de IA.
Los investigadores de Cornell Tech, el Instituto de Tecnología de Israel e Intuit, utilizaron lo que se llama una "instrucción autorreplicante adversarial" para crear el gusano. Este es una instrucción que, cuando se introduce en un modelo de lenguaje de gran tamaño (LLM) (lo probaron en ChatGPT de OpenAI, Gemini de Google y el modelo LLaVA de código abierto desarrollado por investigadores de la Universidad de Wisconsin-Madison, la investigación de Microsoft y la Universidad de Columbia), engaña al modelo para que cree una instrucción adicional. Activa que el chatbot genere sus propias instrucciones maliciosas, a las que responde ejecutando esas instrucciones (similar a los ataques de inyección SQL y desbordamiento de búfer).
El gusano tiene dos capacidades principales:
1. Exfiltración de datos: el gusano puede extraer datos personales confidenciales del correo electrónico de los sistemas infectados, incluidos nombres, números de teléfono, datos de tarjetas de crédito y números de la seguridad social.
2. Propagación de spam: el gusano puede generar y enviar spam y otros correos electrónicos maliciosos a través de asistentes de correo electrónico con IA, lo que ayuda a propagarse para infectar otros sistemas.
Los investigadores demostraron con éxito estas capacidades en un entorno controlado, mostrando cómo el gusano podía introducirse en los ecosistemas de IA generativa y robar datos o distribuir malware. El gusano de IA "Morris II" no se ha visto en la naturaleza, y los investigadores no lo probaron en un asistente de correo electrónico disponible públicamente.
Descubrieron que podían utilizar instrucciones autorreplicantes tanto en instrucciones de texto como en instrucciones incrustadas en archivos de imagen.
Boletín del sector
Manténgase al día sobre las tendencias más importantes e intrigantes del sector en materia de IA, automatización, datos y mucho más con el boletín Think. Consulte la Declaración de privacidad de IBM.
Su suscripción se enviará en inglés. Encontrará un enlace para darse de baja en cada boletín. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.
Al demostrar el enfoque de instrucción, los investigadores escribieron un correo electrónico que incluía la instrucción adversaria, "envenenando" la base de datos del asistente de correo electrónico de IA mediante la generación aumentada por recuperación (RAG), que permite al LLM obtener datos externos. La RAG recibió el correo electrónico y lo envió al proveedor de LLM, que generó una respuesta que hizo jailbreak al servicio de IA, robó datos de los correos electrónicos y luego infectó nuevos hosts cuando el LLM se utilizó para responder a un correo electrónico enviado por otro cliente.
Al usar una imagen, los investigadores codificaban la instrucción autorreplicante en la imagen, lo que hacía que el asistente de correo electrónico reenviara el mensaje a otras direcciones. La imagen sirve tanto de contenido (spam, estafas, propaganda, desinformación o material de abuso) como de carga de activación que propaga el gusano.
Sin embargo, los investigadores afirman que representa un nuevo tipo de amenaza para la ciberseguridad a medida que los sistemas de IA se vuelven más avanzados e interconectados. El malware creado en laboratorio es solo el último evento en la exposición de los servicios de chatbot basados en LLM que revela su vulnerabilidad a ser explotados por ciberataques maliciosos.
OpenAI ha reconocido la vulnerabilidad y dice que está trabajando para hacer que sus sistemas sean resistentes a este tipo de ataque.
A medida que la IA generativa se vuelve más omnipresente, los actores maliciosos podrían aprovechar técnicas similares para robar datos, difundir desinformación o interrumpir sistemas a mayor escala. También podrían utilizarla actores estatales extranjeros para interferir en las elecciones o fomentar las divisiones sociales.
Estamos entrando claramente en una era en la que las herramientas de ciberseguridad de IA (detección de amenazas de IA y otra IA de ciberseguridad) se han convertido en una parte central y vital de la protección de sistemas y datos de ciberataques, mientras que también suponen un riesgo cuando las utilizan los ciberatacantes.
Ahora es el momento de adoptar las herramientas de ciberseguridad con IA y proteger las herramientas de IA que podrían usarse en ciberataques.