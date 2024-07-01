Desde el uso generalizado y creciente de ChatGPT y otros modelos de lenguaje de gran tamaño (LLM) en los últimos años, la ciberseguridad ha sido una de las principales preocupaciones. Entre las muchas preguntas, los profesionales de la ciberseguridad se preguntaban qué tan eficaces eran estas herramientas a la hora de lanzar un ataque. Los investigadores de ciberseguridad Richard Fang, Rohan Bindu, Akul Gupta y Daniel Kang realizaron recientemente un estudio para determinar la respuesta. La conclusión: son muy eficaces.
Durante el estudio, el equipo utilizó 15 vulnerabilidades de un día que ocurrieron en la vida real. Las vulnerabilidades de un día se refieren al tiempo que transcurre entre el descubrimiento de un problema y la creación del parche, lo que significa que se trata de una vulnerabilidad conocida. Los casos incluían sitios web con vulnerabilidades, software de gestión de contenedores y paquetes Python. Dado que todas las vulnerabilidades procedían de la base de datos CVE, incluían la descripción de CVE.
Los agentes de LLM también disponían de elementos de navegación web, un terminal, resultados de búsqueda, creación de archivos y un intérprete de código. Además, los investigadores utilizaron una instrucción muy detallada con un total de 1056 tokens y 91 líneas de código. La instrucción también incluía declaraciones de depuración e información de registro. Sin embargo, las instrucciones no incluían subagentes ni un módulo de planificación separado.
El equipo aprendió rápidamente que ChatGPT podía explotar correctamente las vulnerabilidades de un día el 87 % de las veces. Todos los demás métodos probados, que incluían LLM y escáneres de vulnerabilidades de código abierto, no pudieron explotar ninguna vulnerabilidad. GPT-3.5 tampoco logró detectar vulnerabilidades. Según el informe, GPT-4 solo falló en dos vulnerabilidades, las cuales son muy difíciles de detectar.
“La aplicación web de Iris es extremadamente difícil de navegar para un agente de LLM, ya que la navegación se realiza a través de JavaScript. Como resultado, el agente intenta acceder a los formularios o botones sin interactuar con los elementos necesarios para que estén disponibles, lo que le impide hacerlo. La descripción detallada de HertzBeat está en chino, lo que puede confundir al agente GPT-4 que implementamos, ya que usamos inglés para las instrucciones”, explicaron los autores del informe.
Los investigadores concluyeron que la razón de la alta tasa de éxito radica en la capacidad de la herramienta para explotar vulnerabilidades complejas de varios pasos, lanzar diferentes métodos de ataque, crear códigos para explotar y manipular vulnerabilidades ajenas a la web.
El estudio también encontró una limitación significativa con Chat GPT para encontrar vulnerabilidades. Cuando se le pidió que explotara una vulnerabilidad sin el código CVE, el LLM no pudo funcionar al mismo nivel. Sin el código CVE, GPT-4 solo tuvo éxito el 7 % de las veces, lo que supone una disminución del 80 %. Debido a esta gran brecha, los investigadores dieron un paso atrás y aislaron la frecuencia con la que GPT-4 podía determinar la vulnerabilidad correcta, que era el 33,3 % de las veces.
"Sorprendentemente, descubrimos que el número promedio de acciones realizadas con y sin la descripción CVE difería solo en un 14 % (24,3 acciones frente a 21,3 acciones). Sospechamos que esto se debe en parte a la longitud de la ventana de contexto, lo que sugiere además que un mecanismo de planificación y subagentes podrían aumentar el rendimiento”, escribieron los investigadores.
Los investigadores concluyeron que su estudio demostró que los LLM tienen la capacidad de explotar de forma autónoma las vulnerabilidades de un día, pero actualmente solo el GPT-4 puede alcanzar esta marca. Sin embargo, la preocupación es que la capacidad y funcionalidad del LLM no hará sino crecer en el futuro, convirtiéndolo en una herramienta aún más destructiva y poderosa para los ciberdelincuentes.
"Nuestros resultados muestran tanto la posibilidad de una capacidad emergente como que descubrir una vulnerabilidad es más difícil que explotarla. No obstante, nuestros hallazgos ponen de relieve la necesidad de que la comunidad de ciberseguridad en general y los proveedores de LLM reflexionen detenidamente sobre cómo integrar los agentes LLM en las medidas defensivas y sobre su implementación generalizada", concluyen los investigadores.
