Las inyecciones de prompts son la vulnerabilidad de seguridad número uno en el Top 10 de OWASP para aplicaciones LLM.3 Estos ataques pueden convertir los LLM en armas que los hackers pueden utilizar para difundir malware e información errónea, robar datos confidenciales e incluso hacerse con el control de sistemas y dispositivos.

Las inyecciones de prompts no requieren grandes conocimientos técnicos. Del mismo modo que los LLM pueden programarse con instrucciones en lenguaje natural, también pueden hackearse en inglés sencillo.

Para citar a Chenta Lee (enlace externo a ibm.com), Arquitecto jefe de inteligencia de amenazas de IBM Security, "Con los LLM, los atacantes ya no necesitan depender de Go, JavaScript, Python, etc., para crear código malicioso, sólo necesitan entender cómo comandar e incitar eficazmente a un LLM utilizando el inglés".

Cabe señalar que la inyección de prompts no es intrínsecamente ilegal. Muchos usuarios legítimos e investigadores utilizan técnicas de inyección puntual para comprender mejor las capacidades de LLM y las brechas de seguridad.

Entre los efectos comunes de los ataques por inyección de prompts se incluyen los siguientes: