Con la adopción de la inteligencia artificial (IA) en todas las industrias y casos de uso, prevenir los ataques a la cadena de suministro de software impulsados por IA nunca ha sido más importante.
Investigaciones recientes de SentinelOne expusieron un nuevo actor de ransomware, llamado NullBulge, que ataca las cadenas de suministro de software al convertir el código en repositorios de código abierto como Hugging Face y GitHub. El grupo, que afirma ser una organización hacktivista motivada por una causa contra la IA, apunta específicamente a estos recursos para envenenar los conjuntos de datos utilizados en el entrenamiento de modelos de IA.
No importa si utiliza soluciones de IA convencionales, las integra en sus pilas tecnológicas existentes a través de interfaces de programación de aplicaciones (API) o incluso desarrolla sus propios modelos a partir de modelos fundacionales de código abierto: toda la cadena de suministro de software de IA está ahora claramente en el punto de mira de los atacantes cibernéticos.
Los componentes de código abierto desempeñan un papel crítico en la cadena de suministro de la IA. Solo las empresas más grandes tienen acceso a las grandes cantidades de datos necesarios para entrenar un modelo desde cero, por lo que tienen que depender en gran medida de conjuntos de datos de código abierto como LAION 5B o Common Corpus. El gran tamaño de estos conjuntos de datos también significa que es extremadamente difícil mantener la calidad de los datos y el cumplimiento de las leyes de derechos de autor y privacidad. Por el contrario, muchos modelos de IA generativa convencionales, como ChatGPT, son cajas negras en el sentido de que utilizan sus propios conjuntos de datos curados. Esto conlleva su propio conjunto de desafíos de seguridad.
Los modelos verticalizados y patentados pueden perfeccionar los modelos fundacionales de código abierto con entrenamiento adicional utilizando sus propios conjuntos de datos. Por ejemplo, una empresa que desarrolla un chatbot de atención al cliente de próxima generación podría utilizar sus registros anteriores de comunicaciones con los clientes para crear un modelo adaptado a sus necesidades específicas. Dichos datos han sido durante mucho tiempo un objetivo para los delincuentes cibernéticos, pero el ascenso meteórico de la IA generativa lo ha hecho aún más atractivo para los actores nefastos.
Al dirigirse a estos conjuntos de datos, los delincuentes cibernéticos pueden envenenarlos con desinformación o códigos y datos maliciosos. Luego, una vez que esa información comprometida ingresa al proceso de entrenamiento del modelo de IA, comenzamos a ver un efecto dominó que abarca todo el ciclo de vida del software de IA. Puede llevar miles de horas y una gran cantidad de potencia informática entrenar un modelo de lenguaje (LLM). Es una empresa enormemente costosa, tanto desde el punto de vista financiero como medioambiental. Sin embargo, si los conjuntos de datos utilizados en el entrenamiento se han visto comprometidos, es probable que todo el proceso tenga que empezar desde cero.
La mayoría de los ataques a la cadena de suministro de software de IA se llevan a cabo mediante métodos de manipulación de puertas traseras como los mencionados anteriormente. Sin embargo, esa no es ciertamente la única manera, especialmente a medida que los ataques cibernéticos dirigidos a los sistemas de IA se vuelven cada vez más generalizados y sofisticados. Otro método es el ataque de inundación, en el que los atacantes envían grandes cantidades de información no maliciosa a través de un sistema de IA en un intento de ocultar otra cosa como un fragmento de código malicioso.
También estamos viendo un aumento en los ataques contra las API, especialmente aquellas que carecen de procedimientos de autenticación sólidos. Las API son esenciales para integrar la IA en las innumerables funciones para las que las empresas la utilizan ahora, y aunque a menudo se supone que la seguridad de las API depende del proveedor de la solución, en realidad es una responsabilidad compartida.
Algunos ejemplos recientes de ataques a API incluyen el compromiso ZenML o la vulnerabilidad Nvidia AI Platform. Si bien ambos han sido abordados por sus respectivos proveedores, seguirán más a medida que los delincuentes cibernéticos amplíen y diversifiquen los ataques contra las cadenas de suministro de software.
Nada de esto debe tomarse como una advertencia para mantenerse alejado de la IA. Después de todo, usted no dejaría de usar el correo electrónico debido al riesgo de estafas de phishing. Lo que sí significan estos avances es que la IA es ahora la nueva frontera en el delito cibernético, y la seguridad debe estar incorporada en todo lo que hace al desarrollar, desplegar, usar y mantener tecnologías impulsadas por IA, ya sean propias o proporcionadas por un proveedor externo.
Para ello, las empresas necesitan una trazabilidad completa de todos los componentes utilizados en el desarrollo de la IA. También necesitan explicación y verificación completas para cada resultado generado por IA. No puede hacerse eso sin mantener a los humanos al tanto y poner la seguridad a la vanguardia de su estrategia. Sin embargo, si ve la IA únicamente como una forma de ahorrar tiempo y reducir costos despidiendo trabajadores, sin tener en cuenta las consecuencias, entonces es solo cuestión de tiempo antes de que ocurra un desastre.
Las soluciones de seguridad impulsadas por IA también desempeñan un papel crítico en la lucha contra las amenazas. No son un reemplazo para los analistas de seguridad talentosos, sino un poderoso complemento que les ayuda a hacer lo que mejor saben a una escala que de otro modo sería imposible de lograr.
