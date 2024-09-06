Con la adopción de la inteligencia artificial (IA) disparándose en todos los sectores y casos de uso, prevenir los ataques a la cadena de suministro de software impulsados por IA nunca ha sido tan importante.
Una investigación reciente de SentinelOne ha revelado la existencia de un nuevo actor de ransomware, llamado NullBulge, que ataca las cadenas de suministro de software utilizando código de repositorios de código abierto como Hugging Face y GitHub. El grupo, que afirma ser una organización hacktivista motivada por una causa anti-IA, dirige específicamente estos recursos para envenenar conjuntos de datos usados en el entrenamiento de modelos de IA.
No importa si utiliza soluciones de IA convencionales, las integra en sus pilas tecnológicas existentes a través de interfaces de programación de aplicaciones (API) o incluso desarrolla sus propios modelos a partir de modelos fundacionales de código abierto, toda la cadena de suministro de software de IA está ahora de lleno en el punto de mira de los ciberatacantes.
Los componentes de código abierto desempeñan un papel crítico en la cadena de suministro de la IA. Solo las empresas más grandes tienen acceso a las enormes cantidades de datos necesarias para entrenar un modelo desde cero, por lo que tienen que depender en gran medida de conjuntos de datos de código abierto como LAION 5B o Common Corpus. El gran tamaño de estos conjuntos de datos también significa que es extremadamente difícil mantener la calidad de los datos y el cumplimiento de las leyes de derechos de autor y privacidad. Por el contrario, muchos modelos de IA generativa dominantes, como ChatGPT, son cajas negras en el sentido de que utilizan sus propios conjuntos de datos curados. Esto conlleva su propio conjunto de retos en materia de seguridad.
Los modelos verticalizados y patentados pueden perfeccionar los modelos fundacionales de código abierto con un entrenamiento adicional utilizando sus propios conjuntos de datos. Por ejemplo, una empresa que desarrolle un chatbot de atención al cliente de próxima generación podría utilizar sus registros anteriores de comunicaciones con los clientes para crear un modelo adaptado a sus necesidades específicas. Estos datos han sido durante mucho tiempo un objetivo para los ciberdelincuentes, pero el meteórico ascenso de la IA generativa la ha hecho aún más atractiva para los actores nefastos.
Al dirigirse a estos conjuntos de datos, los ciberdelincuentes pueden envenenarlos con desinformación o códigos y datos maliciosos. Luego, una vez que esa información comprometida entra en el proceso de entrenamiento del modelo de IA, empezamos a ver un efecto dominó que abarca todo el ciclo de vida del software de IA. Puede llevar miles de horas y una gran cantidad de potencia informática para entrenar un modelo de lenguaje de gran tamaño (LLM). Es una tarea enormemente costosa, tanto desde el punto de vista financiero como medioambiental. Sin embargo, si los conjuntos de datos utilizados en el entrenamiento se han visto comprometidos, es probable que todo el proceso tenga que empezar de cero.
La mayoría de los ataques a la cadena de suministro de software de IA tienen lugar a través de métodos de manipulación por la puerta trasera como los mencionados anteriormente. Sin embargo, no es la única manera, sobre todo a medida que los ciberataques contra los sistemas de IA se generalizan y sofistican cada vez más. Otro método es el ataque por inundación, en el que los atacantes envían enormes cantidades de información no maliciosa a través de un sistema de IA en un intento de encubrir otra cosa, como un fragmento de código malicioso.
También estamos viendo un aumento de ataques contra API, especialmente aquellas que carecen de procedimientos de autenticación robustos. Las API son esenciales para integrar la IA en la multitud de funciones para las que las empresas la utilizan actualmente, y aunque a menudo se asume que la seguridad de las API recae en el proveedor de la solución, en realidad es una responsabilidad muy compartida.
Algunos ejemplos recientes de ataques a API de IA incluyen el compromiso de ZenML o la vulnerabilidad de la plataforma de IA de Nvidia. Aunque ambos ya han sido abordados por sus respectivos proveedores, seguirán más a medida que los ciberdelincuentes expandan y diversifiquen los ataques contra las cadenas de suministro de software.
Nada de esto debe tomarse como una advertencia para mantenerse alejado de la IA. Después de todo, no dejaría de usar el correo electrónico por el riesgo de estafas de phishing. Lo que sí significan estos avances es que la IA es ahora la nueva frontera del cibercrimen, y la seguridad debe estar integrada en todo lo que haga al desarrollar, implementar, utilizar y mantener tecnologías con IA, ya sean suyas o proporcionadas por un proveedor externo.
Para ello, las empresas necesitan una trazabilidad completa de todos los componentes utilizados en el desarrollo de la IA. También necesitan explicación y verificación completas para cada resultado generado por IA. No puede hacerlo sin mantener a los humanos informados y poner la seguridad en el primer plano de su estrategia. Si, sin embargo, ve la IA únicamente como una forma de ahorrar tiempo y reducir costes despidiendo trabajadores, sin tener en cuenta las consecuencias, entonces es solo cuestión de tiempo antes de que ocurra un desastre.
Las soluciones de seguridad con IA también desempeñan un papel crítico a la hora de contrarrestar las amenazas. No son un sustituto de los analistas de seguridad con talento, sino un potente complemento que les ayuda a hacer lo que mejor saben hacer a una escala que de otro modo sería imposible conseguir.
