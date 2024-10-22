Las organizaciones tienen toda una nueva cartera de proyectos en desarrollo que aprovechan la IA generativa. Durante la fase de recopilación y manejo de datos, es necesario recopilar grandes volúmenes de datos para alimentar el modelo y proporcionar acceso a varias personas diferentes, incluyendo científicos de datos, ingenieros, desarrolladores y otros. Esto presenta un riesgo inherente al centralizar todos esos datos en un solo lugar y dar acceso a ellos a muchas personas. Esto significa que la IA generativa es un nuevo tipo de almacenamiento de datos que puede crear nuevos datos basados en datos organizacionales existentes. Ya sea que haya entrenado el modelo, lo haya ajustado o lo haya conectado a un RAG (base de datos vectorial), es probable que esos datos contengan PII, preocupaciones de privacidad y otra información confidencial. Esta montaña de datos confidenciales es un objetivo rojo parpadeante al que los atacantes intentarán acceder.

Dentro del desarrollo de modelos, se están creando nuevas aplicaciones de una manera completamente nueva con nuevas vulnerabilidades que se convierten en nuevos puntos de entrada que los atacantes intentarán explotar. El desarrollo suele comenzar con equipos de ciencia de datos que descargan y reutilizan modelos de machine learning de código abierto previamente entrenados de repositorios de modelos en línea, como HuggingFace o TensorFlow Hub. Los repositorios de modelos compartidos de código abierto nacieron de la complejidad inherente de la ciencia de datos, la escasez de profesionales y el valor que brindan a las organizaciones al reducir drásticamente el tiempo y el esfuerzo necesarios para la adopción de la IA generativa. Sin embargo, estos repositorios pueden carecer de controles de seguridad integrales, que en última instancia trasladan el riesgo a la empresa, y los atacantes cuentan con ello. Pueden inyectar una puerta trasera o malware en uno de estos modelos y volver a cargar el modelo infectado en los repositorios de intercambio de modelos, afectando a cualquiera que lo descargue. La escasez general de seguridad en torno a los modelos de ML, junto con los datos cada vez más confidenciales a los que están expuestos los modelos de ML, significa que los ataques dirigidos a estos modelos tienen una alta propensión a causar daños.

Y durante la inferencia y el uso en vivo, los atacantes pueden manipular las instrucciones para burlar las barreras de seguridad y engañar a los modelos para que se comporten de forma incorrecta, generando respuestas no permitidas a instrucciones dañinas, incluyendo información con sesgo, falsa y otra información tóxica, lo que causa daños a la reputación. O bien, los atacantes pueden manipular el modelo y analizar pares de entrada-salida para entrenar un modelo sustituto para imitar el comportamiento del modelo objetivo, "robando" efectivamente sus capacidades, lo que le cuesta a la empresa su ventaja competitiva.