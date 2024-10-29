Los modelos de IA de caja negra surgen por una de dos razones: o sus desarrolladores los convierten en cajas negras a propósito o se convierten en cajas negras como subproducto de su entrenamiento.

Algunos desarrolladores y programadores de IA ocultan el funcionamiento interno de las herramientas de IA antes de lanzarlas al público. Esta táctica a menudo está destinada a proteger la propiedad intelectual. Los creadores del sistema saben exactamente cómo funciona, pero mantienen en secreto el código fuente y el proceso de toma de decisiones. Muchos algoritmos de IA tradicionales basados en reglas son cajas negras por este motivo.

Sin embargo, muchas de las tecnologías de IA más avanzadas, incluidas las herramientas de IA generativa, son lo que podríamos llamar "cajas negras orgánicas". Los creadores de estas herramientas no ocultan intencionalmente sus operaciones. Más bien, los sistemas de aprendizaje profundo que alimentan estos modelos son tan complejos que incluso los propios creadores no entienden exactamente lo que sucede dentro de ellos.

Los algoritmos de aprendizaje profundo son un tipo de algoritmo de machine learning que utiliza redes neuronales multicapa. Donde un modelo tradicional de machine learning podría usar una red con una o dos capas, los modelos de aprendizaje profundo pueden tener cientos o incluso miles de capas. Cada capa contiene múltiples neuronas, que son paquetes de código diseñados para imitar las funciones del cerebro humano.

Las redes neuronales profundas pueden consumir y analizar big data sin procesar y no estructurados con poca intervención humana. Pueden absorber cantidades masivas de datos, identificar patrones, aprender de estos patrones y utilizar lo que aprenden para generar nuevos resultados, como imágenes, video y texto.

Esta capacidad de aprendizaje a gran escala sin supervisión permite a los sistemas de IA hacer cosas como el procesamiento avanzado del lenguaje, la creación de contenido original y otras hazañas que pueden parecer cercanas a la inteligencia humana.

Sin embargo, estas redes neuronales son inherentemente opacas. Los usuarios, incluidos los desarrolladores de IA, pueden ver lo que sucede en las capas de entrada y salida, también llamadas "capas visibles". Pueden ver los datos que entran y las predicciones, clasificaciones u otro contenido que sale. Pero no saben lo que sucede en todas las capas de red intermedias, las llamadas "capas ocultas".

Los desarrolladores de IA saben ampliamente cómo se mueven los datos a través de cada capa de la red, y tienen una idea general de lo que hacen los modelos con los datos que ingieren. Pero no conocen todos los detalles. Por ejemplo, es posible que no sepan qué significa cuando se activa una determinada combinación de neuronas, o exactamente cómo el modelo encuentra y combina incorporaciones vectoriales para responder a una instrucción.

Incluso los modelos de IA de código abierto que comparten su código subyacente son, en última instancia, cajas negras porque los usuarios aún no pueden interpretar lo que sucede dentro de cada capa del modelo cuando está activo.