Para que el software se considere de código abierto, cualquier persona debe poder utilizar, estudiar, modificar y redistribuir su código fuente como mejor le parezca y, por lo general, sin coste alguno. Sin embargo, el ámbito de la IA de código abierto es mucho más amplio que el del software de código abierto.

Los sistemas de IA abarcan no solo los modelos de IA en sí, sino también los conjuntos de datos utilizados durante el entrenamiento, las ponderaciones y parámetros del modelo y el código fuente. Este código fuente incluye el código para filtrar y procesar los datos de entrenamiento, el código para el entrenamiento y las pruebas de modelos, cualquier biblioteca de apoyo y el código de inferencia para ejecutar el modelo. Todos estos componentes deben cumplir y estar disponibles según las condiciones de la IA de código abierto.

La definición de IA de código abierto de OSI permite la exclusión de datos de entrenamiento no públicos que no se pueden compartir, como la información de identificación personal (PII).3 Para este tipo de datos, debe proporcionarse una descripción detallada, incluida su procedencia, características y alcance, cómo se recopilaron y seleccionaron los datos, cualquier procedimiento de etiquetado y métodos de procesamiento y filtrado de datos.4