La IA de código abierto se refiere a los sistemas de inteligencia artificial que se pueden utilizar, examinar, modificar y distribuir para cualquier propósito, sin tener que pedir permiso.
Estas libertades se alinean con la definición de IA de código abierto establecida por la Open Source Initiative (OSI), considerada globalmente como la guardiana de los principios y políticas del código abierto.1
El auge de la IA generativa ayudó a catalizar la era de la IA de código abierto. Según un informe de Economist Impact, dos tercios de los grandes modelos lingüísticos (LLM), una categoría de modelos básicos que se utilizan normalmente para crear aplicaciones de GenAI, como los chatbots y los asistentes de codificación, publicados en 2023 eran de código abierto.2
Para que el software se considere de código abierto, cualquier persona debe poder utilizar, estudiar, modificar y redistribuir su código fuente como mejor le parezca y, por lo general, sin coste alguno. Sin embargo, el ámbito de la IA de código abierto es mucho más amplio que el del software de código abierto.
Los sistemas de IA abarcan no solo los modelos de IA en sí, sino también los conjuntos de datos utilizados durante el entrenamiento, las ponderaciones y parámetros del modelo y el código fuente. Este código fuente incluye el código para filtrar y procesar los datos de entrenamiento, el código para el entrenamiento y las pruebas de modelos, cualquier biblioteca de apoyo y el código de inferencia para ejecutar el modelo. Todos estos componentes deben cumplir y estar disponibles según las condiciones de la IA de código abierto.
La definición de IA de código abierto de OSI permite la exclusión de datos de entrenamiento no públicos que no se pueden compartir, como la información de identificación personal (PII).3 Para este tipo de datos, debe proporcionarse una descripción detallada, incluida su procedencia, características y alcance, cómo se recopilaron y seleccionaron los datos, cualquier procedimiento de etiquetado y métodos de procesamiento y filtrado de datos.4
Las ponderaciones son los parámetros centrales de los modelos preentrenados. Se aprenden durante el entrenamiento y determinan cómo un modelo interpreta los nuevos datos y hace predicciones.
Las ponderaciones abiertas se comparten públicamente y suelen estar disponibles bajo licencias de código abierto, lo que permite echar un vistazo al estado final de un modelo de deep learning. Y aunque significan un avance gradual hacia la transparencia en la IA, las ponderaciones abiertas aún no ofrecen la imagen completa que ofrece la IA de código abierto. Sin los datos de entrenamiento o el código de entrenamiento, otros no pueden examinar o recrear el proceso de entrenamiento.
Según un estudio reciente de IBM, más del 80 % de los responsables de la toma de decisiones de TI encuestados afirmaron que al menos una cuarta parte de las plataformas o soluciones de IA de su empresa se basan en código abierto. Y las empresas que aprovechan los ecosistemas de código abierto tienen más probabilidades de lograr un ROI positivo que las que no lo hacen.
Además de impulsar el retorno de la inversión, la IA de código abierto ofrece estas ventajas clave:
● Accesibilidad
● Innovación colaborativa
● Eficiencia en costes
● Personalización
● Transparencia
La IA de código abierto rompe las barreras de entrada, especialmente para los nuevos en este campo. También facilita el acceso a organizaciones que no pueden invertir importantes recursos financieros en el desarrollo de la IA, como las pequeñas empresas o las compañías sin conocimientos especializados.
La comunidad es la base del código abierto, y los desarrolladores, investigadores, organizaciones y otras partes interesadas de la IA trabajan juntos para mejorar continuamente las tecnologías de IA. Este esfuerzo colectivo conduce al aprendizaje y al intercambio, abriendo oportunidades para aprovechar el trabajo de otros y estimulando la innovación.
Los modelos de IA de código abierto suelen ser de uso gratuito. Esto permite a las empresas ahorrarse los costes iniciales de desarrollar y formar sus propios modelos o adquirirlos a proveedores de código cerrado con elevados precios de suscripción o derechos de licencia.
Las organizaciones pueden modificar los sistemas de IA de código abierto en sus propios términos, lo que les proporciona un mayor control. Pueden adaptar estos sistemas a sus necesidades y casos de uso particulares, afinando los modelos de IA de código abierto en sus propios datos empresariales y optimizando estos modelos para tareas específicas.
La naturaleza abierta de la IA de código abierto cultiva la transparencia de la IA. Saber cómo se ha construido y entrenado un sistema de IA y cómo toma sus decisiones ayuda a infundir seguridad y confianza, especialmente en sectores en los que los resultados de la IA pueden repercutir en la vida de las personas, como la sanidad, los recursos humanos y el sistema judicial.
Esta transparencia también facilita la localización de errores, la identificación de sesgos y la detección de fallos de seguridad para que los desarrolladores de IA los aborden rápidamente. Además, la visibilidad del funcionamiento interno de la IA de código abierto permite una mejor auditabilidad por parte de los responsables políticos en sectores como el gobierno y las finanzas, donde el cumplimiento de la normativa es primordial.
A pesar de sus muchos beneficios, la IA de código abierto tiene sus limitaciones. Estos son algunos de los desafíos asociados a la IA de código abierto:
● Falta de apoyo dedicado u oportuno
● Posibilidad de uso indebido
● Vulnerabilidades de seguridad
A diferencia de los modelos propietarios, los modelos de IA de código abierto no suelen tener tiempos de respuesta fijos para problemas urgentes, un equipo de soporte dedicado para ayudar a resolver problemas o plazos consistentes para lanzar parches o actualizaciones de seguridad. Las empresas deben encargarse de supervisar sus aplicaciones de IA y crear sus propios procedimientos de asistencia.
Como cualquiera puede utilizar la IA de código abierto para cualquiera que sea su objetivo, tiene el potencial de emplearse con fines malintencionados. Los actores de amenazas pueden aplicar la IA de código abierto para automatizar los ciberataques, generar deepfakes o difundir información errónea y desinformación.
Aunque la IA de código abierto es transparente, su visibilidad expone vulnerabilidades de seguridad que los malos actores pueden explotar. Una vez más, recae en las organizaciones la responsabilidad de establecer barreras en torno a sus soluciones de IA de código abierto.
Existen innumerables modelos de IA de código abierto , a la mayoría de los cuales se puede acceder en Hugging Face o a través de sus repositorios de GitHub. A continuación, se muestran algunos de los más populares:
● Ámbar
● Crystal
● DeepSeek-R1
● Falcon-7B y Falcon-40B
● Granite
● OLMo
● Pythia
● Qwen
● T5
Amber es un modelo de inglés de 7000 millones de parámetros desarrollado por LLM360, una iniciativa para IA propiedad de la comunidad a través de la investigación y desarrollo de grandes modelos de código abierto. Amber se basa en la arquitectura Llama de Meta y está disponible bajo la licencia Apache 2.0. Según la OSI, Amber cumple con la definición de IA de código abierto de la OSI.1
Crystal es otro gran modelo de lenguaje de LLM360 con un tamaño de 7 mil millones de parámetros. Se publica bajo la licencia Apache 2.0 y destaca por equilibrar las tareas de codificación y procesamiento del lenguaje natural (PLN). Según la OSI, Crystal cumple con la definición de IA de código abierto de la OSI.1
DeepSeek-R1 es un modelo de razonamiento de la startup china de IA DeepSeek. Utiliza una arquitectura de machine learning Mixture of Experts (MoE) y se entrenó utilizando aprendizaje por refuerzo a gran escala para refinar sus capacidades de razonamiento. Está disponible bajo la licencia MIT.
Falcon-7B y Falcon-40B son modelos de decodificador causal únicamente con 7 y 40 mil millones de parámetros, respectivamente. Desarrollados por investigadores del Instituto de Innovación Tecnológica (TII) de los EAU, ambos modelos fueron entrenados con el propio RefinedWeb de TII, un enorme conjunto de datos que contiene datos web filtrados en inglés. Falcon-7B y Falcon-40B están disponibles bajo la licencia Apache 2.0.
IBM Granite es una serie de modelos de IA multimodales preparados para la empresa. Se basan en conjuntos de datos de instrucciones de código abierto con licencias permisivas, junto con conjuntos de datos sintéticos seleccionados internamente. Los modelos están disponibles bajo la licencia Apache 2.0.
Los modelos fundacionales de Granite consisten en pequeños modelos de lenguaje con capacidades de razonamiento diseñados para flujos de trabajo de agencia, un modelo de visión especializado en tareas de visión para la comprensión de documentos e imágenes, modelos de voz para el reconocimiento y la traducción automáticos del habla, y modelos de código para tareas generativas de código.
OLMo es una familia de modelos de lenguaje de Ai2, un instituto sin ánimo de lucro de investigación en IA. Los modelos vienen en tamaños de parámetro de 1, 7, 13 y 32 mil millones. Los modelos, el código de entrenamiento, el conjunto de evaluación para reproducir los resultados de OLMo y los datos de entrenamiento utilizados en cada fase, incluido el preentrenamiento, el entrenamiento medio y el entrenamiento posterior, están disponibles gratuitamente bajo la licencia Apache 2.0. Según la OSI, OLMo cumple con la definición de IA de código abierto de la OSI.1
Desarrollado por el laboratorio de investigación sin ánimo de lucro EleutherAI, Pythia es un conjunto de LLMs que varían en tamaño desde 14 millones hasta 12 mil millones de parámetros y se lanzan bajo la licencia Apache 2.0. Todos los datos asociados, el código, los modelos y los puntos de control están a disposición del público, junto con instrucciones para replicar el entrenamiento, con el objetivo de fomentar la interpretabilidad de la IA, la ética de la IA y la transparencia. Según la OSI, Pythia cumple con la definición de IA de código abierto de la OSI.1
Qwen es una serie de LLMs de la empresa china de computación en la nube Alibaba Cloud. Qwen incluye modelos de lenguaje, un modelo de lenguaje de visión y variantes optimizadas para audio, codificación y matemáticas. La mayoría de los modelos Qwen están disponibles bajo la licencia Apache 2.0, aunque los modelos más grandes tienen licencias propietarias.
T5 es un modelo de transformador de transferencia de texto a texto desarrollado por investigadores de Google. Destaca en una amplia gama de tareas de PLN y se publica bajo la licencia Apache 2.0. Según la OSI, T5 cumple con la definición de IA de código abierto de la OSI.1
La OSI también ha analizado Llama 2 de Meta, Phi-2 de Microsoft, Mixtral de Mistral y Grok de xAI y concluyó que estos modelos no cumplen con la definición de IA de código abierto de la OSI "porque carecen de los componentes necesarios y/o sus acuerdos legales son incompatibles con los principios de código abierto".1
Trabajar en proyectos de IA de código abierto puede resultar abrumador. Estas son algunas herramientas de IA de código abierto conocidas que pueden ayudar:
● Keras
● OpenCV
● PyTorch
● Scikit-learn
● TensorFlow
Keras es una interfaz de programación de aplicaciones (API) escrita en Python para construir, entrenar y evaluar modelos de aprendizaje profundo. Es compatible y puede ejecutarse sobre los marcos JAX, PyTorch o TensorFlow.
OpenCV es una biblioteca de visión artificial de código abierto operada por la Open Source Vision Foundation. Alberga más de 2500 algoritmos optimizados para aplicaciones de visión en tiempo real, incluidos el reconocimiento de imágenes, la clasificación de imágenes, la detección de objetos y el seguimiento de objetos.
PyTorch es un marco desarrollado originalmente por Meta y ahora forma parte de la Fundación Linux. Admite redes neuronales dinámicas y aceleración por GPU , se integra perfectamente con librerías y paquetes de Python, ofrece una interfaz intuitiva y tiene una sobrecarga mínima de marco de trabajo.
Scikit-learn es un módulo de Python para aprendizaje automático. Presenta algoritmos de clasificación, agrupación y regresión, entre otros, y ofrece herramientas para el procesamiento de datos, la selección y evaluación de modelos y la creación de visualizaciones.
TensorFlow es una plataforma para crear e implementar modelos de aprendizaje automático. Creado por Google, TensorFlow contiene una biblioteca de conjuntos de datos y modelos, API para diferentes lenguajes de programación y herramientas para optimizar los flujos de trabajo de machine learning. También cuenta con una sólida comunidad de código abierto y ayuda a las personas a desarrollar su experiencia en machine learning a través de libros, currículos seleccionados y cursos en línea.
1 The Open-Source AI Definition 1.0, Open Source Initiative, consultado el 12 de mayo de 2025
2 Open sourcing the IA revolution, Economist Impact, 2024
3 Answers to frequently asked questions, Open Source Initiative, 29 de octubre de 2024
4 The Open Source AI Definition – 1.0, Open Source Initiative, consultado el 12 de mayo de 2025