¿Qué es la IA de código abierto?

Libro abierto con luz brillante que fluye en todas direcciones

¿Qué es la IA de código abierto?

La IA de código abierto se refiere a los sistemas de inteligencia artificial que pueden ser utilizados, examinados, alterados y distribuidos para cualquier propósito, sin tener que solicitar permiso.

Estas libertades se alinean con la definición de IA de código abierto establecida por la Open Source Initiative (OSI), que se considera globalmente como el administrador de los principios y políticas de código abierto.1

El auge de la IA generativa contribuyó a catalizar la era de la IA de código abierto. Según un informe de Economist Impact, dos tercios de los modelos de lenguaje grande (LLMs)—una categoría de modelos fundacionales comúnmente utilizados para crear aplicaciones de IA generativa como chatbots y asistentes de programación— lanzados en 2023 eran de código abierto.2

IA de código abierto frente a software de código abierto

Para que el software se considere de código abierto, cualquier persona debe poder usar, estudiar, modificar y redistribuir su código fuente como mejor le parezca y, por lo general, sin costo alguno. Sin embargo, el alcance de la IA de código abierto es mucho más amplio que el del software de código abierto.

Los sistemas de IA abarcan no solo los modelos de IA en sí mismos, sino también los conjuntos de datos utilizados durante el entrenamiento, los pesos y parámetros del modelo y el código fuente. Este código fuente incluye código para filtrar y procesar datos de entrenamiento, código para entrenamiento y pruebas de modelos, cualquier biblioteca de soporte y el código de inferencia para ejecutar el modelo. Todos estos componentes deben cumplir y estar disponibles bajo términos de IA de código abierto.

La definición de IA de código abierto de OSI permite la exclusión de datos de entrenamiento no públicos que no se pueden compartir, como la información de identificación personal (PII). 3 Para este tipo de datos, se debe proporcionar una descripción detallada, incluida su procedencia, características y alcance, cómo se recopilaron y seleccionaron los datos, cualquier procedimiento de etiquetado y métodos de procesamiento de datos4.

IA de código abierto frente a pesos abiertos

Los pesos son los parámetros centrales de los modelos previamente entrenados. Se aprenden durante el entrenamiento y determinan cómo un modelo interpreta los nuevos datos y hace predicciones.

Las ponderaciones abiertas se comparten públicamente y suelen estar disponibles bajo licencias de código abierto, lo que proporciona un vistazo al estado final de un modelo de aprendizaje profundo. Y aunque significan un avance gradual hacia la transparencia en la IA, los pesos abiertos aún no ofrecen la imagen completa que ofrece la IA de código abierto. Sin los datos de entrenamiento o el código de entrenamiento, otros no pueden examinar o recrear el proceso de entrenamiento.

Beneficios de la IA de código abierto

Según un estudio reciente de IBM, más del 80 % de los responsables de la toma de decisiones de TI encuestados informaron que al menos una cuarta parte de las plataformas o soluciones de IA de su empresa se basan en código abierto. Y las empresas que aprovechan ecosistemas de código abierto tienen más probabilidades de lograr un retorno de la inversión (ROI) positivo que aquellas que no lo están.

Además de impulsar el ROI, la IA de código abierto ofrece estas ventajas clave:

    ● Accesibilidad

    ● Innovación colaborativa

    ● Eficiencia en costos

    ● Personalización

    ● Transparencia

Accesibilidad:

La IA de código abierto elimina las barreras de entrada, especialmente para aquellos que se inician en este campo. También proporciona acceso a organizaciones que no pueden invertir recursos financieros significativos en el desarrollo de IA, como pequeñas empresas o empresas sin experiencia especializada.

Innovación colaborativa

La comunidad está en el corazón del código abierto, con desarrolladores de IA, investigadores, organizaciones y otras stakeholders que trabajan juntos para mejorar continuamente las Tecnologías de IA. Este esfuerzo colectivo conduce al aprendizaje y el intercambio, abriendo oportunidades para aprovechar el trabajo de otros y estimulando la innovación.

Eficiencia de costos

Los modelos de IA de código abierto suelen ser de uso gratuito. Esto permite a las empresas ahorrar en los costos iniciales de desarrollar y entrenar sus propios modelos o adquirirlos de proveedores de código cerrado con altos precios de suscripción o tarifas de licencia.

Personalización

Las organizaciones pueden modificar los sistemas de IA de código abierto según sus propios criterios, lo que les otorga un mayor control. Pueden adaptar estos sistemas a sus necesidades y casos de uso particulares, ajustando los modelos de IA de código abierto a sus propios datos empresariales y optimizando estos modelos para tareas específicas.

Transparencia

La naturaleza abierta de la IA de código abierto cultiva la transparencia de la IA. Saber cómo se creó y entrenó un sistema de IA y cómo toma decisiones ayuda a infundir confianza, especialmente para industrias donde los resultados de la IA pueden afectar vidas, como la atención médica, los recursos humanos y el sistema judicial.

Esta transparencia también facilita la localización de errores, la identificación de sesgos y la detección de fallos de seguridad para que los desarrolladores de IA puedan solucionarlos rápidamente. Además, la visibilidad del funcionamiento interno de la IA de código abierto permite una mejor auditabilidad por parte de los formuladores de políticas en sectores como el gobierno y las finanzas donde el cumplimiento normativo es primordial.

Retos de la IA de código abierto

A pesar de sus muchos beneficios, la IA de código abierto viene con limitaciones. A continuación, se presentan algunos desafíos asociados con la IA de código abierto:

    ● Falta de apoyo dedicado u oportuno

    ● Posibilidad de mal uso

    ● Vulnerabilidades de seguridad

Falta de soporte dedicado u oportuno

A diferencia de los modelos propietarios, los modelos de IA de código abierto no suelen tener tiempos de respuesta fijos para problemas urgentes, un equipo de soporte dedicado para ayudar a resolver problemas o plazos consistentes para lanzar parches o actualizaciones de seguridad. Las empresas deben asumir la responsabilidad de supervisar sus aplicaciones de IA y crear sus propios procedimientos de apoyo.

Posibilidad de mal uso

Dado que cualquiera puede utilizar la IA de código abierto para cualquier fin, existe la posibilidad de que se emplee con fines maliciosos. Los actores de amenazas pueden aplicar IA de código abierto para automatizar ciberataques, generar deepfakes o difundir información errónea y desinformación.

Vulnerabilidades de seguridad

Si bien la IA de código abierto es transparente, su visibilidad expone vulnerabilidades de seguridad que los actores maliciosos pueden explotar. Una vez más, la responsabilidad recae en las organizaciones para establecer barandillas alrededor de sus soluciones de IA de código abierto.

Diseño 3D de pelotas rodando en una pista

Las últimas novedades e insights sobre IA

Descubra insights y noticias de expertos sobre IA, la nube y mucho más en el boletín semanal Think. 

Ejemplos de modelos de IA de código abierto

Existen innumerables modelos de IA de código abierto, la mayoría de los cuales se puede acceder en Hugging Face o a través de sus repositorios de GitHub. Estos son algunos de los más populares:

    ● Ámbar

    ● Crystal

    ● DeepSeek-R1

    ● Falcon-7B y Falcon-40B

    ● Granite

    ● OLMo

    ● Pythia

    ● Qwen

    ● T5

Ámbar

Amber es un modelo de inglés de 7.000 millones de parámetros desarrollado por LLM360, una iniciativa para IA propiedad de la comunidad a través de la investigación y desarrollo de grandes modelos de código abierto. Amber se basa en la arquitectura Llama de Meta y está disponible bajo la licencia Apache 2.0. Según OSI, Amber cumple con la definición de IA de código abierto de OSI.1

Cristal

Crystal es otro gran modelo de lenguaje de LLM360 con un tamaño de parámetro de 7 mil millones. Está lanzado bajo la licencia Apache 2.0 y destaca en equilibrar tareas de programación y procesamiento de lenguaje natural (NLP). Según OSI, Crystal cumple con la definición de IA de código abierto de OSI. 1

DeepSeek-R1

DeepSeek-R1 es un modelo de razonamiento de la startup china de IA DeepSeek. Utiliza una arquitectura de machine learning Mixture of Experts (MoE) y se capacitó utilizando el aprendizaje por refuerzo a gran escala para refinar sus habilidades de razonamiento. Está disponible bajo la licencia MIT.

Falcon-7B y Falcon-40B

Falcon-7B y Falcon-40B son modelos causales solo con decodificador con 7 y 40 mil millones de parámetros, respectivamente. Desarrollados por investigadores del Instituto de Innovación Tecnológica (TII) de los EAU, ambos modelos se entrenaron en el propio RefinedWeb de TII, un enorme conjunto de datos que contiene datos web en inglés filtrados. Falcon-7B y Falcon-40B están disponibles bajo la licencia Apache 2.0.

Granite

IBM® Granite™ es una serie de modelos de IA multimodales listos para su uso en empresas. Se basan en conjuntos de datos de instrucciones de código abierto con licencias permisivas junto con conjuntos de datos sintéticos curados internamente. Los modelos están disponibles bajo la licencia Apache 2.0.

Los modelos fundacionales de Granite consisten en pequeños modelos de lenguaje con capacidades de razonamiento diseñadas para flujos de trabajo de agentes, un modelo de visión especializado en tareas de visión para la comprensión de documentos e imágenes, modelos de voz para reconocimiento y traducción automáticos de voz, y modelos de código para tareas generativas de código.

OLMo

OLMo es una familia de modelos de lenguaje de Ai2, un instituto sin ánimo de lucro de investigación en IA. Los modelos vienen en tamaños de parámetro de 1, 7, 13 y 32 mil millones. Los modelos, el código de entrenamiento, la suite de evaluación para reproducir los resultados de OLMo y los datos de entrenamiento utilizados en cada fase, incluido el entrenamiento previo, intermedio y posterior al entrenamiento, están disponibles gratuitamente bajo la licencia Apache 2.0. Según OSI, OLMo cumple con la definición de IA de código abierto de OSI.1

Pythia

Desarrollado por el laboratorio de investigación sin ánimo de lucro EleutherAI, Pythia es un conjunto de LLMs que varían en tamaño desde 14 millones hasta 12 mil millones de parámetros y se lanzan bajo la licencia Apache 2.0. Todos los datos, códigos, modelos y puntos de control asociados están disponibles públicamente, junto con instrucciones para replicar el entrenamiento, con el objetivo de promover la interpretabilidad, la ética y la transparencia de la IA. Según OSI, Pythia cumple con la definición de IA de código abierto de OSI.1

Qwen

Qwen es un serial de LLMs de la compañía china de computación en la nube Alibaba Cloud. Qwen incluye modelos de lenguaje, un modelo de lenguaje de visión y variantes optimizadas para audio, codificación y matemáticas. La mayoría de los modelos Qwen están disponibles bajo la licencia Apache 2.0, aunque los modelos más grandes tienen licencias propietarias.

T5

T5 es un modelo de transformador de transferencia de texto a texto desarrollado por investigadores de Google. Se destaca en una amplia gama de tareas de NLP y se lanza bajo la licencia Apache 2.0. Según OSI, T5 cumple con la definición de IA de código abierto de OSI.1

El OSI también analizó Llama 2 de Meta, Phi-2 de Microsoft, Mixtral de Mistral y Grok de xAI y concluyó que estos modelos no cumplen con la definición de IA de código abierto del OSI "porque carecen de los componentes requeridos o sus acuerdos legales son incompatibles con los principios de código abierto”.1

Herramientas y marcos de IA de código abierto

Trabajar en proyectos de IA de código abierto puede ser abrumador. Estas son algunas herramientas de IA de código abierto conocidas que pueden ayudar:

    ● Keras

    ● OpenCV

    ● PyTorch

    ● Scikit-learn

    ● TensorFlow

Keras

Keras es una interfaz de programación de aplicaciones (API) escrita en Python para construir, capacitar y evaluar modelos de aprendizaje profundo. Es compatible y puede funcionar sobre frameworks JAX, PyTorch o TensorFlow.

OpenCV

OpenCV es una biblioteca de visión artificial de código abierto gestionada por la Open Source Vision Foundation. Alberga más de 2500 algoritmos optimizados para aplicaciones de visión en tiempo real, incluyendo reconocimiento de imágenes, clasificación de imágenes, detección de objetos y seguimiento de objetos.

Pytorch

PyTorch es una infraestructura desarrollada originalmente por Meta y ahora parte de la Linux Foundation. Admite neural networks dinámicas y aceleración de GPU, se integra perfectamente con bibliotecas y paquetes de Python, ofrece una interfaz intuitiva y tiene una sobrecarga mínima de infraestructura.

Scikit-learn

Scikit-learn es un módulo de Python para machine learning. Cuenta con algoritmos para clasificación, clúster y regresión, entre otros, y ofrece herramientas para procesamiento de datos, la selección y evaluación de modelos y la creación de visualizaciones.

TensorFlow

TensorFlow es una plataforma para construir y desplegar modelos de machine learning. Creado por Google, TensorFlow contiene una biblioteca de datasets y modelos, APIs para diferentes lenguajes de programación y herramientas para optimizar los workflows de machine learning. También cuenta con una sólida comunidad de código abierto y ayuda a las personas a desarrollar su experiencia en machine learning a través de libros, currículos curados y cursos en línea.

Mixture of Experts | 12 de diciembre, episodio 85

Decodificación de la IA: Resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el revuelo de la IA para ofrecerle las últimas noticias e insights al respecto.

Soluciones relacionadas
IBM® watsonx.ai

Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Diseñe aplicaciones de IA en menos tiempo y con menos datos.

Explore watsonx.ai
Soluciones de inteligencia artificial

Ponga a trabajar la IA en su negocio con la experiencia en IA líder del sector y la cartera de soluciones de IBM a su lado.

Explore las soluciones de IA
Consultoría y servicios de inteligencia artificial (IA)

Los servicios de IA de IBM Consulting ayudan a reinventar la forma en que las empresas trabajan con IA para la transformación.

Explore los servicios de IA
Dé el siguiente paso

Obtenga acceso único a capacidades que abarcan el ciclo de vida del desarrollo de IA. Produzca potentes soluciones de IA con interfaces fáciles de usar, flujos de trabajo y acceso a API y SDK estándar de la industria.

Explore watsonx.ai Reserve una demostración en vivo
Notas de pie de página

1 Definición de IA de código abierto 1.0, Open Source Initiative, consultado el 12 de mayo de 2025.

2 Open sourcing the AI revolution, Economist Impact, 2024

3 Respuestas a preguntas frecuentes, Iniciativa de código abierto, 29 de octubre de 2024

4 The Open Source AI Definition – 1.0, Open Source Initiative, consultado el 12 de mayo de 2025