Los modelos fundacionales son modelos de IA entrenados con algoritmos de machine learning en un amplio conjunto de datos sin etiquetar que se pueden utilizar para diferentes tareas con un ajuste mínimo. El modelo puede aplicar la información que ha aprendido sobre una situación a otra mediante el aprendizaje autosupervisado y el aprendizaje por transferencia. Por ejemplo, ChatGPT se basa en los modelos fundacionales GPT-3.5 y GPT-4 creados por OpenAI.

Los modelos fundacionales bien construidos ofrecen beneficios significativos; el uso de la IA puede ahorrar a las empresas incontables horas construyendo sus propios modelos. Estas ventajas de ahorro de tiempo son lo que atrae a muchas empresas a una adopción más amplia. IBM espera que en dos años los modelos fundacionales impulsen alrededor de un tercio de la IA en los entornos empresariales.

Desde el punto de vista de los costes, los modelos fundacionales requieren una importante inversión inicial; sin embargo, permiten a las empresas ahorrar en el coste inicial de la creación de modelos, ya que se escalan fácilmente a otros usos, lo que ofrece un mayor ROI y una velocidad de comercialización más rápida para las inversiones en IA.

Con ese fin, IBM está creando un conjunto de modelos fundacionales específicos para cada dominio que van más allá de los modelos de aprendizaje del lenguaje natural y se entrenan con múltiples tipos de datos empresariales, incluidos códigos, datos de series temporales, datos tabulares, datos geoespaciales, datos semiestructurados y datos de modalidad mixta, como texto combinado con imágenes. El primero de ellos, Slate, se lanzó recientemente.

La IA comienza con los datos

Para poner en marcha un programa de IA realmente eficaz para su empresa, debe disponer de conjuntos de datos limpios y de calidad y de una arquitectura de datos adecuada para almacenarlos y acceder a ellos. La transformación digital de su organización debe estar lo suficientemente madura como para garantizar que los datos se recopilen en los puntos de contacto necesarios en toda la organización y que sean accesibles para quien realice el análisis de datos.

Construir un modelo multinube híbrido eficaz es esencial para que la IA gestione las enormes cantidades de datos que deben almacenarse, procesarse y analizarse. Las arquitecturas de datos modernas suelen emplear un enfoque método arquitectónico de tejido de datos, que simplifica el acceso a datos y facilita el auto consumo de datos. Adoptar una arquitectura de tejido de datos también crea una arquitectura componible lista para IA que ofrece capacidades consistentes en entornos de nube híbrida.

Gobierno y conocer el origen de sus datos

La importancia de la precisión y el uso ético de los datos hace que el gobierno de datos sea una pieza importante en la estrategia de IA de cualquier organización. Esto incluye la adopción de herramientas de gobierno e incorporación del gobierno en los flujos de trabajo para mantener estándares coherentes. Una plataforma de gestión de datos también permite a las organizaciones documentar adecuadamente los datos utilizados para crear o afinar los modelos, proporcionando a los usuarios conocimiento sobre qué datos se utilizaron para dar forma a los resultados y a los equipos de supervisión normativa la información que necesitan para garantizar la seguridad y la privacidad.