¿Qué es la IA generativa?

Autores

Staff Editor, AI Models

IBM Think

Editor, Topics & Insights

IBM Think

¿Qué es la IA generativa?

La IA generativa es la inteligencia artificial (IA) que puede crear contenidos originales (como texto, imágenes, vídeo, audio o código de software) en respuesta a las instrucciones o peticiones de un usuario.

La IA generativa se basa en sofisticados modelos de machine learning denominados algoritmos de modelos de deep learning que simulan los procesos de aprendizaje y toma de decisiones del cerebro humano. Estos modelos funcionan identificando y codificando los patrones y las relaciones en enormes cantidades de datos, y utilizando después esa información para entender las peticiones o preguntas en lenguaje natural de los usuarios y responder con nuevos contenidos relevantes.

La IA ha sido un tema tecnológico candente durante la última década, pero la IA generativa, y en concreto la llegada de ChatGPT en 2022, ha impulsado la IA a los titulares de todo el mundo y ha lanzado una oleada de innovación y adopción de la IA sin precedentes. La IA generativa ofrece enormes beneficios en términos de productividad para las personas y las organizaciones y, aunque también presenta retos y riesgos muy reales, las empresas siguen adelante, explorando cómo la tecnología puede mejorar sus flujos de trabajo internos y enriquecer sus productos y servicios. Según una investigación de la consultora de gestión McKinsey, un tercio de las organizaciones ya utilizan IA generativa con regularidad en al menos una función empresarial.¹ El analista del sector Gartner prevé que más del 80 % de las organizaciones habrán implementado aplicaciones de IA generativa o utilizado interfaces de programación de aplicaciones (API) de IA generativa para 2026.²

Cómo funciona la IA generativa

En su mayor parte, la IA generativa funciona en tres fases:

Entrenamiento, para crear un modelo fundacional que pueda servir de base a varias aplicaciones de IA generativa.
Ajuste, para adaptar el modelo fundacional a una aplicación específica de IA generativa.
Generación, evaluación y reajuste, para evaluar el output de la aplicación de IA generativa y mejorar continuamente su calidad y precisión.

Formación

La IA generativa comienza con un modelo fundacional , un modelo de deep learning que sirve de base para varios tipos diferentes de aplicaciones de IA generativa. Los modelos fundacionales más comunes hoy en día son los modelos de lenguaje de gran tamaño (LLM), creados para aplicaciones de generación de texto, pero también existen modelos fundacionales para la generación de imágenes, la generación de vídeo y la generación de sonido y música, así como modelos fundacionales multimodales compatibles con varios tipos de generación de contenidos.

Para crear un modelo fundacional, los profesionales entrenan un algoritmo de deep learning en enormes volúmenes de datos sin procesar, no estructurados y sin etiquetar; por ejemplo, terabytes de datos extraídos de internet o de alguna otra fuente de datos enorme. Durante el entrenamiento, el algoritmo realiza y evalúa millones de tareas que consisten en "rellenar los espacios en blanco", intentando predecir el siguiente elemento de una secuencia (p. ej., la siguiente palabra de una frase, el siguiente elemento de una imagen, el siguiente comando de una línea de código) y ajustándose continuamente para minimizar la diferencia entre sus predicciones y los datos reales (o resultado "correcto").

El resultado de este entrenamiento es una red neuronal de parámetros (representaciones codificadas de las entidades, patrones y relaciones de los datos) que puede generar contenidos de forma autónoma en respuesta a entradas o instrucciones.

Este proceso de entrenamiento requiere muchos cálculos, tiempo y dinero: requiere miles de unidades de procesamiento gráfico (GPU) agrupadas y semanas de procesamiento, todo lo cual cuesta millones de dólares. Los proyectos de modelos fundacionales de código abierto, como Llama-2 de Meta, permiten a los desarrolladores de IA generativa evitar este paso y sus costes.

Ajuste

Metafóricamente hablando, un modelo fundacional es un generalista: sabe mucho sobre muchos tipos de contenido, pero a menudo no puede generar tipos específicos de output con la precisión o fidelidad deseadas. Para ello, el modelo debe ajustarse a una tarea específica de generación de contenidos. Esto puede hacerse de varias maneras.

Fine tuning

El fine tuning implica alimentar el modelo con datos etiquetados específicos de la aplicación de generación de contenidos (preguntas o instrucciones que es probable que reciba la aplicación, y las correspondientes respuestas correctas en el formato deseado). Por ejemplo, si un equipo de desarrollo está intentando crear un chatbot de atención al cliente, crearía cientos o miles de documentos con preguntas del servicio de atención al cliente etiquetadas y respuestas correctas, y luego alimentaría el modelo con esos documentos.

La afinación requiere mucha mano de obra. Los desarrolladores suelen subcontratar la tarea a empresas con gran personal especializado en el etiquetado de datos.

Aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF)

En el RLHF, los usuarios humanos responden a los contenidos generados con evaluaciones que el modelo puede utilizar para actualizarlo y dotarlo de mayor precisión o relevancia. A menudo, el RLHF implica que las personas "puntúen" diferentes outputs en respuesta a una misma instrucción. Pero puede ser tan sencillo como hacer que las personas escriban o respondan a un chatbot o asistente virtual, corrigiendo su resultado.

Generación, evaluación, más ajuste

Los desarrolladores y los usuarios evalúan continuamente los resultados de sus aplicaciones de IA generativa y ajustan aún más el modelo (incluso una vez a la semana) para aumentar su precisión o relevancia (en cambio, el propio modelo fundacional se actualiza con mucha menos frecuencia, quizá cada año o cada 18 meses).

Otra opción para mejorar el rendimiento de una aplicación de IA generativa es la generación aumentada por recuperación (RAG). La RAG es un marco que permite ampliar el modelo fundacional para utilizar fuentes relevantes ajenas a los datos de entrenamiento, con el fin de complementar y perfeccionar los parámetros o representaciones del modelo original. La RAG puede garantizar que una aplicación de IA generativa siempre tenga acceso a la información más actualizada. Como ventaja adicional, las fuentes adicionales a las que se accede a través de RAG son transparentes para los usuarios de un modo en que no lo son los conocimientos del modelo fundacional original.

Arquitecturas de modelos de IA generativa y su evolución

Los verdaderos modelos de IA generativa (modelos de deep learning capaces de crear contenidos de forma autónoma bajo demanda) han evolucionado a lo largo de la última docena de años aproximadamente. Las arquitecturas de modelos que han marcado un hito durante ese periodo incluyen:

Autocodificadores variacionales (VAE), que impulsaron grandes avances en el reconocimiento de imágenes, el procesamiento del lenguaje natural y la detección de anomalías.
Las redes generativas adversativas (GAN) y los modelos de difusión, que mejoraron la precisión de las aplicaciones anteriores y permitieron algunas de las primeras soluciones de IA para la generación de imágenes fotorrealistas.
Transformadores, la arquitectura de modelos de deep learning que está detrás de los modelos fundacionales y las soluciones de IA generativa más importantes de la actualidad.

Autocodificadores variacionales (VAE)

Un autocodificador es un modelo de deep learning compuesto por dos redes neuronales conectadas: una que codifica (o comprime) una enorme cantidad de datos de entrenamiento no estructurados ni etiquetados en parámetros, y otra que decodifica esos parámetros para reconstruir el contenido. Técnicamente, los autocodificadores pueden generar nuevos contenidos, pero son más útiles para comprimir datos para su almacenamiento o transferencia, y descomprimirlos para su uso, que para la generación de contenidos de alta calidad.

Introducidos en 2013, los autocodificadores variacionales (VAE) pueden codificar datos como un autocodificador, pero decodificando numerosas variaciones nuevas del contenido. Al entrenar a un VAE para que genere variaciones hacia un objetivo concreto, puede "concentrarse" en contenidos más precisos y de mayor fidelidad con el paso del tiempo. Las primeras aplicaciones de los VAE incluían la detección de anomalías (p. ej., análisis de imágenes médicas) y la generación de lenguaje natural.

Redes generativas adversativas (GAN)

Las GAN, introducidas en 2014, también constan de dos redes neuronales: un generador, que crea nuevos contenidos, y un discriminador, que evalúa la precisión y la calidad de los datos generados. Estos algoritmos adversativos animan al modelo a generar outputs cada vez de mayor calidad.

Las GAN se utilizan habitualmente para la generación de imágenes y vídeos, pero pueden generar contenidos realistas y de alta calidad en diversos ámbitos. Han demostrado ser especialmente eficaces en tareas como la transferencia de estilo (alterar el estilo de una imagen de, por ejemplo, una foto a un boceto a lápiz) y el aumento de datos (crear datos nuevos y sintéticos para aumentar el tamaño y la diversidad de un conjunto de datos de entrenamiento).

Modelos de difusión

También introducidos en 2014, los modelos de difusión funcionan añadiendo primero ruido a los datos de entrenamiento hasta que son aleatorios e irreconocibles, y después entrenando al algoritmo para que difumine iterativamente el ruido hasta revelar un output deseado.

Los modelos de difusión tardan más tiempo en entrenarse que los VAE o las GAN, pero en última instancia ofrecen un control más preciso del output, sobre todo en el caso de la herramienta de generación de imágenes de alta calidad. DALL-E, la herramienta de generación de imágenes de Open AI, funciona con un modelo de difusión.

Transformadores

Documentados por primera vez en un artículo de 2017 publicado por Ashish Vaswani y otros autores, los transformadores evolucionan el paradigma codificador-decodificador para permitir un gran paso adelante en la forma en que se entrenan los modelos fundacionales, y en la calidad y gama de contenidos que pueden producir. Estos modelos son el núcleo de la mayoría de las herramientas actuales de IA generativa que acaparan titulares, como ChatGPT y GPT-4, Copilot, BERT, Bard y Midjourney, por nombrar algunas.

Los transformadores utilizan un concepto llamado atención (determinar y centrarse en lo más importante de los datos dentro de una secuencia) para

procesar secuencias enteras de datos (p. ej., frases en lugar de palabras sueltas) de forma simultánea;
captan el contexto de los datos dentro de la secuencia;
codifican los datos de entrenamiento en incrustaciones (también llamadas hiperparámetros) que representan los datos y su contexto.

Además de permitir un entrenamiento más rápido, los transformadores destacan en el procesamiento del lenguaje natural (PLN) y la comprensión del lenguaje natural (CLN), y pueden generar secuencias de datos más largas (p. ej., no solo respuestas a preguntas, sino poemas, artículos o trabajos) con mayor precisión y calidad que otros modelos de IA generativa profunda. Los modelos de transformador también pueden entrenarse o ajustarse para utilizar herramientas (p. ej., una aplicación de hoja de cálculo, HTML, un programa de dibujo) para generar contenidos en un formato determinado.

Lo que la IA generativa puede crear

La IA generativa puede crear muchos tipos de contenidos en muchos ámbitos diferentes.

Texto

Modelos generativos. Especialmente los basados en transformadores, pueden generar textos coherentes y contextualmente relevantes: desde instrucciones y documentación hasta folletos, correos electrónicos, textos para páginas web, blogs, artículos, informes, trabajos e incluso escritura creativa. También pueden realizar tareas de escritura repetitivas o tediosas (p. ej., como la redacción de resúmenes de documentos o metadescripciones de páginas web), dejando tiempo libre a los escritores para un trabajo más creativo y de mayor valor.

Imágenes y vídeo

La generación de imágenes como la de DALL-E, Midjourney y Stable Diffusion puede crear imágenes realistas o arte original, y puede realizar transferencia de estilos, traducción de imagen a imagen y otras tareas de edición o mejora de imágenes. Las herramientas de vídeo de IA de nueva generación pueden crear animaciones a partir de prompts de texto, y pueden aplicar efectos especiales al vídeo existente de forma más rápida y rentable que otros métodos.

Sonido, habla y música

Los modelos generativos pueden sintetizar habla y contenidos de audio de sonido natural para chatbots de IA y asistentes digitales con voz, narración de audiolibros y otras aplicaciones. La misma tecnología puede generar música original que imite la estructura y el sonido de las composiciones profesionales.

Código de software

La IA generativa puede generar código original, autocompletar fragmentos de código, traducir entre lenguajes de programación y resumir la funcionalidad del código. Permite a los desarrolladores crear rápidamente prototipos, refactorizar y depurar aplicaciones, a la vez que ofrece una interfaz de lenguaje natural para las tareas de codificación.

Diseño y arte

Los modelos de IA generativa pueden generar obras de arte y diseño únicas, o ayudar en el diseño gráfico. Las aplicaciones incluyen la generación dinámica de entornos, personajes o avatares, y efectos especiales para simulaciones virtuales y videojuegos.

Simulaciones y datos sintéticos

Los modelos de IA generativa pueden entrenarse para generar datos sintéticos o estructuras sintéticas basadas en datos reales o sintéticos. Por ejemplo, la IA generativa se aplica en el descubrimiento de fármacos para generar estructuras moleculares con las propiedades deseadas, lo que ayuda al diseño de nuevos compuestos farmacéuticos.

Únase a los más de 100 000 suscriptores que leen las últimas noticias sobre tecnología

Manténgase al día sobre las tendencias más importantes e intrigantes del sector en materia de IA, automatización, datos y mucho más con el boletín Think, que se entrega dos veces por semana. Consulte la Declaración de privacidad de IBM.

Beneficios de la IA generativa

El beneficio obvio y global de la IA generativa es una mayor eficiencia. Dado que puede generar contenidos y respuestas bajo demanda, la IA generativa tiene el potencial de acelerar o automatizar las tareas que requieren mucha mano de obra, recortar costes y liberar tiempo de los empleados para tareas de mayor valor.

Pero la IA generativa ofrece varios beneficios más para las personas y las organizaciones.

Aumento de la creatividad

Las herramientas de IA generativa pueden inspirar la creatividad mediante una lluvia de ideas automatizada, generando varias versiones novedosas de los contenidos. Estas variaciones también pueden servir como puntos de partida o referencias que ayuden a escritores, artistas, diseñadores y otros creadores a superar los bloqueos creativos.

Toma de decisiones mejorada (y más rápida)

La IA generativa destaca en el análisis de grandes conjuntos de datos, la identificación de patrones y la extracción de conocimientos significativos, y después genera hipótesis y recomendaciones basadas en esos conocimientos para ayudar a ejecutivos, analistas, investigadores y otros profesionales a tomar decisiones más inteligentes y basadas en datos.

Personalización dinámica

En aplicaciones como los sistemas de recomendación y la creación de contenidos, la IA generativa puede analizar las preferencias y el historial del usuario y generar contenidos personalizados en tiempo real, lo que conduce a una experiencia de usuario más adaptada y atractiva.

Disponibilidad constante

La IA generativa funciona de forma continua y sin fatiga, proporcionando disponibilidad las 24 horas del día para tareas como los chatbots de atención al cliente y las respuestas automatizadas.

AI Academy

El auge de la IA generativa para empresas

Conozca el auge histórico de la IA generativa y lo que significa para las empresas.

Ir al episodio

Casos de uso de la IA generativa

Los siguientes son solo un puñado de casos de uso de la IA generativa para las empresas. A medida que la tecnología se desarrolle y las organizaciones incorporen estas herramientas a sus flujos de trabajo, podemos esperar ver muchos más.

Experiencia del cliente

Las organizaciones de marketing pueden ahorrar tiempo y ampliar su producción de contenidos utilizando herramientas de IA generativa para redactar textos para blogs, páginas web, material colateral, correos electrónicos y mucho más. Pero las soluciones de IA generativa también pueden producir textos y elementos visuales de marketing altamente personalizados en tiempo real en función de cuándo, dónde y a quién se dirige el anuncio. Y potenciará la próxima generación de chatbots y agentes virtuales que pueden dar respuestas personalizadas e incluso iniciar acciones en nombre del cliente, un avance significativo en comparación con la generación anterior de modelos de IA conversacional entrenados con datos más limitados para tareas muy específicas.

Desarrollo de software y modernización de aplicaciones

Las herramientas de generación de código pueden automatizar y acelerar el proceso de escritura de código nuevo. La generación de código también tiene el potencial de acelerar drásticamente la modernización de las aplicaciones mediante la automatización de gran parte de la codificación repetitiva necesaria para modernizar las aplicaciones heredadas para entornos de cloud híbrido.

Mano de obra digital

La IA generativa puede redactar o revisar rápidamente contratos, facturas, recibos y otro tipo de "papeleo" digital o físico para que los empleados que lo utilizan o gestionan puedan centrarse en tareas de mayor importancia. Esto puede acelerar los flujos de trabajo en prácticamente todas las áreas de la empresa, incluidos los recursos humanos, los asuntos jurídicos, las compras y las finanzas.

Ciencia, ingeniería e investigación

Los modelos de IA generativa pueden ayudar a científicos e ingenieros a proponer soluciones novedosas a problemas complejos. En sanidad, por ejemplo, los modelos generativos pueden aplicarse para sintetizar imágenes médicas con el fin de entrenar y probar sistemas de imágenes médicas.

IA generativa, agentes de IA e IA agéntica

Un agente de IA es un programa de IA autónomo: puede realizar tareas y lograr objetivos en nombre de un usuario o de otro sistema sin intervención humana, diseñando su propio flujo de trabajo y utilizando las herramientas disponibles (otras aplicaciones o servicios). La IA agéntica es un sistema de múltiples agentes de IA, cuyos esfuerzos se coordinan u orquestan para realizar una tarea más compleja o alcanzar un objetivo mayor que el que podría lograr cualquier agente individual del sistema.

A diferencia de los chatbots y otros modelos de IA que operan dentro de restricciones predefinidas y requieren intervención humana, los agentes de IA y la IA agéntica exhiben autonomía, un comportamiento orientado a objetivos y adaptabilidad a circunstancias cambiantes. Los términos "agente" y "agéntico" se refieren a la agencia de estos modelos, o su capacidad para actuar de forma independiente y decidida.

Una forma de pensar en los agentes de IA es como el siguiente paso natural después de la IA generativa. Los modelos de IA generativa se centran en la creación de contenidos basados en patrones aprendidos; los agentes utilizan ese contenido para interactuar entre sí y con otras herramientas para tomar decisiones, resolver problemas y completar tareas. Por ejemplo, una aplicación de IA generativa podría indicarle el mejor momento para escalar el monte Everest dado su horario de trabajo, pero un agente puede decírselo y luego utilizar un servicio de viajes en línea para reservarle el mejor vuelo y reservar una habitación en el hotel que más le convenga de Nepal.

Explore nuestra guía 2025 para agentes de IA

Retos, limitaciones y riesgos

La IA generativa ha avanzado notablemente en un periodo de tiempo relativamente corto, pero sigue presentando retos y riesgos significativos para los desarrolladores, los usuarios y el público en general. A continuación se exponen algunos de los problemas más graves y cómo se están abordando.

"Alucinaciones" y demás outputs inexactos

Una alucinación de la IA es un resultado de IA generativa que carece de sentido o es totalmente inexacto, pero que, con demasiada frecuencia, parece totalmente plausible. El ejemplo clásico es cuando un abogado utilizó una herramienta de IA generativa para la investigación en preparación para un caso de alto perfil y la herramienta "produjo" varios casos de ejemplo, completos con citas y atribuciones, que eran completamente ficticios.

Algunos profesionales consideran que las alucinaciones son una consecuencia inevitable del equilibrio entre la precisión de un modelo y sus capacidades creativa. Pero los desarrolladores pueden aplicar medidas preventivas, llamadas barandillas, que restrinjan el modelo a fuentes de datos relevantes o de confianza. La evaluación y el ajuste continuos también pueden ayudar a reducir las alucinaciones y las imprecisiones.

Outputs incoherentes

Debido a la naturaleza variacional o probabilística de los modelos de IA generativa, las mismas entradas pueden dar lugar a resultados ligera o significativamente diferentes. Esto puede resultar indeseable en determinadas aplicaciones, como los chatbots de atención al cliente, en las que se esperan o desean resultados coherentes. A través del prompt engineering (el perfeccionamiento iterativo o la composición de las instrucciones), los usuarios pueden llegar a instrucciones que ofrezcan de forma coherente los resultados que desean de sus aplicaciones de IA generativa.

Sesgo

Los modelos generativos pueden aprender prejuicios sociales presentes en los datos de entrenamiento (o en los datos etiquetados, las fuentes de datos externas o los evaluadores humanos utilizados para ajustar el modelo) y generar como resultado contenidos sesgados, injustos u ofensivos. Para evitar que sus modelos generen resultados sesgados, los desarrolladores deben asegurarse de que los datos de entrenamiento sean diversos, establecer directrices para evitar los prejuicios durante el entrenamiento y el ajuste, y evaluar continuamente los resultados del modelo tanto en lo que respecta a los prejuicios como a la precisión.

Falta de explicabilidad y de métricas

Muchos modelos de IA generativa son modelos de "caja negra", lo que significa que puede resultar difícil o imposible comprender sus procesos de toma de decisiones; ni siquiera los ingenieros o científicos de datos que crean el algoritmo subyacente pueden entender o explicar qué ocurre exactamente en su interior y cómo llega a un resultado concreto. Las prácticas y técnicas de IA explicable pueden ayudar a los profesionales y usuarios a comprender y confiar en los procesos y outputs de los modelos generativos.

La evaluación y comparación de la calidad de los contenidos generados también puede ser un reto. Las métricas de evaluación tradicionales pueden no captar los aspectos matizados de la creatividad, la coherencia o la relevancia. El desarrollo de métodos de evaluación sólidos y fiables para la IA generativa sigue siendo un área activa de investigación.

Amenazas a la seguridad, la privacidad y la propiedad intelectual

Los modelos de IA generativa pueden explotarse para generar correos electrónicos de phishing convincentes, identidades falsas u otros contenidos maliciosos que pueden engañar a los usuarios para que realicen acciones que comprometan la seguridad y la protección de los datos. Los desarrolladores y los usuarios deben tener cuidado de que los datos introducidos en el modelo (durante el ajuste, o como parte de un prompt) no expongan su propia propiedad intelectual (PI) o cualquier información protegida como PI por otras organizaciones. Y necesitan monitorizar los outputs para detectar nuevos contenidos que expongan su propia PI o violen las protecciones de PI de otros.

Deepfakes

Los deepfakes son imágenes, vídeo o audio generados o manipulados por IA creados para convencer a la gente de que está viendo, observando o escuchando a alguien hacer o decir algo que nunca hizo o dijo. Se encuentran entre los ejemplos más escalofriantes de cómo el poder de la IA generativa puede aplicarse con intenciones maliciosas.

La mayoría de la gente está familiarizada con los deepfakes creados para dañar reputaciones o difundir desinformación. Más recientemente, los ciberdelincuentes han implementado deepfakes como parte de ciberataques (p. ej., voces falsas en estafas de phishing de voz) o esquemas de fraude financiero.

Los investigadores trabajan intensamente en modelos de IA que puedan detectar con mayor precisión los deepfakes. Mientras tanto, la educación de los usuarios y las buenas prácticas (p. ej., no compartir material polémico sin verificar o investigar) pueden ayudar a limitar el daño que pueden causar los deepfakes.

Breve historia de la IA generativa

El término "IA generativa" irrumpió en la conciencia pública en la década de 2020, pero ésta forma parte de nuestras vidas desde hace décadas, y la tecnología de IA generativa actual se basa en avances del machine learning que se remontan a fechas tan lejanas como principios del siglo XX. Una historia representativa no exhaustiva de la IA generativa podría incluir algunas de las siguientes fechas:

1964: el informático del MIT Joseph Weizenbaum desarrolla ELIZA, una aplicación de procesamiento del lenguaje natural basada en texto. Esencialmente el primer chatbot (llamado "chatterbot" en aquella época), ELIZA utilizaba scripts de concordancia de patrones para responder a entradas de lenguaje natural tecleadas con respuestas de texto empáticas.
1999: Nvidia lanza GeoForce, la primera unidad de procesamiento gráfico. Desarrolladas originalmente para ofrecer gráficos de movimiento fluido para videojuegos, las GPU se habían convertido en la plataforma de facto para desarrollar modelos de IA y minar criptomonedas.
2004: en primer lugar aparece la función de autocompletar de Google, que genera posibles palabras o frases siguientes a medida que los usuarios introducen sus términos de búsqueda. El ejemplo relativamente moderno de IA generativa se basa en una cadena de Markov, un modelo matemático desarrollado en 1906.
2013: aparecen los primeros autocodificadores variacionales (VAE).
2014: aparecen las primeras redes generativas adversativas (GAN) y los modelos de difusión.
2017: Ashish Vaswani, un equipo de Google Brain y un grupo de la Universidad de Toronto publican "Attention is All You Need" [La atención es todo lo que necesitas], un documento que recoge los principios de los modelos transformadores, ampliamente reconocidos como los que permiten crear los modelos fundacionales y las herramientas de IA generativa más potentes que se desarrollan en la actualidad.
2019-2020: OpenAI lanza sus modelos de lenguaje de gran tamaño GPT (Generative Pretrained Transformer), GPT-2 y GPT-3.
2022: OpenAI presenta ChatGPT, un front-end de GPT-3 que genera frases complejas, coherentes y contextuales y contenidos de formato largo en respuesta a prompts del usuario final.

Con la notoriedad y popularidad de ChatGPT, que abrió la veda, los desarrollos y lanzamientos de productos de IA generativa se han sucedido a un ritmo vertiginoso, incluidos los lanzamientos de Google Bard (ahora Gemini), Microsoft Copilot, IBM watsonx.ai, y el gran modelo de lenguaje de código abierto Llama-2 de Meta.

Comience a obtener ROI: una guía práctica para la IA agéntica

Aprenda a escalar la IA agéntica para obtener un ROI medible en toda su empresa. Esta guía de estrategias describe los principales obstáculos que limitan el impacto, cómo medir eficazmente el ROI y un marco práctico para impulsar una adopción exitosa en toda la empresa.

Recursos

La empresa en 2030: diseñada para la innovación perpetua

Descubra nuestras cinco predicciones sobre los factores que definirán a las empresas más exitosas en 2030 y las medidas que los líderes pueden adoptar para obtener una ventaja competitiva gracias a la IA.

Lleve sus conocimientos sobre IA generativa al siguiente nivel

Aprenda los conceptos fundamentales y desarrolle sus habilidades con laboratorios prácticos, cursos, proyectos guiados, pruebas y mucho más.

Ponga la IA a trabajar: cómo impulsar el ROI con la IA generativa

¿Quiere obtener un mayor rendimiento de sus inversiones en IA? Descubra cómo escalar la IA generativa en áreas clave impulsa el cambio ayudando a sus mentes más brillantes a crear y ofrecer nuevas soluciones innovadoras.

De los proyectos de IA a los beneficios: cómo la IA agéntica puede mantener la rentabilidad financiera

Descubra cómo las organizaciones están pasando de lanzar la IA en pilotos dispares a aplicarla para impulsar la transformación en el núcleo.

Explicación de la IA generativa

Techsplainers de IBM desglosa lo esencial de la IA generativa, desde los conceptos clave hasta los casos de uso en el mundo real. Los episodios claros y rápidos le ayudan a aprender los fundamentos rápidamente.

La guía del director general para la IA generativa

Descubra cómo pueden los CEO equilibrar el valor que la IA generativa es capaz de crear frente a la inversión que exige y los riesgos que introduce.

watsonx Developer Hub

Explore las herramientas y recursos esenciales para acelerar su próximo proyecto. Empiece y descubra toda la gama de modelos compatibles disponibles en IBM.

La verdad sobre el éxito de la IA generativa

Descubra los beneficios de las plataformas de IA que permiten la personalización del modelo fundacional mediante tecnología, procesos y buenas prácticas para ayudarle a hacer operativo fácilmente el ciclo de vida de la IA generativa.

Explore IBM Granite

IBM® Granite es nuestra familia de modelos de IA abiertos, de alto rendimiento y de confianza, diseñados para empresas y optimizados para escalar sus aplicaciones de IA. Explore modelos para el lenguaje, el código, las series temporales y las barreras de seguridad.

Cómo elegir el modelo fundacional adecuado

Aprenda a seleccionar el modelo fundacional de IA más adecuado para su caso de uso.

Cómo prosperar en la era de la IA con seguridad y confianza

Profundice en los tres elementos cruciales de una estrategia de IA sólida: crear una ventaja competitiva, ampliar la IA en toda la empresa y promover una IA fiable.

Soluciones relacionadas

IBM watsonx.ai

Entrene, valide, ajuste e implemente IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de nueva generación para desarrolladores de IA. Cree aplicaciones de IA en menos tiempo y con menos datos.

Descubra watsonx.ai

Soluciones de inteligencia artificial

Ponga la IA a trabajar en su negocio con la experiencia líder en IA del sector de IBM y junto a su cartera de soluciones.

Explore las soluciones de IA

Servicios de IA

Reinvente las operaciones y flujos de trabajo críticos añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Explore los servicios de IA

Dé el siguiente paso

Obtenga acceso único a capacidades que abarcan el ciclo de vida de desarrollo de la IA. Produzca potentes soluciones de IA con interfaces intuitivas, flujos de trabajo y acceso a API y SDK estándar del sector.

¿Qué es la IA generativa?

Autores

¿Qué es la IA generativa?

Cómo funciona la IA generativa

Formación

Ajuste

Fine tuning

Aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF)

Generación, evaluación, más ajuste

Arquitecturas de modelos de IA generativa y su evolución

Autocodificadores variacionales (VAE)

Redes generativas adversativas (GAN)

Modelos de difusión

Transformadores

Lo que la IA generativa puede crear

Únase a los más de 100 000 suscriptores que leen las últimas noticias sobre tecnología

¡Gracias!

Beneficios de la IA generativa

Aumento de la creatividad

Toma de decisiones mejorada (y más rápida)

Personalización dinámica

Disponibilidad constante

El auge de la IA generativa para empresas

Casos de uso de la IA generativa

IA generativa, agentes de IA e IA agéntica

Retos, limitaciones y riesgos

"Alucinaciones" y demás outputs inexactos

Outputs incoherentes

Sesgo

Falta de explicabilidad y de métricas

Amenazas a la seguridad, la privacidad y la propiedad intelectual

Deepfakes

Breve historia de la IA generativa

Recursos