¿Qué es la generación de lenguaje natural (GLN)?

Autores

Ivan Belcic

Staff writer

Cole Stryker

Staff Editor, AI Models

IBM Think

¿Qué es la generación de lenguaje natural (GLN)?

La generación de lenguaje natural (NLG) es el uso de inteligencia artificial (IA) para crear resultados en lenguaje natural a partir de datos estructurados y no estructurados. La NLG hace posible que los ordenadores y las aplicaciones de software de IA generativa interactúen con los usuarios en un lenguaje humano comprensible. Junto con comprensión del lenguaje natural (NLU), la NLG es una subcategoría de procesamiento del lenguaje natural (NLP)

Los sistemas de NLG ya se utilizan ampliamente tanto en productos empresariales como de consumo, como herramientas de business intelligence (BI) y chatbots. Los asistentes de voz se comunican con los usuarios a través de NLG.

Los líderes empresariales utilizan NLG para transformar datos complejos en texto generado para destilar conocimientos clave. Siempre que un modelo de IA genere resultados en lenguaje humano, estaremos hablando de NLG. 

Las últimas tendencias en IA, presentadas por expertos

Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.

¡Gracias! Está suscrito.

Su suscripción se enviará en inglés. Encontrará un enlace para darse de baja en cada boletín. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

Tipos de GLN

Los dos tipos principales de NLG son el extractivo y el abstractivo: 

  • El NLG extractivo extrae palabras y frases exactas directamente del texto de origen. Se utiliza en casos en los que el uso específico de las palabras es crítica, como en los documentos legales. En comparación con el NLG abstractivo, el NLG extractivo es más sencillo porque copia los documentos de origen en lugar de dar como resultado nuevo contenido. 

  • La NLG abstractiva crea resultados novedosos basados en documentos fuente, parafraseando y generando nuevos contenidos. Es un proceso más complejo que requiere modelos más avanzados, como transformadores. Mientras que el NLG extractivo es preferible en entornos técnicos, el NLG abstractivo brilla en aplicaciones más creativas.

Mixture of Experts | 12 de diciembre, episodio 85

Descifrar la IA: resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el bullicio de la IA para ofrecerle las últimas noticias y conocimientos al respecto.

Cómo funciona la GLN

La NLG funciona progresando a través de un proceso de varias etapas para refinar las entradas de datos estructurados y no estructurados y generar resultados en lenguaje natural. Como describe el informático Ehud Reiter1, las etapas del proceso típico de NLG son: 

  • Análisis de señales: el sistema NLG determina qué datos de entrada se necesitan para el resultado final. En la etapa de análisis de señales o datos, el reconocimiento de patrones identifica el tema del contenido y las relaciones entre los temas. Los datos de entrada incluyen instrucciones para el usuario, contenido de bases de datos y contenido lingüístico no estructurado, como archivos PDF, documentos y grabaciones de idiomas hablados. El reconocimiento de entidades ayuda a los sistemas de PLN a comprender de qué se está hablando. 

  • Interpretación de datos: los modelos de PLN generan conocimientos a partir de los resultados de la etapa de análisis. Si los datos ya están preprocesados con los conocimientos disponibles, se omite este paso. Los sistemas de PLN identifican partes del discurso y utilizan NLU para evaluar la sintaxis y la semántica, creando una comprensión del significado. 

  • Planificación de documentos: esta etapa identifica qué información comunicar y cómo formatearla. El sistema NLG determina su enfoque para el resultado final, en función de los datos disponibles y de la instrucción del usuario. 

  • Microplanificación: después de decidir el contenido y el formato de la comunicación, el sistema NLG planifica la estructura de oraciones y párrafos para el resultado final. 

  • Realización superficial: el sistema NLG pone en marcha su plan y genera resultados en lenguaje natural de acuerdo con los resultados de los pasos anteriores. 

GLN frente a PLN

La NLG forma parte de la disciplina informática del procesamiento del lenguaje natural (PLN): el uso de modelos de machine learning (ML) para comprender y trabajar con el lenguaje humano.

La NLG es la parte del PLN que se ocupa de la generación de contenidos, en concreto de la producción de un lenguaje escrito u oral novedoso. Por ejemplo, los chatbots de IA conversacional utilizan NLG para responder a las entradas de los usuarios en tiempo real. 

El PLN convierte las entradas de lenguaje natural en datos, que la NLG utiliza para generar resultados en lenguaje natural. 

El PLN forma parte del campo de la lingüística computacional: el estudio de cómo los ordenadores analizan y entienden el lenguaje humano. El PLN es la lingüística computacional en la práctica.

El desarrollo del deep learning y los modelos de lenguaje de gran tamaño (LLM) hizo posible que los avances en el PLN impulsaran las numerosas aplicaciones de IA generativa que gestionan la creación de contenidos.

GLN frente a CLN

La comprensión del lenguaje natural (NLU) es otro subconjunto del PLN. En lugar de centrarse en el significado gramatical y lingüístico, la NLU intenta comprender el lenguaje humano de manera holística. Para ello, la NLU utiliza el análisis semántico y sintáctico para comprender de forma completa y contextual las entradas del lenguaje natural, incluidas la emoción, el sentimiento y la intención. 

La NLU permite a los ordenadores entender las entradas en lenguaje natural de una forma más similar a la humana. Cuando las personas hablan entre sí, procesan algo más que la definición de las palabras que utilizan. Pueden entender el significado más profundo que se esconde tras las palabras literales de un hablante de forma natural. 

Cuando una aplicación de software ofrece opciones de texto predictivo, utiliza NLU para comprender la intención del usuario y luego aplica NLG para terminar la oración. El PLN, la NLU y la NLG trabajan juntos para ayudar a los ordenadores a comunicarse con los usuarios.

Modelos y metodologías GLN

Muchos sistemas de NLG utilizan modelos avanzados de IA, como transformadores, para crear textos novedosos a partir de datos de entrenamiento y entrada de los usuarios.

Sin embargo, antes de que se desarrollaran estos modelos, la NLG era posible por otros medios. Los modelos y técnicas de NLG incluyen: 

  • Plantillas

  • Sistemas basados en reglas 

  • Transformadores

Plantillas

Los sistemas basados en plantillas utilizan plantillas de frases predefinidas con variables para los datos de entrada. Las plantillas son uno de los tipos más tempranos y sencillos de NLG, apropiados para contextos en los que las estructuras de las frases y los documentos son coherentes. Sin embargo, los sistemas basados en plantillas no pueden adaptarse fuera de sus casos de uso predefinidos. 

Una plantilla de ejemplo podría ser: En [mes],[año], nuestra tienda [ubicación] vendió [cantidad] unidades de [artículo].

Aunque esta plantilla sobresale en la elaboración de informes de ventas basadas en la ubicación, no se podría aplicar para generar una receta de cocina.

Sistemas basados en reglas

Los sistemas basados en reglas generan texto de acuerdo con una serie de reglas y lógica predefinidas. Los primeros sistemas basados en reglas se crearon para reflejar la forma en que hablaban o escribían los expertos en dominios. Los programadores entrevistarían a expertos y luego crearían las reglas correspondientes para la generación de texto

Los sistemas "si-entonces" ("if-then") son un ejemplo común de programación basada en reglas. Por ejemplo, el software de NLG para previsiones meteorológicas podría recibir instrucciones para describir el clima como "por debajo del punto de congelación" si la temperatura es inferior a 32 grados Fahrenheit o 0 grados Celsius.

Algoritmos de machine learning estadístico

Los algoritmos de machine learning estadístico, como las cadenas de Markov ocultas, identifican patrones en grandes conjuntos de datos para hacer predicciones y tomar decisiones con nuevos datos.

Generan nuevas instancias basadas en la instancia actual. Para la GNLG, las cadenas de Markov y otros modelos estadísticos generan palabras que probablemente se sucedan. 

Los modelos estadísticos son más flexibles que las plantillas y los sistemas basados en reglas, pero necesitan grandes cantidades de datos de entrenamiento.

Modelos de deep learning

Los modelos de deep learning son un avance en la tecnología de IA sobre los algoritmos estadísticos y pueden generar texto de apariencia más natural. Las redes neuronales recurrentes (RNN) son un ejemplo de modelos de deep learning aplicados al NLG.

Las RNN procesan datos secuenciales, como las palabras de una oración, y pueden transferir conocimientos, como con la traducción automática.

Transformadores

La arquitectura del modelo de transformador alimenta algunas de las tecnologías de NLG más eficaces disponibles. Los modelos basados en transformadores, como GPT y BERT, utilizan mecanismos de autoatención para capturar dependencias de largo alcance en secuencias de entrada para una mayor comprensión contextual.

ChatGPT, Claude y otros chatbots impulsados por transformadores pueden generar resultados realistas en lenguaje humano.

Casos de uso de generación de lenguaje natural

La NLG se encuentra en todo el panorama de la IA generativa, dondequiera que se utilice la IA para comunicarse directamente con los humanos en lenguaje natural. Desde Siri hasta el análisis de sentimientos, los casos de uso de la NLG incluyen: 

  • Asistentes de voz: Siri, Alexa y otros asistentes de voz utilizan NLG para responder a las solicitudes de los usuarios con lenguaje hablado. También utilizan PLN y NLU para el reconocimiento de voz para comprender lo que quieren los usuarios. 

  • Asistentes virtuales: los chatbots y los asistentes virtuales utilizan NLG para automatizar las interacciones con los clientes. Muchas organizaciones utilizan asistentes virtuales para responder a las consultas del servicio de atención al cliente antes de escalar a representantes humanos cuando sea necesario. Los agentes virtuales también se comunican con los usuarios a través de NLG.

  • Traducción automática: la traducción automática es el uso de modelos de machine learning para traducir automáticamente entre idiomas. Los sistemas de NLG gestionan la generación de resultados y agilizan el lento proceso de traducción. Los expertos humanos y los expertos en localización pueden verificar y editar los resultados según sea necesario. 

  • Resúmenes de datos e informes: los sistemas de NLG convierten datos complejos en resúmenes y esquemas fácilmente comprensibles. La racionalización de la agregación y el resumen de artículos e informes hace que la previsión sea más eficiente. Los líderes empresariales utilizan herramientas de BI basadas en NLG para la toma de decisiones basada en datos. Otras empresas utilizan IA y NLG para crear este contenido para sus clientes. 

  • Generación de contenido: cada vez que un modelo de IA generativa produce como resultado contenidos en lenguaje natural, hablamos de NLG en acción. Las empresas pueden optar por utilizar NLG para automatizar descripciones de productos, campañas de marketing por correo electrónico, publicaciones en redes sociales y otros tipos de contenido breve. 

  • Análisis de sentimientos: los sistemas de NLG crean resúmenes de texto e informes basados en el feedback y las comunicaciones de la audiencia. Las empresas pueden extraer contenido generado por los usuarios de reseñas de productos, plataformas de redes sociales, publicaciones en foros y otras ubicaciones en línea, y luego utilizar PLN y NLG para identificar cómo se sienten los usuarios. 

Soluciones relacionadas
IBM watsonx Orchestrate

Diseñe asistentes y agentes de IA escalables con facilidad, automatice tareas repetitivas y simplifique procesos complejos con IBM watsonx Orchestrate.

Descubra watsonx Orchestrate
Herramientas y API de procesamiento del lenguaje natural

Acelere el valor empresarial de la inteligencia artificial con una cartera potente y flexible de bibliotecas, servicios y aplicaciones.

Explore soluciones de PLN
Consultoría y servicios de IA

Reinvente las operaciones y flujos de trabajo críticos añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Explore los servicios de IA
Dé el siguiente paso

Diseñe asistentes y agentes de IA escalables con facilidad, automatice tareas repetitivas y simplifique procesos complejos con IBM watsonx Orchestrate.

Descubra watsonx Orchestrate Explore soluciones de PLN
Notas a pie de página

1 Natural Language Generation. Ehud Reiter. Springer. 2024.