¿Qué es la generación de lenguaje natural (NLG)?

Autores

Ivan Belcic

Staff writer

Cole Stryker

Staff Editor, AI Models

IBM Think

¿Qué es la generación de lenguaje natural (NLG)?

La generación de lenguaje natural (NLG) es el uso de inteligencia artificial (IA) para crear resultados de lenguaje natural a partir de datos estructurados y no estructurados. NLG hace posible que las computadoras y las aplicaciones de software de IA generativa (IA generativa) interactúen con los usuarios en un lenguaje humano comprensible. Junto con natural language understanding (NLU), NLG es una subcategoría de procesamiento de lenguaje natural (NLP)

Los sistemas NLG ya se utilizan ampliamente tanto en productos empresariales como de consumo, como herramientas de business intelligence (BI) y chatbots. Los asistentes de voz se comunican con los usuarios a través de NLG.

Los líderes empresariales utilizan NLG para transformar datos complejos en texto generado para destilar insights clave. Cada vez que un modelo de IA genera resultados en el lenguaje humano, eso es NLG en acción. 

Las últimas tendencias de IA presentadas por expertos

Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .

¡Gracias! Ya está suscrito.

Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

Tipos de NLG

Los 2 tipos principales de NLG son la extractiva y la abstractiva: 

  • El NLG extractivo extrae palabras y frases exactas directamente del texto de origen. Se utiliza en casos en los que la redacción específica es crítica, como con documentos legales. En comparación con NLG abstractivo, NLG extractivo es más simple porque copia de documentos fuente en lugar de dar resultados nuevos. 

  • El NLG abstractivo crea resultados novedosos basados en documentos de origen, parafraseando y generando contenido nuevo. Es un proceso más complejo que requiere modelos más avanzados, como transformadores. Donde se prefiere el NLG extractivo en entornos técnicos, el NLG abstractivo brilla en aplicaciones más creativas.

Mixture of Experts | 12 de diciembre, episodio 85

Decodificación de la IA: Resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el revuelo de la IA para ofrecerle las últimas noticias e insights al respecto.

Cómo funciona la NLG

NLG funciona progresando a través de un proceso de varias etapas para refinar las entradas de datos estructurados y no estructurados y generar resultados en lenguaje natural. Como lo describe el científico informático Ehud Reiter,1 las etapas en el proceso típico de NLG son: 

  • Análisis de señales: el sistema NLG determina qué datos de entrada se necesitan para el resultado final. En la etapa de análisis de señales o datos, el reconocimiento de patrones identifica el tema del contenido y las relaciones entre los temas. Los datos de entrada incluyen instrucciones para el usuario, contenido de bases de datos y contenido de lenguaje no estructurado, como archivos PDF, documentos y grabaciones de lenguaje hablado. El reconocimiento de entidades ayuda a los sistemas de PLN a comprender lo que se está discutiendo. 

  • Interpretación de datos: los modelos de PLN generan insights a partir de los resultados de la etapa de analytics de datos. Si los datos ya están preprocesados con los insights disponibles, se omite este paso. Los sistemas de PLN identifican partes del discurso y utilizan NLU para evaluar la sintaxis y la semántica, creando una comprensión del significado. 

  • Planificación de documentos: esta etapa identifica qué información comunicar y cómo formatearla. El sistema NLG determina su enfoque para el resultado final, en función de los datos disponibles y de la instrucción del usuario. 

  • Microplaneación: después de establecer el contenido y formato para la comunicación, el sistema NLG planifica la estructura de oraciones y párrafos para el resultado final. 

  • Realización superficial: el sistema NLG pone en marcha su plan y genera resultados en lenguaje natural de acuerdo con los resultados de los pasos anteriores. 

NLG vs. NLP

NLG forma parte de la disciplina informática del procesamiento de lenguaje natural (PLN): el uso de modelos de machine learning (ML) para comprender y trabajar con el lenguaje humano.

NLG es la parte de PLN que se ocupa de la generación de contenidos, específicamente de producir resultados de lenguaje escrito o hablado novedoso. Por ejemplo, los chatbots de IA conversacionales usan NLG para responder a las entradas del usuario en tiempo real. 

El NLP convierte las entradas de lenguaje natural en datos, y la NLG emplea los datos para generar resultados en lenguaje natural. 

El PLN forma parte del campo de la lingüística computacional: el estudio de cómo las computadoras analizan y entienden el lenguaje humano. El PLN es lingüística computacional en la práctica.

El desarrollo del aprendizaje profundo y los modelos de lenguaje de gran tamaño (LLM) hizo posible que los avances en NLP impulsaran las muchas aplicaciones de IA generativa que manejan la creación de contenido.

NLG vs. NLU

El natural language understanding (NLU) es otro subconjunto de NLP. En lugar de centrarse en el significado gramatical y lingüístico, el NLU intenta comprender el lenguaje humano de manera integral. El NLU utiliza el análisis semántico y sintáctico para comprender las entradas del lenguaje natural de manera completa y contextual, incluidas la emoción, el sentimiento y la intención. 

El NLU permite a las computadoras comprender las entradas del lenguaje natural de una forma más parecida a la humana. Cuando las personas hablan entre sí, procesan algo más que las definiciones de las palabras que usan. Pueden entender de forma natural el significado más profundo que se esconde tras las palabras literales de un hablante. 

Cuando una aplicación de software ofrece opciones de texto predictivo, utiliza NLU para comprender la intención del usuario y luego aplica NLG para terminar la oración. NLP, NLU y NLG trabajan juntos para ayudar a las computadoras a comunicarse con los usuarios.

Modelos y metodologías de NLG

Muchos sistemas de NLG usan modelos de IA avanzados, como transformadores, para crear textos novedosos a partir de datos de entrenamiento y entradas.

Sin embargo, antes de que se desarrollaran estos modelos, NLG fue posible por otros medios. Los modelos y técnicas de NLG incluyen: 

  • Plantillas

  • Sistemas basados en reglas 

  • Los transformadores

Plantillas

Los sistemas basados en plantillas usan plantillas de oraciones predefinidas con variables para los datos de entrada. Las plantillas son uno de los primeros y más sencillos tipos de NLG, apropiados para contextos en los que las estructuras de las oraciones y los documentos son coherentes. Sin embargo, los sistemas basados en plantillas no pueden adaptarse fuera de sus casos de uso predefinidos. 

Una plantilla de ejemplo podría ser: En [mes],[año], nuestra tienda [ubicación] vendió [cantidad] unidades de [artículo].

Si bien esta plantilla es excelente para elaborar informes de ventas basadas en la ubicación, no se puede aplicar para generar una receta de cocina.

Sistemas basados en reglas

Los sistemas basados en reglas generan texto de acuerdo con una serie de reglas y lógica predefinidas. Los primeros sistemas basados en reglas se crearon para reflejar la forma en que los expertos del dominio hablaban o escribían. Los programadores entrevistarían a expertos y luego crearían las reglas correspondientes para la generación de texto

Los sistemas “si-entonces” son un ejemplo común de programación basada en reglas. Por ejemplo, el software de NLG para pronósticos meteorológicos podría recibir instrucciones para describir el clima como "por debajo del punto de congelación" si la temperatura es inferior a 32 grados Fahrenheit o 0 grados Celsius.

Algoritmos estadísticos de machine learning

Los algoritmos estadísticos de machine learning, como las cadenas de Markov ocultas, identifican patrones en grandes conjuntos de datos para hacer predicciones y tomar decisiones con nuevos datos.

Generan nuevas instancias basadas en la instancia actual. Para NLG, las cadenas de Markov y otros modelos estadísticos generan palabras que probablemente se sigan entre sí. 

Los modelos estadísticos son más flexibles que las plantillas y los sistemas basados en reglas, pero requieren grandes cantidades de datos de entrenamiento.

Modelos de aprendizaje profundo

Los modelos de aprendizaje profundo son un avance en la tecnología de IA sobre los algoritmos estadísticos y pueden generar texto de apariencia más natural. Las redes neuronales recurrentes (RNN) son un ejemplo de modelos de aprendizaje profundo aplicados a NLG.

Las RNN procesan datos secuenciales, como las palabras de una oración, y pueden transferir conocimientos, como con la traducción automática.

Transformadores

La arquitectura del modelo de transformador alimenta algunas de las tecnologías NLG más eficaces disponibles. Los modelos basados en transformadores, como GPT y BERT, utilizan mecanismos de autoatención para capturar dependencias de largo alcance en secuencias de entrada para una mayor comprensión contextual.

ChatGPT, Claude y otros chatbots impulsados por transformadores pueden generar resultados realistas en lenguaje humano.

Casos de uso de generación de lenguaje natural

La NLG se encuentra en todo el ámbito de la IA generativa, dondequiera que se utilice la IA para comunicarse directamente con los humanos en lenguaje natural. Desde Siri hasta el análisis de sentimientos, los casos de uso de NLG incluyen: 

  • Asistentes de voz: Siri, Alexa y otros asistentes de voz utilizan NLG para responder a las solicitudes de los usuarios con lenguaje hablado. También utilizan NLP y NLU para el reconocimiento de voz para comprender lo que quieren los usuarios. 

  • Asistentes virtuales: los chatbots y los asistentes virtuales utilizan NLG para automatizar las interacciones con los clientes. Muchas organizaciones utilizan asistentes virtuales para responder a las consultas iniciales de atención al cliente antes de escalar a representantes humanos cuando sea necesario. Los agentes virtuales también se comunican con los usuarios a través de NLG.

  • Traducción automática: Traducción automática es el uso de modelos de machine learning para traducir automáticamente entre idiomas. Los sistemas NLG manejan la generación de resultados y agilizan el largo proceso de traducción. Los traductores humanos y los Expertos en localización pueden Verify y editar los resultados según sea necesario. 

  • Resúmenes e informes de datos: los sistemas NLG convierten datos complejos en resúmenes y esquemas fácilmente comprensibles. La optimización de la agregación y el resumen de artículos e informes hace que el forecasting sea más eficiente. Los líderes empresariales utilizan herramientas de BI impulsadas por NLG para la toma de decisiones basada en datos. Otras empresas utilizan IA y NLG para crear este contenido para sus clientes. 

  • Generación de contenido: cada vez que un modelo de IA generativa produce resultados en lenguaje natural, eso es NLG en el trabajo. Las empresas pueden optar por utilizar NLG para automatizar descripciones de productos, campañas de marketing por correo electrónico, publicaciones en redes sociales y otros tipos de contenido de formato breve. 

  • Análisis desentimiento: los sistemas NLG crean resúmenes de texto e informes basados en la audiencia y la retroalimentación. Las empresas pueden extraer contenido generado por los usuarios de comentarios de productos, plataformas de redes sociales, publicaciones en foros y otras ubicaciones en línea, y luego usar NLP y NLG para identificar cómo se sienten los usuarios. 

Soluciones relacionadas
IBM watsonx Orchestrate

Diseñe asistentes y agentes de IA escalables con facilidad, automatice tareas repetitivas y simplifique procesos complejos con IBM watsonx Orchestrate.

Descubra watsonx Orchestrate
Herramientas y API de procesamiento de lenguaje natural

Acelere el valor de negocio de la inteligencia artificial con una cartera potente y flexible de bibliotecas, servicios y aplicaciones.

Explorar las soluciones de PLN
Consultoría y servicios de IA

Reinvente los flujos de trabajo y las operaciones críticas añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Conozca los servicios de IA
Dé el siguiente paso

Diseñe asistentes y agentes de IA escalables con facilidad, automatice tareas repetitivas y simplifique procesos complejos con IBM watsonx Orchestrate.

Descubra watsonx Orchestrate Explorar las soluciones de PLN
Notas de pie de página

1 Natural Language Generation, Ehud Reiter, Springer, 2024.