El procesamiento del lenguaje natural (PLN) combina la lingüística computacional (modelización del lenguaje humano basada en reglas) con modelos estadísticos y de machine learning para que los ordenadores y dispositivos digitales reconozcan, comprendan y generen texto y voz.
El PLN, una rama de la inteligencia artificial (IA), se encuentra en el corazón de las aplicaciones y los dispositivos que pueden
a menudo en tiempo real. Hoy en día, la mayoría de la gente ha interactuado con el PLN en forma de sistemas GPS operados por voz, asistentes digitales, softwares speech to text, chatbots de atención al cliente y otras comodidades para el consumidor. Pero el PLN también desempeña un papel cada vez más importante en las soluciones empresariales que ayudan a agilizar y automatizar las operaciones de negocio, aumentar la productividad de los empleados y simplificar los procesos empresariales de misión crítica.
Utilice este marco de selección de modelos para elegir el más adecuado y equilibrar sus requisitos de rendimiento con el coste, los riesgos y las necesidades de implementación.
Regístrese para obtener el informe técnico sobre el gobierno de la IA
El lenguaje humano está lleno de ambigüedades que hacen increíblemente difícil escribir programas informáticos que determinen con precisión el significado de un texto o de unos datos vocales. Homónimos, homófonos, sarcasmo, modismos, metáforas, excepciones gramaticales y de uso, variaciones en la estructura de las frases... Éstas son sólo algunas de las irregularidades del lenguaje humano que los seres humanos tardan años en aprender, pero que los programadores deben enseñar a las aplicaciones basadas en el lenguaje natural a reconocer y entender con precisión desde el principio, si quieren que dichas aplicaciones sean útiles.
Varias tareas de PLN descomponen los datos de texto y voz humanos de forma que ayuden al ordenador a dar sentido a lo que está ingiriendo. Entre estas tareas se incluyen las siguientes:
Consulte la entrada del blog "PLN vs CLN vs GLN: las diferencias entre tres conceptos de procesamiento del lenguaje natural" para profundizar en cómo se relacionan estos conceptos.
El nuevo estudio empresarial que aúna el machine learning tradicional con las nuevas funciones de IA generativa basadas en modelos fundacionales.
El lenguaje de programación Python ofrece una amplia gama de herramientas y bibliotecas para abordar tareas específicas de PLN. Muchos de ellos se encuentran en el kit de herramientas de lenguaje natural, o NLTK (por sus siglas en inglés), una colección de código abierto de bibliotecas, programas y recursos formativos para crear programas de PLN.
El NLTK incluye bibliotecas para muchas de las tareas de PLN enumeradas anteriormente, además de bibliotecas para subtareas, como el análisis sintáctico de frases, la segmentación de palabras, el stemming y la lematización (métodos de recorte de palabras hasta sus raíces) y la tokenización (para dividir frases, oraciones, párrafos y pasajes en tokens que ayuden al ordenador a comprender mejor el texto). También incluye bibliotecas para implementar capacidades como el razonamiento semántico, la capacidad de llegar a conclusiones lógicas a partir de hechos extraídos de un texto.
Las primeras aplicaciones de PLN eran sistemas codificados a mano y basados en reglas que podían realizar ciertas tareas de PLN, pero no podían adaptarse fácilmente a un flujo aparentemente interminable de excepciones o a los crecientes volúmenes de datos de texto y voz.
Introduzca el PLN estadístico, que combina algoritmos informáticos con modelos de machine learning y deep learning para extraer, clasificar y etiquetar automáticamente elementos de texto y datos de voz y luego asignar una probabilidad estadística a cada significado posible de esos elementos. Hoy en día, los modelos de deep learning y las técnicas de aprendizaje basadas en redes neuronales convolucionales (CNN, por sus siglas en inglés) y redes neuronales recurrentes (RNN, por sus siglas en inglés) permiten a los sistemas de PLN "aprender" mientras trabajan y extraer significados cada vez más precisos de enormes volúmenes de conjuntos de datos de texto y voz sin procesar, sin estructurar y sin etiquetar.
Para profundizar en los matices entre estas tecnologías y sus enfoques de aprendizaje, consulte "IA vs machine learning vs deep learning vs redes neuronales: ¿Cuál es la diferencia?"
El procesamiento del lenguaje natural es la fuerza motriz de la inteligencia artificial en muchas aplicaciones modernas del mundo real. Estos son algunos ejemplos:
Acelere el valor empresarial de la inteligencia artificial con una cartera potente y flexible de bibliotecas, servicios y aplicaciones.
Infunda una potente IA de lenguaje natural en aplicaciones comerciales con una biblioteca en contenedores diseñada para dotar a los socios de IBM de una mayor flexibilidad.
Aprenda los conceptos fundamentales de la IA y la IA generativa, incluida la ingeniería de avisos, los grandes modelos lingüísticos y los mejores proyectos de código abierto.
Conozca diferentes casos de uso de PLN en este explicador de PLN.
Visite el sitio web de IBM Developer para acceder a blogs, artículos, boletines y mucho más. Conviértase en socio de IBM e infunda la IA integrable de IBM Watson en sus soluciones comerciales hoy mismo. BM Watson NLP Library for Embed para sus soluciones.
Rob Thomas, director general de IBM Data & AI, recibe a expertos y clientes de PLN para mostrarles cómo las tecnologías de PLN están optimizando los negocios en todos los sectores.
Las consideraciones éticas en cuestión de IA nunca han sido tan críticas como ahora.
IBM ha lanzado un nuevo conjunto de herramientas de código abierto, PrimeQA, para impulsar el progreso de los sistemas multilingües de respuesta a preguntas y facilitar a cualquiera la búsqueda rápida de información en la web.