El procesamiento del lenguaje natural (PLN) se refiere a la rama de la informática, y más específicamente a la rama de la inteligencia artificial o IA, que se ocupa de dar a las computadoras la capacidad de comprender textos y palabras habladas de la misma manera que los seres humanos.
El PLN combina la lingüística computacional (modelado del lenguaje humano basado en reglas) con modelos estadísticos, de machine learning y de deep learning. Juntas, estas tecnologías permiten que las computadoras procesen el lenguaje humano en forma de texto o datos de voz y "comprendan" su significado completo, con la intención y el sentimiento de la persona que habla o escribe.
El PLN impulsa programas informáticos que traducen texto de un idioma a otro, responden a comandos hablados y resumen grandes volúmenes de texto rápidamente, incluso en tiempo real. Es muy probable que haya interactuado con el PLN en forma de sistemas GPS operados por voz, asistentes digitales, software de dictado de voz a texto, chatbots de atención al cliente y otras ventajas para el consumidor. Pero el PLN también desempeña un papel cada vez más importante en las soluciones empresariales que ayudan a agilizar las operaciones empresariales, aumentar la productividad de los empleados y simplificar los procesos de negocio de misión crítica.
El lenguaje humano está lleno de ambigüedades que hacen que sea increíblemente difícil escribir software que determine con precisión el significado deseado de los datos de texto o voz. Homónimos, homófonos, sarcasmo, modismos, metáforas, excepciones gramaticales y de uso, variaciones en la estructura de la oración: estas son solo algunas de las irregularidades del lenguaje humano que los seres humanos tardan años en aprender, pero que los programadores deben enseñar a las aplicaciones basadas en el lenguaje natural a reconocer y comprender con exactitud desde el principio para garantizar su eficacia.
Varias tareas del PLN desglosan los datos de texto y voz humanos de maneras que ayudan a la computadora a dar sentido a lo que ingiere. Entre estas tareas se incluyen las siguientes:
Vea la publicación del blog "PLN vs. CLN vs. GLN: las diferencias entre tres conceptos de procesamiento del lenguaje natural" para entender mejor cómo se relacionan estos conceptos.
El lenguaje de programación Python proporciona una amplia variedad de herramientas y bibliotecas para abordar tareas específicas del PLN. Muchas de estas se encuentran en Natural Language Toolkit, o NLTK, una colección de código abierto de bibliotecas, programas y recursos educativos para crear programas de PLN.
El NLTK incluye bibliotecas para muchas de las tareas de PLN enumeradas anteriormente, además de bibliotecas para subtareas, como análisis sintáctico de oraciones, segmentación de palabras, derivación y lematización (métodos para recortar palabras a sus raíces) y tokenización (para dividir frases, oraciones, párrafos y pasajes en fichas que ayudan a la computadora a comprender mejor el texto). También incluye bibliotecas para implementar capacidades como el razonamiento semántico, la capacidad de llegar a conclusiones lógicas basadas en hechos extraídos del texto.
Las primeras aplicaciones de PLN eran sistemas codificados manualmente y basados en reglas que podían realizar ciertas tareas de PLN, pero no podían escalar fácilmente para adaptarse a un flujo aparentemente interminable de excepciones o los crecientes volúmenes de datos de texto y voz.
Así surgió el PLN estadístico, que combina algoritmos informáticos con modelos de machine learning y deep learning para extraer, clasificar y etiquetar automáticamente elementos de texto y datos de voz y luego asignar una probabilidad estadística a cada posible significado de esos elementos. Hoy en día, los modelos de deep learning y las técnicas de aprendizaje basadas en redes neuronales convolucionales (CNN) y redes neuronales recurrentes (RNN) permiten que los sistemas de PLN "aprendan" mientras trabajan y extraen un significado cada vez más preciso de grandes volúmenes de datos de texto y voz sin formato, sin estructura y sin etiquetas.
Para descubrir más acerca de las características de estas tecnologías y sus enfoques de aprendizaje, vea "IA vs. machine learning vs. deep learning vs. redes neuronales: ¿cuál es la diferencia?".
.
El procesamiento del lenguaje natural es la fuerza que impulsa la inteligencia artificial en muchas aplicaciones modernas del mundo real. Estos son algunos ejemplos:
Encuentre respuestas e insights fundamentales de sus datos empresariales mediante la tecnología de búsqueda empresarial impulsada por IA.
Utilice el servicio de procesamiento del lenguaje natural (PLN) para la analítica de texto avanzada.
Resuelva los problemas de los clientes en el primer intento, en cualquier canal.