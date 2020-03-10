Etiquetas
Creación de modelos de PNL: desde la configuración estándar hasta la personalización

Sean Sodha

Erik Didriksen

Fondo

Con la ayuda de los modelos de procesamiento del lenguaje natural (PLN) basados en el machine learning, su empresa puede acelerar los procesos, realizar predicciones más precisas y descubrir nuevos conocimientos a partir de los datos existentes. Para obtener el máximo valor de sus esfuerzos, es importante elegir el servicio de NLP basado en el machine learning adecuado para su caso de uso específico. En IBM, a menudo recibimos preguntas como: "¿Cómo sabe un modelo de machine learning cómo leer mis datos?" o "¿Cómo sabe un modelo de machine learning qué buscar?" La respuesta depende del modelo que utilice.

Hablemos de dos enfoques diferentes para crear soluciones de machine learning con la PNL: modelos listos para usar y modelos personalizados. Cuando necesita descubrir rápidamente conocimientos generales, probablemente quiera un modelo listo para usar. Cuando su caso de uso contiene datos específicos del sector o el dominio, como datos especializados o jerga, es más adecuado un modelo personalizado.

Modelado en PNL

Modelos listos para usar

A menudo escuchamos que construir soluciones para análisis basado en texto es engorroso y lleva mucho tiempo. Pasar horas clasificando documentos, etiquetando palabras clave o sentimientos en el texto no es el mejor uso de su tiempo. Los modelos PNL listos para usar o preentrenados automatizan esas tareas por usted. Los modelos listos para usar proporcionan una gran ventaja cuando se dispone de poco tiempo o no se tienen datos con los que entrenarse. Son eficaces para pruebas de concepto rápidas y tienen un alto ROI, especialmente cuando necesita comprender elementos de nivel superior como categorías o conceptos dentro de sus documentos. Los modelos preconstruidos suelen entrenarse con fuentes de datos de uso general y no suelen estar adaptados a ningún sector o dominio.

Modelos personalizados

Cuando su caso de uso contiene jerga de sectores específica, es posible que los modelos preentrenados solo satisfagan una parte de sus necesidades. En diferentes sectores, algunas entidades (personas, lugares, eventos, etc.) tendrán significados distintos, por lo que un modelo fuera de lo común puede no ser capaz de captar estas sutilezas dependiendo del contexto. Por ejemplo, la palabra "premium" puede significar el extremo superior de una gama de productos, o puede significar el pago realizado a cambio de una póliza de seguro. En Australia, este pago del seguro se denomina "la cobertura".

Su modelo personalizado puede entrenarse para comprender los matices subyacentes, el significado y las relaciones específicas de su caso de uso y dominio del sector. Como se mencionó anteriormente, puede enseñarle al modelo qué significa la palabra “premium” en el contexto de su negocio. Estos modelos se pueden construir de varias maneras, y no es necesario ser científico de datos o desarrollador de software para crearlos. Con herramientas sin código, lo único que necesita es tener experiencia en la materia. Un experto en la materia (SME) definirá qué información es importante en el modelo, cargará documentos para la formación y, a continuación, seleccionará ejemplos, a menudo denominados anotaciones, dentro de esos documentos.

Las anotaciones que crea en sus documentos proporcionan al sistema ejemplos específicos que sirven como la “verdad fundamental” para el modelo. Ya se trate de definir entidades específicas para su extracción de un documento o las relaciones entre ellas, a través de la formación realizará las mejoras que garanticen la eficacia del modelo.

¿Cuándo debería invertir en un modelo personalizado?

Al combinar modelos PNL listos para usar con modelos PNL personalizados, obtendrá lo mejor de ambos mundos. Recomendamos entrenar su modelo para comprender primero los componentes simples, como ubicaciones u organizaciones. De esta manera, su modelo de PNL se centra en las piezas que son importantes para su negocio, para en última instancia impulsar decisiones más inteligentes.

¿Y ahora qué?

Obtenga más información sobre las diferencias entre los modelos de PNL listos para usar y los modelos de PNL personalizados, o consulte Watson Natural Language Understanding y Watson Discovery para crear sus propios modelos de PNL basados en el machine learning.
