Con la ayuda de modelos de procesamiento de lenguaje natural basados en machine learning, su empresa puede acelerar los procesos, realizar predicciones más precisas y descubrir nuevos insights a partir de los datos existentes. Para obtener el máximo valor de sus esfuerzos, es importante elegir el servicio de NLP basado en machine learning adecuado para su caso de uso específico. En IBM, a menudo recibimos preguntas como: "¿Cómo sabe un modelo de machine learning cómo leer mis datos?" o "¿Cómo sabe un modelo de machine learning qué buscar?" La respuesta depende del modelo que utilice.
Analicemos dos enfoques diferentes para crear soluciones de machine learning con NLP: modelos listos para usar y modelos personalizados. Cuando necesite descubrir rápidamente insights generales, probablemente desee un modelo listo para usar. Cuando su caso de uso contiene datos específicos de la industria o el dominio, como datos especializados o jerga, es apropiado un modelo personalizado.
A menudo escuchamos que construir soluciones para análisis basado en texto es engorroso y lleva mucho tiempo. Pasar horas clasificando documentos, etiquetando palabras clave o sentimientos en el texto no es el mejor uso de su tiempo. Los modelos de NLP listos para usar o preentrenados automatizan esas tareas por usted. Los modelos listos para usar brindan una gran ventaja cuando tiene tiempo limitado o no tiene datos para entrenar. Son eficaces para pruebas de concepto rápidas y tienen un alto retorno de la inversión (ROI), especialmente cuando necesita comprender elementos de nivel superior como categories o conceptos dentro de sus documentos. Los modelos preconstruidos suelen entrenarse con fuentes de datos de uso general y no suelen estar adaptados a ninguna industria o ámbito concreto.
Cuando su caso de uso contiene una consigna específica de la industria, es posible que los modelos previamente entrenados solo satisfagan una parte de sus necesidades. En diferentes industrias, algunas entidades (personas, lugares, eventos, etc.) tendrán diferentes significados, por lo que un modelo fuera de lo común puede no ser capaz de captar estas sutilezas dependiendo del contexto. Por ejemplo, la palabra “premium” puede significar el extremo superior de una gama de productos, o puede significar el pago realizado a cambio de una póliza de seguro. En Australia, este pago del seguro se conoce como “la cobertura”.
Su modelo personalizado puede entrenarse para comprender los matices subyacentes, el significado y las relaciones específicas de su caso de uso y dominio de la industria. Como se indicó anteriormente, puede enseñar al modelo lo que significa la palabra "premium" en el contexto de su negocio. Estos modelos se pueden construir de varias maneras, y no es necesario ser científico de datos o desarrollador de software para crearlos. Con herramientas sin código, lo único que necesitas aportar es tu experiencia en la materia. Un experto en la materia (SME) definirá qué información es importante en el modelo, cargará documentos para el entrenamiento y luego seleccionará ejemplos, a menudo llamados anotaciones, dentro de esos documentos.
Las anotaciones que crea en sus documentos proporcionan al sistema ejemplos específicos que sirven como "verdad fundamental" para el modelo. Ya sea que defina entidades específicas para la extracción de un documento o las relaciones entre ellas, a través del entrenamiento, realizará las mejoras que garantizan la eficacia del modelo.
Al combinar modelos de PLN listos para usar con modelos de PLN personalizados, obtiene lo mejor de ambos mundos. Recomendamos entrenar su modelo para comprender primero los componentes simples, como ubicaciones u organizaciones. De esta manera, su modelo de NLP se centra en las piezas que son importantes para su negocio, para, en última instancia, impulsar decisiones más inteligentes.
Aprenda más sobre las diferencias entre los modelos de PLN listos para usar y los modelos de PLN personalizados, o consulte Watson Natural Language Understanding y Watson Discovery para crear sus propios modelos de PLN basados en machine learning.
