¿Qué es el machine learning?

El machine learning es una forma de la IA que permite a un sistema aprender de los datos en lugar de aprender mediante la programación explícita. Sin embargo, el machine learning no es un proceso sencillo. Conforme el algoritmo ingiere datos de entrenamiento, es posible producir modelos más precisos basados en datos. Un modelo de machine learning es la salida generada cuando entrena a su algoritmo de machine learning con datos. Después del entrenamiento, al proporcionar un modelo con una entrada, se le dará una salida. Por ejemplo, un algoritmo predictivo creará un modelo predictivo. A continuación, cuando usted proporcione el modelo predictivo con datos, recibirá un pronóstico basado en los datos que entrenaron al modelo.

Ilustración para machine learning

Aprendizaje iterativo

El machine learning permite modelos a entrenar con conjuntos de datos antes de ser implementados. Algunos modelos de machine learning están online y son continuos. Este proceso iterativo de modelos online conduce a una mejora en los tipos de asociaciones hechas entre los elementos de datos. Debido a su complejidad y tamaño, estos patrones y asociaciones podrían haber sido fácilmente pasados por alto por la observación humana. Después de que un modelo ha sido entrenado, se puede utilizar en tiempo real para aprender de los datos. Las mejoras en la precisión son el resultado del proceso de entrenamiento y la automatización que forman parte del machine learning.

Enfoques hacia el machine learning

Las técnicas de machine learning son requeridas para mejorar la precisión de los modelos predictivos. Dependiendo de la naturaleza del problema empresarial que se está atendiendo, existen diferentes enfoques basados en el tipo y volumen de los datos. En esta sección, discutimos las categorías del machine learning.

Aprendizaje supervisado

El aprendizaje supervisado comienza típicamente con un conjunto establecido de datos y una cierta comprensión de cómo se clasifican estos datos. El aprendizaje supervisado tiene la intención de encontrar patrones en datos que se pueden aplicar a un proceso de analítica. Estos datos tienen características etiquetadas que definen el significado de los datos. Por ejemplo, se puede crear una aplicación de machine learning con base en imágenes y descripciones escritas que distinga entre millones de animales.

Aprendizaje no supervisado

El aprendizaje no supervisado se utiliza cuando el problema requiere una cantidad masiva de datos sin etiquetar. Por ejemplo, las aplicaciones de redes sociales, tales como Twitter, Instagram y Snapchat, tienen grandes cantidades de datos sin etiquetar. La comprensión del significado detrás de estos datos requiere algoritmos que clasifican los datos con base en los patrones o clústeres que encuentra. El aprendizaje no supervisado lleva a cabo un proceso iterativo, analizando datos sin la intervención humana. Se utiliza con la tecnología de detección de spam en e-mails. Existen demasiadas variables en los e-mails legítimos y de spam para que un analista etiquete una cantidad masiva de e-mail no solicitado. En su lugar, se utilizan los clasificadores de machine learning basados en clustering y asociación para identificar e-mails no deseados.

Aprendizaje de refuerzo

El aprendizaje de refuerzo es un modelo de aprendizaje conductual. El algoritmo recibe retroalimentación del análisis de datos, conduciendo el usuario hacia el mejor resultado. El aprendizaje de refuerzo difiere de otros tipos de aprendizaje supervisado, porque el sistema no está entrenado con el conjunto de datos de ejemplo. Más bien, el sistema aprende a través de la prueba y el error. Por lo tanto, una secuencia de decisiones exitosas conduce al fortalecimiento del proceso, porque es el que resuelve el problema de manera más efectiva.

Deep learning

El deep learning es un método específico de machine learning que incorpora las redes neuronales en capas sucesivas para aprender de los datos de manera iterativa. El deep learning es especialmente útil cuando se trata de aprender patrones de datos no estructurados. Las redes neuronales complejas de deep learning están diseñadas para emular cómo funciona el cerebro humano, así que las computadoras pueden ser entrenadas para negociar con abstracciones y problemas mal definidos. La mayoría de los niños de cinco años pueden reconocer fácilmente la diferencia entre el rostro de su maestro y el rostro del guardia que ayuda a cruzar la calle. Por el contrario, la computadora necesita de mucho trabajo para averiguar quién es quién. Las redes neuronales y el deep learning se utilizan a menudo en el reconocimiento de imágenes, voz y aplicaciones de visión de computadora.

Gráfico para Machine learning

El Big data en el contexto del machine learning

El machine learning requiere que el correcto conjunto de datos se aplique a un proceso de aprendizaje. Una organización no necesita de big data para utilizar las técnicas del machine learning; sin embargo, el big data puede ayudar a mejorar la precisión de los modelos de machine learning. Con el big data, ahora es posible virtualizar los datos para que se puedan almacenar de manera más eficiente y rentable, ya sea on premises o en la nube. Además, las mejoras en la velocidad y confiabilidad en la red han eliminado otras limitaciones físicas asociadas con la gestión de cantidades masivas de datos a una velocidad aceptable. Agregue a esto el impacto de los cambios en el precio y en la sofisticación de la memoria de las computadoras y ahora es posible imaginar cómo las compañías pueden aprovechar los datos de formas que serían inconcebibles hasta sólo cinco años atrás.

Aplicación de machine learning a las necesidades empresariales

El machine learning ofrece un valor potencial a las empresas que tratan de aprovechar el big data y les ayuda a comprender mejor los cambios sutiles en el comportamiento, las preferencias o la satisfacción del cliente. Los líderes de negocios están empezando a descubrir que muchas cosas que están sucediendo dentro de sus organizaciones e industrias no pueden ser entendidas a través de una consulta. No son las preguntas que sabe, pero son los patrones ocultos y las anomalías escondidas en los datos lo que pueden ayudarlo o dañarlo.

¿Cómo unir todo?

La ventaja del machine learning es que es posible aprovechar algoritmos y modelos para predecir resultados. Es importante asegurarse de que los científicos de datos que realizan el trabajo usen los algoritmos correctos, asimilando los datos más apropiados (que sean precisos y limpios) y utilizando los mejores modelos de rendimiento. Si todos estos elementos se reúnen, es posible entrenar continuamente al modelo y explotar los resultados aprendiendo de los datos. La automatización de este proceso de modelado, entrenamiento del modelo y pruebas conduce a predicciones precisas para dar soporte a los cambios empresariales.

Inteligencia artificial

Productos

IBM Watson Studio

Una solución de nube on-premises pública o privada que proporciona una plataforma de machine learning colaborativo para que los equipos exploren, modelen e implementen soluciones de datos, utilizando las principales herramientas de código abierto.

IBM Machine Learning for z/OS

Una solución de machine learning on premises que extrae el valor oculto de los datos empresariales. Ingiera y transforme rápidamente datos para crear, implementar y gestionar modelos de autoaprendizaje de alta precisión, utilizando los datos de IBM z Systems®.

IBM SPSS® Modeler

Una plataforma de analítica gráfica para usuarios de todos los niveles de habilidades para implementar insights a escala con una amplia gama de algoritmos y capacidades como analítica de texto, análisis geoespacial y optimización.

IBM Watson Explorer

Una plataforma de analítica de contenido impulsada por machine learning y la búsqueda cognitiva que proporciona a los usuarios el acceso a insights procesables de todos los datos y ayuda a obtener mejores resultados empresariales.

Casos de éxito

Ahus obtiene nuevos insights con Watson Explorer y optimiza la calidad de la atención médica

El Akershus University Hospital (Ahus) usa Watson Explorer, junto con el socio Capgemini, para analizar miles de informes de radiología para asegurar que los equipos están siguiendo las mejores prácticas, ayudando así a mantener altos estándares en el cuidado de la salud.

La analítica de contenido en tiempo real ayuda a los call centers a atender a los clientes de manera efectiva

Mizuho Bank Ltd. conduce efectivamente las interacciones de los clientes y reduce el tiempo de manejo de cliente con la ayuda de las capacidades de procesamiento de lenguaje natural en tiempo real de IBM Watson Explorer.

Recursos

Realice una visita guiada de cómo desarrollar un modelo de machine learning para predecir la deserción de los clientes en IBM Watson Studio

Consulte los tutoriales de aplicaciones de machine learning y de deep learning

Inicie ahora su versión de prueba de Watson Studio gratuitamente