¿Qué es machine learning?

Machine learning es una forma de inteligencia artificial que permite a un sistema aprender de los datos en lugar de mediante programación explícita. Sin embargo, machine learning no es un proceso simple. A medida que los algoritmos ingieren los datos de entrenamiento, se pueden generar modelos más precisos basados en esos datos. Un modelo de machine learning es la salida que se genera cuando entrena el algoritmo de machine learning con datos. Después del entrenamiento, cuando proporcione una entrada a un modelo, se le dará una salida. Por ejemplo, un algoritmo predictivo creará un modelo predictivo. A continuación, cuando proporcione datos al modelo predictivo, recibirá una previsión basada en los datos que han entrenado el modelo.

Ilustración para machine learning

Aprendizaje iterativo

Machine learning permite entrenar los modelos con conjuntos de datos antes de desplegarse. Algunos modelos de machine learning están en línea y son continuos. Este proceso iterativo de los modelos en línea se traduce en una mejora en los tipos de asociaciones realizadas entre los elementos de datos. Debido a su complejidad y tamaño, la observación humana podría haber pasado por alto estos patrones y asociaciones fácilmente. Una vez que un modelo ha sido entrenado, se puede utilizar en tiempo real para aprender de los datos. Las mejoras en la precisión son el resultado del proceso de entrenamiento y automatización que forman parte de machine learning.

Enfoques de machine learning

Las técnicas de machine learning son necesarias para mejorar la precisión de los modelos predictivos. Dependiendo de la naturaleza del problema de negocio que se esté tratando, existen diferentes enfoques basados en el tipo y el volumen de los datos. En esta sección, discutimos las categorías de machine learning.

Aprendizaje supervisado

El aprendizaje supervisado normalmente comienza con un conjunto establecido de datos y un determinado nivel de comprensión sobre cómo se clasifican los datos. El aprendizaje supervisado tiene como objetivo encontrar patrones en los datos que se pueden aplicar a un proceso de analítica. Estos datos tienen características etiquetadas que definen el significado de los datos. Por ejemplo, puede crear una aplicación de machine learning que distinga entre millones de animales, basándose en imágenes y descripciones escritas.

Aprendizaje no supervisado

El aprendizaje no supervisado se utiliza cuando el problema requiere una gran cantidad de datos sin etiquetar. Por ejemplo, las aplicaciones de redes sociales, tales como Twitter, Instagram y Snapchat, tienen grandes cantidades de datos sin etiquetar. Comprender el significado detrás de estos datos requiere algoritmos que clasifican los datos basándose en los patrones o clústeres que encuentra. El aprendizaje no supervisado realiza un proceso iterativo, analizando datos sin intervención humana. Se utiliza con la tecnología de detección de spam por correo electrónico. Existen demasiadas variables en los correos electrónicos legítimos y spam para que un analista pueda etiquetar correo masivo no solicitado. En su lugar, se aplican clasificadores de machine learning, basados en la agrupación en clúster y la asociación, para identificar correo electrónico no deseado.

Aprendizaje por refuerzo

El aprendizaje por refuerzo es un modelo de aprendizaje conductual. El algoritmo recibe feedback del análisis de datos, guiando al usuario al mejor resultado. El aprendizaje por refuerzo difiere de otros tipos de aprendizaje supervisado, porque el sistema no está entrenado con el conjunto de datos de ejemplo. Sino que en este caso el sistema aprende a través de prueba y error. Por lo tanto, una secuencia de decisiones correctas hará que el proceso se refuerce, porque soluciona mejor el problema.

Deep learning

Deep learning es un método específico de machine learning que incorpora las redes neuronales en capas sucesivas para aprender de los datos de manera iterativa. Deep learning es especialmente útil cuando trata de aprender patrones de datos no estructurados. Las redes neuronales complejas de deep learning están diseñadas para emular el funcionamiento del cerebro humano, por lo que se puede entrenar a los sistemas para que traten problemas y abstracciones mal definidas. Un niño de cinco años es capaz de reconocer fácilmente la diferencia entre la cara de su maestro y la cara de un guardia. Por el contrario, el sistema tiene que trabajar mucho para descifrar quién es quién. Las redes neuronales y deep learning se utilizan a menudo en el reconocimiento de imágenes, el habla y las aplicaciones de visión computacional.

Gráfico para Machine Learning

Big data en el contexto de machine learning

Machine learning requiere aplicar el conjunto de datos adecuado a un proceso de aprendizaje. Una organización no tiene que tener big data para utilizar las técnicas de machine learning; sin embargo, sí que es verdad que con big data se puede mejorar la precisión de los modelos de machine learning. Con big data, ahora es posible virtualizar los datos para que se puedan almacenar de la manera más eficiente y rentable, ya sea en local o en cloud. Además, las mejoras en la velocidad y fiabilidad de la red han eliminado otras limitaciones físicas asociadas a la gestión de grandes cantidades de datos a una velocidad aceptable. Añada a esto el impacto de los cambios sobre el precio y la sofisticación del sistema, así ahora es posible imaginar cómo las compañías pueden aprovechar los datos de formas que hace solo cinco años eran inconcebibles.

Aplicar machine learning a las necesidades de negocio

Machine learning ofrece valor potencial a las empresas que tratan de aprovechar big data y les ayuda a comprender mejor los cambios sutiles en el comportamiento, las preferencias o la satisfacción del cliente. Los líderes de negocio están empezando a apreciar que muchas cosas que suceden dentro de sus organizaciones y sectores no se pueden comprender a través de una consulta. No se trata de las preguntas que ya sabe, sino de los patrones ocultos y las anomalías enterradas en los datos que pueden ayudarle o perjudicarle.

¿Cómo se combina todo?

La ventaja de machine learning es que es posible utilizar los algoritmos y los modelos para prever los resultados. El truco consiste en asegurarse de que los científicos de datos que realizan el trabajo estén aplicando los algoritmos correctos, ingiriendo los datos más adecuados (precisos y limpios) y utilizando los modelos que ofrecen el mejor rendimiento. Si todos estos elementos se unen, es posible entrenar el modelo de forma continua y aprender de los resultados aprendiendo de los datos. La automatización de este proceso de modelar, entrenar el modelo y realizar pruebas permite generar previsiones precisas para impulsar el cambio de negocio.

Inteligencia artificial

Productos

IBM Watson Studio

Una solución de cloud público, privado o en local que proporciona una plataforma colaborativa de machine learning para que los equipos puedan explorar, modelar y desplegar soluciones de datos, utilizando las principales herramientas de código abierto.

IBM Machine Learning for z/OS

Una solución de machine learning en local que extrae el valor oculto de los datos empresariales. Ingiera rápidamente y transforme los datos para crear, desplegar y gestionar modelos de autoaprendizaje de alta precisión, utilizando los datos de IBM z Systems®.

IBM SPSS® Modeler

Una plataforma de analítica gráfica para usuarios con cualquier nivel de conocimientos para desplegar conocimientos a escala con una amplia gama de algoritmos y funcionalidades, como el análisis de texto, el análisis geoespacial y la optimización.

IBM Watson Explorer

Una plataforma de búsqueda cognitiva y análisis de contenido basada en machine learning que proporciona a los usuarios acceso a información de valor práctica extraída de todos los datos y ayuda a mejorar los resultados de negocio.

Casos prácticos

Ahus obtiene nuevos conocimientos con Watson Explorer para ofrecer una asistencia sanitaria de alta calidad

Akershus University Hospital (Ahus) está utilizando Watson Explorer, junto con su socio Capgemini, para analizar miles de informes de radiología para confirmar que los equipos están siguiendo las mejores prácticas, ayudando a mantener altos estándares de asistencia.

La analítica de contenido en tiempo real ayuda a los call centers a prestar un servicio efectivo a los clientes

Mizuho Bank Ltd. logra interacciones eficientes con los clientes y reduce el tiempo dedicado a cada consulta del cliente con la ayuda de las funcionalidades de procesamiento del lenguaje natural en tiempo real de IBM Watson Explorer.

Recursos

Realice una visita guiada de cómo crear un modelo de machine learning para prever el abandono de los clientes en IBM Watson Studio

Consulte más tutoriales sobre aplicaciones de machine learning y deep learning

Inicie la versión de prueba de Watson Studio ahora sin ningún coste