Cinco tipos de machine learning que conviene conocer

Autor

Staff Writer, Automation & ITOps

IBM Think

Las tecnologías de machine learning (ML) pueden impulsar la toma de decisiones en prácticamente todos los sectores, desde la sanidad a los recursos humanos, pasando por las finanzas, y en innumerables casos de uso, como la computer vision, los modelos de lenguaje de gran tamaño (LLM), el reconocimiento de voz, los coches autónomos, etc.

Sin embargo, la creciente influencia del ML no está exenta de complicaciones. Los conjuntos de datos de validación y entrenamiento en los que se basa la tecnología de ML suelen ser recopilados por seres humanos, propensos a cometer errores y sujetos a prejuicios. Incluso en los casos en los que un modelo de ML no está sesgado o defectuoso en sí mismo, su implementación en un contexto equivocado puede producir errores con consecuencias perjudiciales no deseadas.

Por eso, diversificar el uso de la IA y el ML en la empresa puede resultar muy valioso para mantener una ventaja competitiva. Cada tipo y subtipo de algoritmo de ML tiene beneficios y capacidades únicas que los equipos pueden aprovechar para diferentes tareas. Aquí hablaremos de los cinco tipos principales y sus aplicaciones.

Las últimas tendencias en IA, presentadas por expertos

Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.

¿Qué es el machine learning (ML) o aprendizaje automático?

El ML es un subconjunto de la informática, la ciencia de datos y la inteligencia artificial (IA) que permite a los sistemas aprender y mejorar a partir de los datos sin intervenciones adicionales de programación.

En lugar de utilizar instrucciones explícitas para optimizar el rendimiento, los modelos de ML se basan en algoritmos y modelos estadísticos que implementan tareas basadas en patrones de datos e inferencias. En otras palabras, el ML aprovecha los datos de entrada para predecir los outputs, actualizándolos continuamente a medida que se dispone de nuevos datos.

En los sitios web de venta minorista, por ejemplo, los algoritmos de machine learning influyen en las decisiones de compra de los consumidores haciendo recomendaciones basadas en el historial de compras. Las plataformas de comercio electrónico de muchos minoristas (incluidas las de IBM, Amazon, Google, Meta y Netflix) se basan en redes neuronales artificiales (RNA) para ofrecer recomendaciones personalizadas. Y los minoristas aprovechan con frecuencia los datos de chatbots y asistentes virtuales, junto con la tecnología de ML y de procesamiento del lenguaje natural (PLN), para automatizar las experiencias de compra de los usuarios.

Mixture of Experts | 12 de diciembre, episodio 85

Descifrar la IA: resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el bullicio de la IA para ofrecerle las últimas noticias y conocimientos al respecto.

Vea todos los episodios de Mixture of Experts

Tipos de machine learning

Los algoritmos de machine learning se dividen en cinco grandes categorías: aprendizaje supervisado, aprendizaje no supervisado, aprendizaje semisupervisado, aprendizaje autosupervisado y aprendizaje por refuerzo.

1. Machine learning supervisado

El machine learning supervisado es un tipo de machine learning en el que el modelo se entrena con un conjunto de datos etiquetados (es decir, se conoce la variable objetivo o de resultado). Por ejemplo, si los científicos de datos estuvieran construyendo un modelo para la predicción de tornados, las variables de entrada podrían incluir la fecha, la ubicación, la temperatura, los patrones de flujo del viento y más, y el output sería la actividad real de tornados registrada para esos días.

El aprendizaje supervisado se utiliza habitualmente para la evaluación de riesgos, el reconocimiento de imágenes, el análisis predictivo y la detección del fraude, y comprende varios tipos de algoritmos.

Algoritmos de regresión: predicen valores de output identificando relaciones lineales entre valores reales o continuos (por ejemplo, temperatura, salario). Los algoritmos de regresión incluyen la regresión lineal, el bosque aleatorio y el gradient boosting o potenciación del gradiente, así como otros subtipos.
Algoritmos de clasificación: predicen variables de output categóricas (por ejemplo, "basura" o "no basura") etiquetando piezas de datos de entrada. Los algoritmos de clasificación incluyen, entre otros, la regresión logística, los vecinos más próximos y las máquinas de vectores de soporte (SVM).
Clasificadores Naïve Bayes: permiten tareas de clasificación para grandes conjuntos de datos. También forman parte de una familia de algoritmos de aprendizaje generativo que modelan la distribución de entrada de una clase o categoría determinada. Los algoritmos Naïve Bayes incluyen árboles de decisión, que en realidad pueden acomodar tanto algoritmos de regresión como de clasificación.
Redes neuronales: simulan el funcionamiento del cerebro humano, con un enorme número de nodos de procesamiento conectados que pueden facilitar procesos como la traducción de lenguaje natural, el reconocimiento de imágenes, el reconocimiento del habla y la creación de imágenes.
Algoritmos de bosque aleatorio: predicen un valor o una categoría combinando los resultados de varios árboles de decisión.

2. Machine learning no supervisado

Los algoritmos de aprendizaje no supervisado, como Apriori, los modelos de mezclas gaussianas (GMM) y el análisis de componentes principales (PCA), extraen conclusiones de conjuntos de datos no etiquetados, lo que facilita el análisis exploratorio de datos y permite el reconocimiento de patrones y el modelado predictivo.

El método de aprendizaje no supervisado más común es el análisis de conglomerados, que utiliza algoritmos de agrupación para categorizar los puntos de datos en función de la similitud de valores (como en la segmentación de clientes o la detección de anomalías). Los algoritmos de asociación permiten a los científicos de datos identificar asociaciones entre objetos de datos dentro de grandes bases de datos, facilitando la visualización de los datos y la reducción de la dimensionalidad.

K-medias: asigna los puntos de datos en k grupos, donde los puntos de datos más cercanos a un centroide determinado se agrupan en la misma categoría y K representa los grupos en función de su tamaño y nivel de granularidad. La agrupación K-medias se utiliza habitualmente para la segmentación del mercado, la agrupación de documentos, la segmentación de imágenes y la compresión de imágenes.
Agrupación jerárquica: describe un conjunto de técnicas de agrupación, entre las que se incluyen la agrupación aglomerativa (en la que los puntos de datos se aíslan inicialmente en grupos y luego se fusionan de forma iterativa en función de la similitud hasta que queda un clúster) y la agrupación divisiva (en la que un único clúster de datos se divide en función de las diferencias entre los puntos de datos).
Agrupación probabilística—ayuda a resolver problemas de estimación de la densidad o de agrupación "suave" agrupando los puntos de datos en función de la probabilidad de que pertenezcan a una determinada distribución.

Los modelos de ML no supervisados suelen estar detrás de los sistemas de recomendación del tipo "los clientes que adquirieron esto también compraron...".

3. Machine learning autosupervisado

El aprendizaje autosupervisado (SSL) permite a los modelos entrenarse con datos no etiquetados, en lugar de necesitar conjuntos masivos de datos anotados y/o etiquetados. Los algoritmos SSL, también llamados algoritmos de aprendizaje predictivo o de pretexto, aprenden una parte de la entrada a partir de otra, generando automáticamente etiquetas y transformando los problemas no supervisados en supervisados. Estos algoritmos son especialmente útiles para trabajos como la computer vision y el PLN, donde el volumen de datos de entrenamiento etiquetados necesarios para entrenar modelos puede ser excepcionalmente grande (a veces prohibitivo).

4. Aprendizaje por refuerzo

El aprendizaje por refuerzo, también llamado aprendizaje por refuerzo a partir del feedback humano (RLHF), es un tipo de programación dinámica que entrena algoritmos mediante un sistema de recompensa y castigo. Para implementar el aprendizaje por refuerzo, un agente realiza acciones en un entorno específico para alcanzar un objetivo predeterminado. El agente es recompensado o penalizado por sus acciones en función de una métrica establecida (normalmente puntos), lo que anima al agente a continuar con las buenas prácticas y desechar las malas. Con la repetición, el agente aprende las mejores estrategias.

Los algoritmos de aprendizaje por refuerzo son habituales en el desarrollo de videojuegos y se utilizan con frecuencia para enseñar a los robots a reproducir tareas humanas.

5. Aprendizaje semisupervisado

El quinto tipo de técnica de machine learning ofrece una combinación entre el aprendizaje supervisado y el no supervisado.

Los algoritmos de aprendizaje semisupervisado se entrenan con un pequeño conjunto de datos etiquetados y un gran conjunto de datos sin etiquetar, de forma que los datos etiquetados guían el proceso de aprendizaje para el mayor conjunto de datos sin etiquetar. Un modelo de aprendizaje semisupervisado podría utilizar el aprendizaje no supervisado para identificar grupos de datos y, a continuación, utilizar el aprendizaje supervisado para etiquetar los grupos.

Las redes generativas adversarias (RGA) (herramientas de deep learning que genera datos no etiquetados entrenando dos redes neuronales) son un ejemplo de machine learning semisupervisado.

Independientemente de su tipo, los modelos de ML pueden extraer conocimientos de los datos empresariales, pero su vulnerabilidad a los sesgos humanos y de los datos hace que las prácticas de IA responsable sean un imperativo organizativo.

Gestione una amplia gama de modelos de machine learning con watsonx.ai

Casi todo el mundo, desde los desarrolladores hasta los usuarios y los reguladores, se relaciona en algún momento con las aplicaciones del machine learning, tanto si interactúan directamente con la tecnología de IA como si no. Y la adopción de la tecnología de ML no hace más que acelerarse. El mercado mundial del machine learning se valoró en 19 000 millones de USD en 2022 y se espera que alcance los 188 000 millones de USD en 2030 (una CAGR de más del 37 %).

La escala de la adopción del ML y su creciente impacto empresarial hacen que la comprensión de las tecnologías de IA y ML sea un compromiso continuo y de vital importancia, que requiere una supervisión vigilante y ajustes oportunos a medida que evolucionan las tecnologías. Con el estudio de IA de IBM watsonx.ai, los desarrolladores pueden gestionar algoritmos y procesos de ML con facilidad.

IBM watsonx.ai, parte del portfolio de productos de IA IBM watsonx, combina nuevas capacidades de IA generativa y un estudio empresarial de última generación para ayudar a los AI Builders a entrenar, validar, ajustar e implementar modelos de IA con una fracción de los datos, en una fracción del tiempo. Watsonx.ai ofrece a los equipos características avanzadas de generación y clasificación de datos que ayudan a las empresas a aprovechar el conocimiento de los datos para obtener un rendimiento óptimo de la IA en el mundo real.

En la era de la proliferación de datos, la IA y el machine learning son tan integrales para las operaciones empresariales cotidianas como lo son para la innovación tecnológica y la competencia empresarial. Pero como nuevos pilares de una sociedad moderna, también representan una oportunidad para diversificar las infraestructuras informáticas de las empresas y crear tecnologías que funcionen en beneficio de las empresas y de las personas que dependen de ellas.

Ciencia de datos y MLOps para líderes de datos

Únase a otros líderes para impulsar los tres pilares esenciales del MLOps y la IA fiable: confianza en los datos, confianza en los modelos y confianza en los procesos.

Recursos

Amplíe sus conocimientos de ML

Aprenda los conceptos fundamentales y desarrolle sus habilidades con laboratorios prácticos, cursos, proyectos guiados, pruebas y mucho más.

Desbloquee el poder de la IA generativa + ML

Aprenda a incorporar con confianza la IA generativa y el machine learning a su negocio.

Explicación del machine learning

Techsplainers de IBM desglosa los fundamentos del machine learning, desde los conceptos clave hasta los casos de uso del mundo real. Los episodios claros y rápidos le ayudan a aprender los fundamentos rápidamente.

Ponga la IA a trabajar: cómo impulsar el ROI con la IA generativa

¿Quiere obtener un mayor rendimiento de sus inversiones en IA? Descubra cómo escalar la IA generativa en áreas clave impulsa el cambio ayudando a sus mentes más brillantes a crear y ofrecer nuevas soluciones innovadoras.

Cómo elegir el modelo fundacional adecuado

Aprenda a seleccionar el modelo fundacional de IA más adecuado para su caso de uso.

Explore IBM Granite

IBM® Granite es nuestra familia de modelos de IA abiertos, eficaces y de confianza, adaptados para la empresa y optimizados para escalar sus aplicaciones de IA. Explore las opciones de lenguaje, código, series temporales y límites de protección.

Cómo prosperar en la era de la IA con seguridad y confianza

Profundice en los tres elementos cruciales de una estrategia de IA sólida: crear una ventaja competitiva, ampliar la IA en toda la empresa y promover una IA fiable.

Soluciones relacionadas

IBM watsonx.ai

Entrene, valide, ajuste e implemente IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de nueva generación para desarrolladores de IA. Cree aplicaciones de IA en menos tiempo y con menos datos.

Descubra watsonx.ai

Soluciones de inteligencia artificial

Ponga la IA a trabajar en su negocio con la experiencia líder en IA del sector de IBM y junto a su cartera de soluciones.

Explore las soluciones de IA

Consultoría y servicios de IA

Reinvente las operaciones y flujos de trabajo críticos añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Explore los servicios de IA

Dé el siguiente paso

Obtenga acceso único a capacidades que abarcan el ciclo de vida de desarrollo de la IA. Produzca potentes soluciones de IA con interfaces intuitivas, flujos de trabajo y acceso a API y SDK estándar del sector.