Cinco tipos de aprendizaje automático que debe conocer

Autor

Staff Writer, Automation & ITOps

IBM Think

Las tecnologías de aprendizaje automático (ML) pueden impulsar la toma de decisiones en prácticamente todas las industrias, desde la atención médica hasta Recursos Humanos y finanzas y en innumerables casos de uso, como visión artificial, modelos de lenguaje de gran tamaño (LLM), reconocimiento de voz, automóviles autónomos y más.

No obstante, la creciente influencia del ML no está exenta de complicaciones. Los conjuntos de datos de validación y entrenamiento que sustentan la tecnología ML a menudo son agregados por seres humanos, y los humanos son susceptibles a sesgos y propensos a errores. Incluso en los casos en que un modelo de ML no está sesgado ni tiene defectos en sí mismo, implementarlo en el contexto incorrecto puede producir errores con consecuencias perjudiciales no deseadas.

Es por eso que diversificar el uso empresarial de la IA y el ML puede resultar invaluable para mantener un beneficio competitivo. Cada tipo y subtipo de algoritmo de ML tiene beneficios y capacidades únicos que los equipos pueden aprovechar para diferentes tareas. A continuación, analizaremos los cinco tipos principales y sus aplicaciones.

Las últimas tendencias de IA presentadas por expertos

Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .

¿Qué es el aprendizaje automático?

El ML es un subconjunto de la informática, la ciencia de datos y la inteligencia artificial (IA) que permite a los sistemas aprender y mejorar a partir de los datos sin intervenciones adicionales de programación.

En lugar de emplear instrucciones explícitas para la optimización del rendimiento, los modelos de ML se basan en algoritmos y modelos estadísticos que implementan tareas basadas en patrones e inferencias de datos. En otras palabras, el ML aprovecha los datos de entrada para predecir los resultados, lo que actualiza continuamente los resultados a medida que hay nuevos datos disponibles.

En los sitios web de ventas minoristas, por ejemplo, los algoritmos de aprendizaje automático influyen en las decisiones de compra de los consumidores al hacer recomendaciones basadas en el historial de compras. Las plataformas de comercio electrónico de muchos minoristas, incluidas las de IBM, Amazon, Google, Meta y Netflix, dependen de Neural Networks artificiales (ANN) para ofrecer recomendaciones personalizadas. Y los minoristas suelen aprovechar los datos de los chatbots y asistentes virtuales, junto con el ML y la tecnología de procesamiento de lenguaje natural (PLN), para automatizar las experiencias de compra de los usuarios.

Mixture of Experts | 12 de diciembre, episodio 85

Decodificación de la IA: Resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el revuelo de la IA para ofrecerle las últimas noticias e insights al respecto.

Vea todos los episodios de Mixture of Experts

Tipos de aprendizaje automático

Los algoritmos de aprendizaje automático se dividen en cinco amplias categorías: aprendizaje supervisado, aprendizaje no supervisado, aprendizaje semisupervisado, aprendizaje autosupervisado y aprendizaje por refuerzo.

1. Machine learning supervisado

El machine learning supervisado es un tipo de machine learning en el que se entrena al modelo en un conjunto de datos etiquetado (es decir, se conoce la variable objetivo o resultado). Por ejemplo, si los científicos de datos estuvieran creando un modelo para el forecasting de tornados, las variables de entrada podrían incluir fecha, ubicación, temperatura, patrones de flujo de viento y más, y los resultados serían la actividad real de tornados registrada para esos días.

El aprendizaje supervisado se utiliza comúnmente para evaluación de riesgos, reconocimiento de imágenes, análisis predictivos y detección de fraudes, y comprende varios tipos de algoritmos.

Algoritmos de regresión: predicen valores de salida al identificar relaciones lineales entre valores reales o continuos (por ejemplo, temperatura, salario). Los algoritmos de regresión incluyen regresión lineal, bosque aleatorio (random forest) y aumento de gradiente, así como otros subtipos.
Algoritmos de clasificación: predicen variables de salida categóricas (por ejemplo, “basura” o “no basura”) al etiquetar piezas de datos de entrada. Los algoritmos de clasificación incluyen regresión logística, k vecinos más próximos y máquinas de vectores de soporte (SVM), entre otros.
Clasificadores Naïve Bayes: permiten tareas de clasificación para grandes conjuntos de datos. También forman parte de una familia de algoritmos de aprendizaje generativo que modelan la distribución de entrada de una clase o categoría determinada. Los algoritmos Naïve Bayes incluyen árboles de decisión, que en realidad pueden adaptarse tanto a algoritmos de regresión como de clasificación.
Neural networks: simulan la forma en que funciona el cerebro humano, con una gran cantidad de nodos de procesamiento vinculados que pueden facilitar procesos como la traducción del lenguaje natural, el reconocimiento de imágenes, el reconocimiento de voz y la creación de imágenes.
Algoritmos de bosque aleatorio: predicen un valor o una categoría combinando los resultados de varios decision trees.

2. Machine learning no supervisado

Los algoritmos de aprendizaje no supervisado, como Apriori, los modelos de mezcla gaussiana (GMM) y el análisis de componentes principales (PCA), extraen inferencias de conjuntos de datos no etiquetados, lo que facilita el análisis exploratorio de datos y permite el reconocimiento de patrones y el modelado predictivo.

El método de aprendizaje no supervisado más común es el análisis de clústeres, que utiliza algoritmos de agrupamiento para categorizar puntos de datos según la similitud del valor (como en la segmentación de clientes o detección de anomalías). Los algoritmos de asociación permiten a los científicos de datos identificar asociaciones entre objetos de datos dentro de grandes bases de datos, lo que facilita la visualización de datos y la reducción de la dimensionalidad.

Clustering de K-means: asigna puntos de datos en grupos K, donde los puntos de datos más cercanos a un centroide determinado se agrupan en la misma categoría y K representa clústeres en función de su tamaño y nivel de detalle. La agrupación en clústeres K-means se emplea comúnmente para la segmentación de mercados, la agrupación de documentos, la segmentación de imágenes y la compresión de imágenes.
Agrupación jerárquica: describe un conjunto de técnicas de agrupación, incluida la agrupación aglomeradora, en la que los puntos de datos se aíslan inicialmente en grupos y luego se fusionan de forma iterativa en función de la similitud hasta que queda un grupo, y la agrupación divisiva, en la que un único grupo de datos se divide en función de las diferencias entre los puntos de datos.
Agrupación probabilística: ayuda a resolver los problemas de estimación de densidad o agrupamiento “suave” agrupando puntos de datos en función de la probabilidad de que pertenezcan a una distribución en particular.

Los modelos de ML no supervisados suelen estar detrás de los sistemas de recomendación del tipo “los clientes que compraron esto también compraron...”.

3. Machine learning autosupervisado

El aprendizaje autosupervisado (SSL) permite que los modelos se entrenen a sí mismos con datos sin etiquetar, en lugar de requerir conjuntos de datos masivos anotados o etiquetados. Los algoritmos de SSL, también llamados algoritmos de aprendizaje predictivo o de pretexto, aprenden una parte de la entrada de otra parte, generando automáticamente etiquetas y transformando problemas no supervisados en supervisados. Estos algoritmos son especialmente útiles para trabajos como la visión artificial y el NLP, donde el volumen de datos de entrenamiento etiquetados necesarios para entrenar modelos puede ser excepcionalmente grande (a veces prohibitivo).

4. Aprendizaje por refuerzo

El aprendizaje por refuerzo, también llamado aprendizaje por refuerzo a partir del feedback humano (RLHF), es un tipo de programación dinámica que entrena algoritmos mediante un sistema de recompensa y castigo. Para desplegar el aprendizaje por refuerzo, un agente toma acciones en un entorno específico para alcanzar una meta predeterminada. El agente es recompensado o penalizado por sus acciones en función de una métrica establecida (normalmente puntos), alentando al agente a continuar con las buenas prácticas y descartar las malas. Con la repetición, el agente aprende las mejores estrategias.

Los algoritmos de aprendizaje por refuerzo son comunes en el desarrollo de videojuegos y se utilizan con frecuencia para enseñar a los robots a replicar tareas humanas.

5. Aprendizaje semisupervisado

El quinto tipo de técnica de aprendizaje automático ofrece una combinación entre aprendizaje supervisado y no supervisado.

Los algoritmos de aprendizaje semisupervisado se entrenan con un pequeño conjunto de datos etiquetados y con un gran conjunto de datos sin etiquetar, y los datos etiquetados guían el proceso de aprendizaje para el cuerpo más grande de datos sin etiquetar. Un modelo de aprendizaje semisupervisado podría usar el aprendizaje no supervisado para identificar grupos de datos y luego usar el aprendizaje supervisado para etiquetar los grupos.

Las redes generativas adversariales (GANs): una herramienta de aprendizaje profundo que genera datos sin etiquetar mediante el entrenamiento de dos neural networks, son un ejemplo de aprendizaje automático semisupervisado.

Independientemente del tipo, los modelos de aprendizaje automático (ML) pueden obtener información de los datos empresariales, pero su vulnerabilidad al sesgo humano/de datos hace que las prácticas de IA responsables sean un imperativo organizacional.

Gestiona una variedad de modelos de machine learning con watsonx.ai

Casi todos, desde desarrolladores hasta usuarios y reguladores, interactúan con aplicaciones de machine learning en algún momento, ya sea que interactúen directamente con la tecnología de IA o no. Y la adopción de la tecnología de machine learning solo se está acelerando. El mercado global de machine learning se valoró en 19,000 millones de dólares en 2022 y se espera que alcance los 188,000 millones de dólares para 2030 (una CAGR de más del 37%).

La escala de adopción del ML y su creciente impacto empresarial hacen que la comprensión de las tecnologías de IA y ML sea un compromiso continuo y de vital importancia, que requiere una supervisión vigilante y ajustes oportunos a medida que evolucionan las tecnologías. Con IBM watsonx.ai™ AI studio, los desarrolladores pueden gestionar algoritmos y procesos de ML con facilidad.

IBM watsonx.ai—parte de la cartera de productos de IA watsonx™ de IBM—combina nuevas capacidades de IA generativa y un estudio empresarial de próxima generación para ayudar a los creadores de IA a entrenar, validar, ajustar e desplegar modelos de IA con una fracción de los datos, en una fracción del tiempo. Watsonx.ai ofrece a los equipos funciones avanzadas de generación y clasificación de datos que ayudan a las empresas a aprovechar insights de datos para lograr un rendimiento óptimo de IA en el mundo real.

En la era de la proliferación de los datos, la IA y el aprendizaje automático son tan esenciales para las operaciones comerciales diarias como lo son para la innovación tecnológica y la competencia empresarial. Pero como nuevos pilares de una sociedad moderna, también representan una oportunidad para diversificar las infraestructuras de TI empresariales y crear tecnologías que funcionen en beneficio de las empresas y de las personas que dependen de ellas.

Ciencia de datos y MLOps para líderes de datos

Una fuerzas con otros líderes para impulsar los tres pilares esenciales de MLOps y la IA confiable: confianza en los datos, confianza en los modelos y confianza en los procesos.

Recursos

Amplíe sus conocimientos de aprendizaje automático (ML)

Aprenda los conceptos fundamentales y construya sus habilidades con laboratorios prácticos, cursos, proyectos guiados, ensayos y mucho más.

Desbloquee el poder de la IA generativa + ML

Aprenda a incorporar con confianza la IA generativa y el aprendizaje automático en su negocio.

Explicación del machine learning

Techsplainers de IBM desglosa los fundamentos del machine learning, desde conceptos clave hasta casos de uso del mundo real. Los episodios claros y rápidos le ayudan a aprender los fundamentos rápidamente.

Ponga la IA a trabajar: Impulso del retorno de la inversión (ROI) con IA generativa

¿Quiere rentabilizar mejor sus inversiones en IA? Descubra cómo la IA generativa escalable en áreas clave impulsa el cambio ayudando a sus mejores mentes a crear y ofrecer nuevas soluciones innovadoras.

Cómo elegir el modelo fundacional adecuado

Aprenda a seleccionar el modelo fundacional de IA más adecuado para su caso de uso.

Explorar IBM Granite

IBM Granite es nuestra familia de modelos de IA abiertos, de alto rendimiento y confiables, diseñados para empresas y optimizados para escalar sus aplicaciones de IA. Explore opciones de lenguaje, código, series de tiempo y medidas de protección.

Cómo prosperar en esta nueva era de la IA con confianza y seguridad

Indague en los 3 elementos críticos de una estrategia sólida de IA: crear una ventaja competitiva, escalar la IA en todo el negocio y avanzar en la IA confiable.

Soluciones relacionadas

IBM watsonx.ai

Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Diseñe aplicaciones de IA en menos tiempo y con menos datos.

Descubra watsonx.ai

Soluciones de inteligencia artificial

Ponga la IA a trabajar en su negocio con la experiencia en IA líder en la industria y la cartera de soluciones de IBM a su lado.

Explore las soluciones de IA

Consultoría y servicios de IA

Reinvente los flujos de trabajo y las operaciones críticas añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Conozca los servicios de IA

Dé el siguiente paso

Obtenga acceso único a capacidades que abarcan el ciclo de vida del desarrollo de IA. Produzca potentes soluciones de IA con interfaces fáciles de usar, flujos de trabajo y acceso a API y SDK estándar de la industria.