¿Qué es el aprendizaje supervisado?
Descubra cómo funciona el aprendizaje supervisado y cómo se puede utilizar para crear modelos de machine learning de alta precisión
Fondo azul con triángulos azul y verde
¿Qué es el aprendizaje supervisado?

El aprendizaje supervisado, también conocido como machine learning supervisado, es una subcategoría de machine learning y la inteligencia artificial. Se define por su uso de conjuntos de datos etiquetados para entrenar algoritmos que clasifican datos o prevén resultados con precisión. A medida que se introducen datos en el modelo, ajusta sus ponderaciones hasta que el modelo se adapte correctamente, lo que ocurre como parte del proceso de validación cruzada. El aprendizaje supervisado permite a las organizaciones resolver una amplia variedad de problemas del mundo real a escala como, por ejemplo, la clasificación de spam en una carpeta distinta de la bandeja de entrada.

Productos destacados

Watson Studio

SPSS Statistics

Cómo funciona el aprendizaje supervisado

El aprendizaje supervisado utiliza un conjunto de datos de entrenamiento para enseñar a los modelos a generar la salida deseada. Este conjunto de datos de entrenamiento de datos incluye entradas y salidas correctas que, a su vez, permiten que el modelo aprenda con el tiempo. El algoritmo mide su exactitud a través de la función de pérdida, ajustándose hasta que el error se ha minimizado lo suficiente.

El aprendizaje supervisado se puede separar en dos tipos de problemas en la minería de datos: clasificación y regresión.

  • La clasificación utiliza un algoritmo para asignar con precisión datos de prueba a categorías específicas. Reconoce entidades específicas dentro del conjunto de datos e intenta sacar algunas conclusiones sobre cómo se deben etiquetar o definir esas entidades. Los algoritmos de clasificación más comunes son los clasificadores lineales, las máquinas de vectores de soporte (SVM, por sus siglas en inglés), los árboles de decisiones, el k vecinos más cercanos y el bosque aleatorio, que se describen con más detalle a continuación.
  • La regresión se utiliza para comprender la relación entre variables dependientes e independientes. Se usa comúnmente para realizar proyecciones, como ingresos por ventas para una empresa determinada. Regresión linealregresión logística y regresión polinómica son algoritmos de regresión populares.
Algoritmos de aprendizaje supervisado

En los procesos de machine learning supervisado se utilizan varios algoritmos y técnicas de cálculo. A continuación, se incluyen breves explicaciones de algunos de los métodos de aprendizaje más utilizados, generalmente calculados mediante el uso de programas como R o Python:

  • Redes neuronales: las redes neuronales, que se utilizan principalmente para los algoritmos de deep learning, procesan los datos de entrenamiento imitando la interconectividad del cerebro humano a través de capas de nodos. Cada nodo está formado por entradas, ponderaciones, un sesgo (o umbral) y una salida. Si ese valor de salida excede un umbral determinado, "dispara" o activa el nodo, pasando datos a la siguiente capa de la red. Las redes neuronales aprenden esta función de correlación a través del aprendizaje supervisado, y se ajustan con base en la función de pérdida a través del proceso de su gradiente descendente. Cuando la función de coste es igual o se acerca a cero, podemos confiar en la precisión del modelo para obtener la respuesta correcta.
  • Naive bayes: Naive bayes es un enfoque de clasificación que adopta el principio de independencia condicional de clase del Teorema de Bayes. Esto significa que la presencia de una característica no afecta a la presencia de otra en la probabilidad de un resultado dado, y cada predictor tiene un efecto igual sobre ese resultado. Hay tres tipos de clasificadores de Naïve Bayes: Naïve Bayes Multinomial, Bernoulli Naïve Bayes y Naïve Bayes gaussiano. Esta técnica se utiliza principalmente en los sistemas de recomendaciones, identificación de correo no deseado y clasificación de texto.
  • Regresión lineal: la regresión lineal se utiliza para identificar la relación entre una variable dependiente y una o más variables independientes y, por lo general, se aprovecha para realizar predicciones sobre resultados futuros. Cuando solo hay una variable independiente y una variable dependiente, se conoce como regresión lineal simple. A medida que aumenta el número de variables independientes, se habla de regresión lineal múltiple. Para cada tipo de regresión lineal, trata de trazar la línea que mejor se ajuste, la cual se calcula mediante el método de mínimos cuadrados. Sin embargo, a diferencia de otros modelos de regresión, esta línea es recta cuando se traza en un grafo.
  • Regresión logística: mientras que la regresión lineal se utiliza cuando las variables dependientes son continuas, la regresión logística se selecciona cuando la variable dependiente es categórica; esto quiere decir que tiene salidas binarias, como "verdadero" y "falso" o "sí" y "no". Ambos modelos de regresión tratan de comprender las relaciones entre las entradas de datos, pero la regresión logística se utiliza principalmente para resolver problemas de clasificación binaria, como la identificación de correo no deseado.
  • Máquinas de vectores de soporte (SVM): una máquina de vectores de soporte es un modelo de aprendizaje supervisado muy popular, desarrollado por Vladimir Vapnik, que se utiliza tanto para la clasificación como para la regresión de datos. Dicho esto, normalmente se utiliza para problemas de clasificación, creando un hiperplano donde la distancia entre dos clases de puntos de datos es la máxima. Este hiperplano se conoce como límite de decisión, que separa las clases de puntos de datos (por ejemplo, naranjas frente a manzanas) a ambos lado del plano.
  • K vecino más cercano (KNN): el algoritmo K vecino más cercano, que también se denomina algoritmo KNN, es un algoritmo no paramétrico que clasifica los puntos de datos en función de su proximidad y asociación con otros datos disponibles. Este algoritmo presupone que los puntos de datos similares se encuentran cerca unos de otros. En consecuencia, busca la distancia entre puntos de datos, generalmente mediante distancia euclídea, y luego asigna una categoría basada en la categoría o promedio más frecuente. Su facilidad de uso y tiempo de cálculo bajo lo convierten en el algoritmo preferido por los científicos de datos, pero a medida que el conjunto de datos de prueba crece, el tiempo de procesamiento se alarga, haciéndolo menos atractivo para las tareas de clasificación. KNN normalmente se usa para motores de recomendaciones y reconocimiento de imágenes.
  • Bosque aleatorio: el bosque aleatorio es otro algoritmo flexible de machine learning supervisado que se utiliza tanto para la clasificación como para la regresión. El "bosque" hace referencia a una colección de árboles de decisiones no correlacionados, que se fusionan para reducir la varianza y crear predicciones de datos más precisas.

 

Aprendizaje no supervisado, supervisado y semisupervisado

Machine learning no supervisado y machine learning supervisado suelen formar parte del mismo debate. A diferencia del aprendizaje supervisado, el aprendizaje no supervisado utiliza datos no etiquetados. A partir de esos datos, descubre patrones que ayudan a resolver problemas de agrupación en clústeres o asociación. Esto resulta especialmente útil cuando los expertos en la materia no están seguros de las propiedades comunes de un conjunto de datos. Los algoritmos de agrupación en clústeres más comunes son los modelos de mezcla gaussiana, k-medias y jerárquicos.

El aprendizaje semisupervisado se produce cuando solo se ha etiquetado una parte de los datos de entrada. El aprendizaje no supervisado y el semisupervisado pueden ser alternativas más atractivas, ya que confiar en la experiencia del dominio para etiquetar bien los datos para el aprendizaje supervisado puede requerir más tiempo y dinero.

Para un análisis más detallado sobre las diferencias entre estos enfoques, consulte el artículo "Supervised vs. Unsupervised Learning: What's the Difference?"

Ejemplos de aprendizaje supervisado

Los modelos de aprendizaje supervisado se pueden utilizar para crear y desarrollar un buen número de aplicaciones empresariales, incluidas:

  • Reconocimiento de imágenes y objetos: los algoritmos de aprendizaje supervisado se pueden utilizar para encontrar, aislar y categorizar objetos de vídeos o imágenes, lo cual resulta muy útil cuando se aplican a varias técnicas de visión computacional y análisis de imágenes.
  • Análisis predictivo: un caso de uso generalizado de los modelos de aprendizaje supervisado es la creación de sistemas de análisis predictivo para proporcionar información más exhaustiva sobre varios puntos de datos de negocio. Esto permite a las empresas anticipar determinados resultados con base en una determinada variable de salida, ayudando a los líderes de la empresa a justificar decisiones o realizar cambios en beneficio de la organización.
  • Análisis de opinión del cliente: mediante el uso de algoritmos de machine learning supervisado, las organizaciones pueden extraer y clasificar información importante de grandes volúmenes de datos, incluidos contexto, emoción e intención, con muy poca intervención humana. Esto puede ser increíblemente útil para comprender mejor las interacciones del cliente y puede usarse para mejorar las iniciativas de compromiso con la marca.
  • Detección de correo no deseado: la detección de correo no deseado es otro ejemplo de modelo de aprendizaje supervisado. Mediante algoritmos de clasificación supervisados, las organizaciones pueden entrenar bases de datos para reconocer patrones o anomalías en nuevos datos para organizar correspondencias relacionadas con correo no deseado de manera efectiva.
Retos del aprendizaje supervisado

Si bien el aprendizaje supervisado puede ofrecer ventajas de negocio, como una mayor automatización y la extracción de información más exhaustiva de los datos, se plantean algunos retos a la hora de crear modelos de aprendizaje supervisado sostenibles. Estos son algunos de ellos:

  • Los modelos de aprendizaje supervisado pueden requerir ciertos niveles de experiencia para estructurar con precisión.
  • El entrenamiento de modelos de aprendizaje supervisado puede consumir mucho tiempo.
  • Los conjuntos de datos pueden presentar una mayor probabilidad de error humano, lo que provoca un aprendizaje incorrecto de los algoritmos.
  • A diferencia de los modelos de aprendizaje no supervisado, el aprendizaje supervisado no puede realizar agrupaciones en clúster ni clasificar datos por sí solo.
Soluciones relacionadas
IBM® Watson Studio

Cree y escale IA fiable en cualquier cloud. Automatice el ciclo de vida de IA para ModelOps.

Explore IBM® Watson Studio
Cloud Pak for Data

Conecte los datos correctos con las personas adecuadas, en el momento preciso y en cualquier lugar.

Explore Cloud Pak for Data
Soluciones IBM Cloud

Híbridas. Abiertas. Resilientes. Su plataforma y su socio para la transformación digital.

Explore las soluciones en cloud
Recursos Aprendizaje supervisado y no supervisado: ¿en qué se diferencian?

En este artículo, exploraremos los conceptos básicos de dos enfoques de ciencia de datos: supervisado y no supervisado.

Modelos de aprendizaje supervisado

Explore algunos enfoques de aprendizaje supervisado, como las máquinas de vectores de soporte y los clasificadores probabilísticos

Dé el siguiente paso

Los modelos de aprendizaje supervisado pueden ser una solución valiosa para eliminar las tareas de clasificación manual y para realizar predicciones futuras basadas en datos etiquetados. Sin embargo, dar formato a los algoritmos de machine learning requiere conocimientos y experiencia para evitar sobreajustar los modelos de datos.IBM y sus equipos de ciencia de datos e IA llevan años perfeccionando el desarrollo y el despliegue de modelos de aprendizaje supervisado con muchos casos de uso empresariales. Con la ayuda de potentes herramientas como IBM Watson Studio en IBM Cloud Pak for Data, las organizaciones pueden crear modelos de machine learning altamente escalables, independientemente de dónde se encuentren sus datos, todo ello con el soporte del sólido entorno multicloud híbrido de IBM.

Explore IBM® Watson Studio