¿Qué es el aprendizaje supervisado?

El aprendizaje supervisado, también conocido como aprendizaje automático supervisado, es una subcategoría del aprendizaje automático y la inteligencia artificial. Se define por su uso de conjuntos de datos etiquetados para entrenar algoritmos que clasifiquen datos o predigan resultados con precisión.

A medida que los datos de entrada se introducen en el modelo, este ajusta sus ponderaciones hasta que el modelo se haya adaptado adecuadamente, lo que ocurre como parte del proceso de validación cruzada. El aprendizaje supervisado ayuda a las organizaciones a resolver una variedad de problemas del mundo real a escala, como clasificar el spam en una carpeta separada de la bandeja de entrada. Se puede utilizar para crear modelos de aprendizaje automático de alta precisión.

Por qué la gobernanza de la IA es un imperativo empresarial para escalar la IA empresarial

Conozca los obstáculos para la adopción de la IA, en particular la falta de soluciones de gobernanza y gestión de riesgos.

Contenido relacionado

Regístrese para obtener el informe de IDC

Comience su camino hacia la IA

Aprenda a escalar la IA

Conozca AI Academy

Cómo funciona el aprendizaje supervisado

El aprendizaje supervisado utiliza un conjunto de entrenamiento para enseñar a los modelos a producir el resultado deseado. Este conjunto de datos de entrenamiento incluye entradas y salidas correctas, lo que permite que el modelo aprenda con el tiempo. El algoritmo mide su precisión a través de la función de pérdida, ajustando hasta que el error se haya minimizado lo suficiente.

En la minería de datos, el aprendizaje supervisado puede dividirse en dos tipos de problemas: clasificación y regresión.

La clasificación utiliza un algoritmo para asignar con precisión los datos de prueba en categorías específicas. Reconoce entidades específicas dentro del conjunto de datos e intenta sacar algunas conclusiones sobre cómo deben etiquetarse o definirse esas entidades. Los algoritmos de clasificación más comunes son los clasificadores lineales, las máquinas de vectores de soporte (SVM), los árboles de decisión, el método K de los vecinos más próximos y el bosque aleatorio, que se describen con más detalle a continuación.
La regresión se utiliza para comprender la relación entre variables dependientes e independientes. Se utiliza comúnmente para hacer proyecciones, como los ingresos por ventas de un negocio determinado. La regresión lineal, la regresión logística y la regresión polinomial son algoritmos de regresión populares.

Algoritmos de aprendizaje supervisado

En los procesos supervisados de aprendizaje automático se utilizan varios algoritmos y técnicas de cálculo. A continuación, se presentan breves explicaciones de algunos de los métodos de aprendizaje más utilizados, normalmente calculados mediante el uso de programas como R o Python:

Redes neuronales : principalmente aprovechadas para algoritmos de aprendizaje profundo, las redes neuronales procesan los datos de entrenamiento imitando la interconectividad del cerebro humano a través de capas de nodos. Cada nodo se compone de entradas, ponderaciones, un sesgo (umbral) y una salida. Si ese valor de salida excede un umbral determinado, "dispara" o activa el nodo, y pasa los datos a la siguiente capa de la red. Las redes neuronales aprenden de esta función de mapeo a través de aprendizaje supervisado, cuyo ajuste se basa en la pérdida de función mediante el proceso de descenso de gradiente. Cuando la función de costo es igual o cercana a cero, podemos confiar en la precisión del modelo para arrojar la respuesta correcta.
Naive Bayes: Naive Bayes es un enfoque de clasificación que adopta el principio de independencia condicional de clases del Teorema de Bayes. Esto significa que la presencia de una característica no influye en la presencia de otra en la probabilidad de un resultado dado, y cada predictor tiene un efecto igual en ese resultado. Existen tres tipos de clasificadores Naïve Bayes: Naïve Bayes multinomial, Naïve Bayes Bernoulli y Naïve Bayes gaussiano. Esta técnica se emplea principalmente en la clasificación de textos, la identificación de spam y los sistemas de recomendación.
Regresión lineal: la regresión lineal se utiliza para identificar la relación entre una variable dependiente y una o más variables independientes y, por lo general, se aprovecha para hacer predicciones sobre resultados futuros. Cuando solo hay una variable independiente y una variable dependiente, se conoce como regresión lineal simple. A medida que aumenta el número de variables independientes, se denomina regresión lineal múltiple. Para cada tipo de regresión lineal, se busca trazar una línea de mejor ajuste, la cual se calcula a través del método de mínimos cuadrados. Sin embargo, a diferencia de otros modelos de regresión, esta línea es recta cuando se traza en un gráfico.
Regresión logística : mientras que la regresión lineal se aprovecha cuando las variables dependientes son continuas, la regresión logística se selecciona cuando la variable dependiente es categórica, lo que significa que hay resultados binarios, como "verdadero" o "falso" o "sí" o "no". Si bien ambos modelos de regresión buscan comprender las relaciones entre las entradas de datos, la regresión logística se utiliza principalmente para resolver problemas de clasificación binaria, como la identificación de spam.
Máquinas de vectores de soporte (SVM): una máquina de vectores de soporte es un popular modelo de aprendizaje supervisado desarrollado por Vladimir Vapnik, utilizado tanto para la clasificación de datos como para la regresión. Dicho esto, típicamente se aprovecha para problemas de clasificación, construyendo un hiperplano donde la distancia entre dos clases de puntos de datos está en su máximo. Este hiperplano se conoce como límite de decisión, separando las clases de puntos de datos (por ejemplo, naranjas contra manzanas) a ambos lados del plano.
Vecino más próximo K: también conocido como algoritmo KNN, es un algoritmo no paramétrico que clasifica los puntos de datos en función de su proximidad y asociación con otros datos disponibles. Este algoritmo asume que se pueden encontrar puntos de datos similares cerca unos de otros. Como resultado, busca calcular la distancia entre puntos de datos, generalmente a través de la distancia euclidiana, y luego asigna una categoría basada en la categoría o promedio más frecuente. Su facilidad de uso y su bajo tiempo de cálculo lo convierten en el algoritmo preferido por los científicos de datos, pero, a medida que crece el conjunto de datos de prueba, el tiempo de procesamiento se alarga, lo que lo hace menos atractivo para las tareas de clasificación. KNN se utiliza normalmente para motores de recomendación y reconocimiento de imágenes.
Bosque aleatorio: es otro algoritmo flexible de aprendizaje automático supervisado que se utiliza tanto para fines de clasificación como de regresión. El "bosque" hace referencia a una colección de árboles de decisión no correlacionados, que luego se fusionan para reducir la varianza y crear predicciones de datos más precisas.

Aprendizaje no supervisado, supervisado y semisupervisado

El aprendizaje automático no supervisado y el aprendizaje automático supervisado se analizan juntos con frecuencia. A diferencia del aprendizaje supervisado, el aprendizaje no supervisado utiliza datos sin etiquetar. A partir de esos datos, descubre patrones que ayudan a resolver problemas de agrupamiento o asociación. Esto es particularmente útil cuando los expertos no están seguros de las propiedades comunes dentro de un conjunto de datos. Los algoritmos de agrupamiento comunes son los modelos jerárquico, k-medias y Gaussian Mixture.

El aprendizaje semisupervisado se produce cuando solo se ha etiquetado una parte de los datos de entrada dados. El aprendizaje no supervisado y semisupervisado puede ser una alternativa más atractiva, ya que puede llevar mucho tiempo y ser costoso confiar en la experiencia del dominio para etiquetar los datos adecuadamente para el aprendizaje supervisado.

Para profundizar en las diferencias entre estos enfoques, consulte "Aprendizaje supervisado vs. no supervisado: ¿cuál es la diferencia?"

ejemplos de aprendizaje supervisado

Los modelos de aprendizaje supervisado se pueden utilizar para crear y mejorar una serie de aplicaciones de negocio, incluidas las siguientes:

Reconocimiento de imágenes y objetos: los algoritmos de aprendizaje supervisado se pueden utilizar para localizar, aislar y categorizar objetos fuera de videos o imágenes, lo que los hace útiles cuando se aplican a diversas técnicas de visión artificial y análisis de imágenes.
Analytics predictivo: un caso de uso generalizado para los modelos de aprendizaje supervisado es la creación de sistemas de analytics predictivo para proporcionar insights profundos sobre varios puntos de datos de negocio. Esto permite a las empresas anticipar ciertos resultados en función de una variable de salida determinada, lo que ayuda a los líderes de negocio a justificar decisiones o cambiar en beneficio de la organización.
Análisis de sentimiento del cliente: mediante algoritmos de aprendizaje automático supervisados, las organizaciones pueden extraer y clasificar información importante a partir de grandes volúmenes de datos, como el contexto, la emoción y la intención, con muy poca intervención humana. Esto puede ser increíblemente útil para comprender mejor las interacciones con los clientes y puede utilizarse para mejorar los esfuerzos de interacción con la marca.
Detección de spam: la detección de spam es otro ejemplo de modelo de aprendizaje supervisado. Mediante algoritmos de clasificación supervisados, las organizaciones pueden entrenar bases de datos para reconocer patrones o anomalías en nuevos datos para organizar de manera efectiva el spam y la correspondencia no relacionada con el spam.

Desafíos del aprendizaje supervisado

Aunque el aprendizaje supervisado puede ofrecer ventajas a las empresas, como insights profundos de datos y una automatización mejorada, existen algunos desafíos al construir modelos sustentables de aprendizaje supervisado. Los siguientes son algunos de estos desafíos:

Los modelos de aprendizaje supervisado pueden requerir ciertos niveles de experiencia para estructurarlos con precisión.
El entrenamiento de modelos de aprendizaje supervisado puede requerir mucho tiempo.
Los conjuntos de datos pueden tener una mayor probabilidad de error humano, lo que da como resultado que los algoritmos aprendan incorrectamente.
A diferencia de los modelos de aprendizaje no supervisado, el aprendizaje supervisado no puede agrupar ni clasificar los datos por sí solo.

Soluciones relacionadas

IBM watsonx Studio

Cree y amplíe la IA de confianza en cualquier nube. Automatice el ciclo de vida de la IA para ModelOps.

Conozca IBM Watson Studio

IBM Cloud Pak para datos

Conecte los datos adecuados, en el momento adecuado, con las personas adecuadas en cualquier lugar.

Explore Cloud Pak for Data

Soluciones de IBM Cloud

Híbrido. Abierto. Resiliente. Su plataforma y socio para la transformación digital.

Explore soluciones en la nube

Recursos

Descubra Granite LLM de IBM

Granite es la serie insignia de modelos fundacionales LLM de IBM basada en arquitectura transformadora de solo descodificador. Los modelos de lenguaje Granite se entrenan con datos empresariales confiables que abarcan áreas de Internet, académicas, de código, legales y financieras.

Aprendizaje práctico y gratuito para tecnologías generativas de IA

Aprenda los conceptos fundamentales de la IA y la IA generativa, incluida la ingeniería rápida, los modelos de lenguaje de gran tamaño y los mejores proyectos de código abierto.

Aprendizaje supervisado vs. no supervisado: ¿Cuál es la diferencia?

En este artículo, exploraremos los conceptos básicos de dos enfoques de ciencia de datos: supervisado y no supervisado.

Modelos de aprendizaje supervisado

Explore algunos enfoques de aprendizaje supervisado, como las máquinas de vectores soporte y los clasificadores probabilísticos.

Dé el siguiente paso

Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM® watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Cree aplicaciones de IA en menos tiempo y con menos datos.

Explore watsonx.ai

Reserve una demostración en vivo