El aprendizaje supervisado, también conocido como machine learning supervisado, es una subcategoría de machine learning y la inteligencia artificial. Se define por su uso de conjuntos de datos etiquetados para entrenar algoritmos que clasifican datos o prevén resultados con precisión. A medida que se introducen datos en el modelo, ajusta sus ponderaciones hasta que el modelo se adapte correctamente, lo que ocurre como parte del proceso de validación cruzada. El aprendizaje supervisado permite a las organizaciones resolver una amplia variedad de problemas del mundo real a escala como, por ejemplo, la clasificación de spam en una carpeta distinta de la bandeja de entrada.
Watson Studio
SPSS Statistics
El aprendizaje supervisado utiliza un conjunto de datos de entrenamiento para enseñar a los modelos a generar la salida deseada. Este conjunto de datos de entrenamiento de datos incluye entradas y salidas correctas que, a su vez, permiten que el modelo aprenda con el tiempo. El algoritmo mide su exactitud a través de la función de pérdida, ajustándose hasta que el error se ha minimizado lo suficiente.
El aprendizaje supervisado se puede separar en dos tipos de problemas en la minería de datos: clasificación y regresión.
En los procesos de machine learning supervisado se utilizan varios algoritmos y técnicas de cálculo. A continuación, se incluyen breves explicaciones de algunos de los métodos de aprendizaje más utilizados, generalmente calculados mediante el uso de programas como R o Python:
Machine learning no supervisado y machine learning supervisado suelen formar parte del mismo debate. A diferencia del aprendizaje supervisado, el aprendizaje no supervisado utiliza datos no etiquetados. A partir de esos datos, descubre patrones que ayudan a resolver problemas de agrupación en clústeres o asociación. Esto resulta especialmente útil cuando los expertos en la materia no están seguros de las propiedades comunes de un conjunto de datos. Los algoritmos de agrupación en clústeres más comunes son los modelos de mezcla gaussiana, k-medias y jerárquicos.
El aprendizaje semisupervisado se produce cuando solo se ha etiquetado una parte de los datos de entrada. El aprendizaje no supervisado y el semisupervisado pueden ser alternativas más atractivas, ya que confiar en la experiencia del dominio para etiquetar bien los datos para el aprendizaje supervisado puede requerir más tiempo y dinero.
Para un análisis más detallado sobre las diferencias entre estos enfoques, consulte el artículo "Supervised vs. Unsupervised Learning: What's the Difference?"
Los modelos de aprendizaje supervisado se pueden utilizar para crear y desarrollar un buen número de aplicaciones empresariales, incluidas:
Si bien el aprendizaje supervisado puede ofrecer ventajas de negocio, como una mayor automatización y la extracción de información más exhaustiva de los datos, se plantean algunos retos a la hora de crear modelos de aprendizaje supervisado sostenibles. Estos son algunos de ellos:
Cree y escale IA fiable en cualquier cloud. Automatice el ciclo de vida de IA para ModelOps.
Conecte los datos correctos con las personas adecuadas, en el momento preciso y en cualquier lugar.
Híbridas. Abiertas. Resilientes. Su plataforma y su socio para la transformación digital.
En este artículo, exploraremos los conceptos básicos de dos enfoques de ciencia de datos: supervisado y no supervisado.
Explore algunos enfoques de aprendizaje supervisado, como las máquinas de vectores de soporte y los clasificadores probabilísticos