El aprendizaje supervisado, también conocido como Machine Learning supervisado, es una subcategoría del Machine Learning y la inteligencia artificial. Se define por el uso de conjuntos de datos etiquetados para entrenar algoritmos que clasifiquen datos o predigan resultados de forma precisa. A medida que los datos se introducen en el modelo, este ajusta sus ponderaciones hasta que dicho modelo se haya ajustado adecuadamente, lo que ocurre como parte del proceso de validación cruzada. El aprendizaje supervisado permite a las organizaciones resolver una amplia variedad de problemas del mundo real a escala como, por ejemplo, la clasificación de spam en una carpeta distinta de la bandeja de entrada.
Regresión lineal
Regresión logística
Ciencia de datos
El aprendizaje supervisado utiliza una serie de capacitaciones para enseñar a los modelos a producir el resultado deseado. Este conjunto de datos incluye datos de entrada y resultados correctos, que permiten que el modelo aprenda con el tiempo. El algoritmo mide su precisión a través de la función de pérdida, ajustándose hasta que el error se haya minimizado lo suficiente.
El aprendizaje supervisado puede clasificarse en dos tipos de problemas durante la minería de datos: la clasificación y la regresión.
Al aprovecharse principalmente para algoritmos de deep learning, las redes neuronales procesan datos de entrenamiento imitando la interconectividad del cerebro humano a través de capas de nodos. Cada nodo se compone de entradas, pesos, un sesgo (o umbral) y una salida. Si esa salida excede un umbral dado, "dispara" (o activa) el nodo, pasando datos a la siguiente capa en la red. Las redes neuronales aprenden esta función de mapeo a través del aprendizaje supervisado, ajustándose en función de la función de pérdida a través del proceso de descenso de gradiente. Cuando la función de costo es igual o cercana a cero, podemos confiar en la precisión del modelo para obtener la respuesta correcta.
El clasificador bayesiano ingenuo es un enfoque de clasificación que adopta el principio de independencia condicional de clase del Teorema de Bayes. Esto significa que la presencia de una característica no afecta la presencia de otra en la probabilidad de un resultado dado, y cada predictor tiene el mismo efecto en ese resultado. Hay tres tipos de clasificadores bayesianos ingenuos: multinominal, de Bernoulli y Gaussiano. Esta técnica se utiliza principalmente en la clasificación de texto, la identificación de spam y los sistemas de recomendación.
La regresión lineal se utiliza para identificar la relación entre una variable dependiente y una o más variables independientes, y normalmente se aprovecha para hacer predicciones sobre resultados futuros. Cuando solo hay una variable independiente y una variable dependiente, se conoce como regresión lineal simple. A medida que aumenta el número de variables independientes, se denomina regresión lineal múltiple. Para cada tipo de regresión lineal, esta clasificación busca trazar una línea de mejor ajuste, que se calcula mediante el método de mínimos cuadrados. Sin embargo, a diferencia de otros modelos de regresión, esta línea es recta cuando se traza en un gráfico.
Mientras que la regresión lineal se utiliza cuando las variables dependientes son continuas, la regresión logística se selecciona cuando la variable dependiente es categórica, lo que significa que tienen resultados binarios, como "verdadero" y "falso" o "sí" y "no". Si bien ambos modelos de regresión buscan comprender las relaciones entre las entradas de datos, la regresión logística se utiliza principalmente para resolver problemas de clasificación binaria, como la identificación de spam.
Una máquina de vectores de soporte es un popular modelo de aprendizaje supervisado desarrollado por Vladimir Vapnik, que se utiliza tanto para la clasificación como para la regresión de datos. Dicho esto, generalmente se aprovecha para problemas de clasificación, construyendo un hiperplano donde la distancia entre dos clases de puntos de datos es máxima. Este hiperplano se conoce como el límite de decisión, que separa las clases de puntos de datos (por ejemplo, naranjas vs. manzanas) en ambos lados del plano.
K- vecino más próximo (K-nearest neighbor o KNN): El K- nearest neighbor, también conocido como algoritmo KNN, es un algoritmo no paramétrico que clasifica puntos de datos en función de su proximidad y asociación con otros datos disponibles. Este algoritmo asume que se pueden encontrar puntos de datos similares cerca unos de otros. Como resultado, busca calcular la distancia entre puntos de datos, generalmente a través de la distancia euclidiana, y luego asigna una categoría basada en la categoría o promedio más frecuente.
Su facilidad de uso y su bajo tiempo de cálculo lo convierten en el algoritmo preferido por los científicos de datos, pero a medida que crece el conjunto de datos de prueba, el tiempo de procesamiento se alarga, haciéndolo menos atractivo para las tareas de clasificación. KNN se utiliza normalmente para motores de recomendación y reconocimiento de imágenes.
El bosque aleatorio es otro algoritmo de aprendizaje automático supervisado flexible que se utiliza tanto para fines de clasificación como de regresión. El "bosque" hace referencia a una colección de árboles de decisión no correlacionados, que luego se fusionan para reducir la varianza y crear predicciones de datos más precisas.
El aprendizaje no supervisado y el aprendizaje supervisado con frecuencia caen dentro de la misma discusión. A diferencia del aprendizaje supervisado, el aprendizaje no supervisado utiliza datos sin etiquetar. A partir de esos datos, este descubre patrones que ayudan a resolver problemas de agrupación o asociación. Esto es particularmente útil cuando los expertos en la materia no están seguros de las propiedades comunes dentro de un conjunto de datos. Los algoritmos de agrupamiento comunes son los modelos jerárquicos, de k-promedios y de mezcla gaussiana.
El aprendizaje semi-supervisado ocurre cuando solo se ha etiquetado una parte de los datos de entrada determinados. El aprendizaje no supervisado y semi-supervisado puede ser una alternativa más atractiva, ya que puede llevar mucho tiempo y ser costoso confiar en la experiencia del dominio para etiquetar los datos de manera adecuada para el aprendizaje supervisado.
Para obtener más detalles acerca de las diferencias entre estos enfoques, consulte "Aprendizaje supervisado o no supervisado: ¿Cuál es la diferencia?"
Los modelos de aprendizaje supervisado se pueden utilizar para crear y promover una serie de aplicaciones comerciales, incluidas las siguientes:
Aunque el aprendizaje supervisado puede ofrecer ventajas a las empresas, como conocimientos profundos de datos y automatización mejorada, existen algunos desafíos al crear modelos sostenibles de aprendizaje supervisado. Los siguientes son algunos de estos desafíos:
Los modelos de aprendizaje supervisado pueden ser una solución valiosa para eliminar el trabajo de clasificación manual y para hacer predicciones futuras basadas en datos etiquetados. Sin embargo, formatear sus algoritmos de aprendizaje automático requiere conocimientos y experiencia humanos para evitar el sobreajuste de los modelos de datos.
IBM y sus equipos de ciencia de datos e inteligencia artificial han pasado años perfeccionando el desarrollo y la implementación de modelos de aprendizaje supervisado con numerosos casos de uso empresarial. Con la ayuda de poderosas herramientas como IBM Watson Studio en IBM Cloud Pak for Data, las organizaciones pueden crear modelos de aprendizaje automático altamente escalables independientemente de dónde se encuentren sus datos, todo mientras cuentan con el respaldo del robusto entorno híbrido de múltiples nubes de IBM.
Para obtener más información sobre cómo IBM puede ayudarle a crear sus propios modelos de aprendizaje automático sin supervisión, explore IBM Watson Studio.
Regístrese para obtener un IBMid y crear su cuenta de IBM Cloud.
Cree y escale la IA confiable en cualquier nube. Automatice el ciclo de vida de la IA para ModelOps.
Conecte los datos correctos a las personas correctas en el momento correcto, desde donde sea necesario.
Híbrida. Abierta. Resiliente. Su plataforma y socio para la transformación digital.