El mundo es cada día más "inteligente" y, para estar a la altura de las expectativas de los consumidores, las empresas utilizan cada vez más algoritmos de machine learning para facilitar las cosas. Puede verlos en uso en los dispositivos de los usuarios finales (a través del reconocimiento facial para desbloquear smartphones) o para detectar fraudes con tarjetas de crédito (como activar alertas para compras inusuales).
Dentro de la inteligencia artificial (IA) y el machine learning, existen dos enfoques básicos: el aprendizaje supervisado y el aprendizaje no supervisado. La principal diferencia es que uno utiliza datos etiquetados para ayudar a predecir los resultados, y el otro no. Sin embargo, hay algunos matices entre los dos enfoques y áreas clave en las que uno supera al otro. Esta publicación aclara las diferencias para que pueda elegir el mejor enfoque para su situación.
Boletín del sector
Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.
Su suscripción se enviará en inglés. Encontrará un enlace para darse de baja en cada boletín. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.
El aprendizaje supervisado es un enfoque de machine learning que se define por el uso de conjuntos de datos etiquetados. Estos conjuntos de datos están diseñados para entrenar o "supervisar" algoritmos para clasificar datos o predecir resultados con precisión. Mediante el uso de entradas etiquetadas y outputs, el modelo puede medir su precisión y aprender con el tiempo.
El aprendizaje supervisado se puede dividir en dos tipos de problemas en la minería de datos: clasificación y regresión.
El aprendizaje no supervisado utiliza algoritmos de machine learning para analizar y agrupar conjuntos de datos no etiquetados. Estos algoritmos descubren patrones ocultos en los datos sin necesidad de intervención humana (por lo tanto, son "no supervisados").
Los modelos de aprendizaje no supervisado se utilizan para tres tareas principales: clustering, asociación y reducción de la dimensionalidad:
La principal distinción entre los dos enfoques es el uso de conjuntos de datos etiquetados. En pocas palabras, el aprendizaje supervisado utiliza datos de entrada y salida etiquetados, mientras que un algoritmo de aprendizaje no supervisado no lo hace.
En el aprendizaje supervisado, el algoritmo "aprende" del conjunto de datos de entrenamiento haciendo predicciones iterativas sobre los datos y ajustándose a la respuesta correcta. Aunque los modelos de aprendizaje supervisado tienden a ser más precisos que los modelos de aprendizaje no supervisado, requieren una intervención humana inicial para etiquetar los datos adecuadamente. Por ejemplo, un modelo de aprendizaje supervisado puede predecir la duración de su viaje en función de la hora del día, las condiciones meteorológicas, etc. Pero primero, debe entrenarlo para saber que el clima lluvioso prolonga el tiempo de conducción.
Los modelos de aprendizaje no supervisado, por el contrario, funcionan por sí solos para descubrir la estructura inherente de los datos no etiquetados. Tenga en cuenta que aún requieren cierta intervención humana para validar el output. Por ejemplo, un modelo de aprendizaje no supervisado puede identificar que los compradores en línea suelen comprar grupos de productos al mismo tiempo. Sin embargo, un analista de datos tendría que validar que tiene sentido que un motor de recomendaciones agrupe la ropa de bebé con un pedido de pañales, puré de manzana y vasitos para sorber.
Elegir el enfoque adecuado para su situación depende de cómo sus científicos de datos evalúen la estructura y el volumen de sus datos, así como el caso de uso. Para tomar su decisión, asegúrese de hacer lo siguiente:
Clasificar big data puede ser un verdadero desafío en el aprendizaje supervisado, pero los resultados son muy precisos y fiables. Por el contrario, el aprendizaje no supervisado puede manejar grandes volúmenes de datos en tiempo real. Sin embargo, hay una falta de transparencia sobre cómo se agrupan los datos y un mayor riesgo de resultados inexactos. Aquí es donde entra en juego el aprendizaje semisupervisado.
¿Le cuesta decidirse entre el aprendizaje supervisado y el no supervisado? El aprendizaje semisupervisado es un término medio, en el que se utiliza un conjunto de datos de entrenamiento con datos etiquetados y no etiquetados. Es especialmente útil cuando es difícil extraer características relevantes de los datos y cuando se dispone de un gran volumen de datos.
El aprendizaje semisupervisado es ideal para imágenes médicas, donde una pequeña cantidad de datos de entrenamiento puede conducir a una mejora significativa en la precisión. Por ejemplo, un radiólogo puede etiquetar un pequeño subconjunto de tomografías computarizadas para detectar tumores o enfermedades, de modo que la máquina pueda predecir con mayor precisión qué pacientes podrían requerir más atención médica.
Los modelos de machine learning son una forma potente de obtener los conocimientos de datos que mejoran nuestro mundo. Para obtener más información sobre los algoritmos específicos que se utilizan con el aprendizaje supervisado y no supervisado, le animamos a profundizar en los artículos de Learn Hub sobre estas técnicas. También recomendamos consultar la entrada de blog que va un paso más allá, con una visión detallada del deep learning y las redes neuronales.
Entrene, valide, ajuste e implemente IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de nueva generación para desarrolladores de IA. Cree aplicaciones de IA en menos tiempo y con menos datos.
Ponga la IA a trabajar en su negocio con la experiencia líder en IA del sector de IBM y junto a su cartera de soluciones.
Reinvente las operaciones y flujos de trabajo críticos añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.