El mundo es cada día más "inteligente" y, para mantenerse al día con las expectativas de los consumidores, las empresas utilizan cada vez más algoritmos de machine learning para facilitar las cosas. Puede verlos en uso en dispositivos de usuarios finales (a través del reconocimiento facial para desbloquear teléfonos inteligentes) o para detectar fraudes con tarjetas de crédito (como activar alertas para compras inusuales).
Dentro de la inteligencia artificial (IA) y el machine learning, existen dos enfoques básicos: el aprendizaje supervisado y el aprendizaje no supervisado. La principal diferencia es que uno utiliza datos etiquetados para ayudar a predecir los resultados, mientras que el otro no. Sin embargo, hay algunos matices entre los dos enfoques y áreas clave en las que uno supera al otro. Esta publicación aclara las diferencias para que pueda elegir el mejor enfoque para su situación.
Boletín de la industria
Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .
Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.
El aprendizaje supervisado es un enfoque de machine learning que se define por el uso de conjuntos de datos etiquetados. Estos conjuntos de datos están diseñados para entrenar o "supervisar" algoritmos para clasificar datos o predecir resultados con precisión. Mediante entradas y salidas etiquetadas, el modelo puede medir su precisión y aprender con el tiempo.
En la minería de datos, el aprendizaje supervisado puede dividirse en dos tipos de problemas: clasificación y regresión.
El aprendizaje no supervisado utiliza algoritmos de machine learning para analizar y agrupar conjuntos de datos no etiquetados. Estos algoritmos descubren patrones ocultos en los datos sin necesidad de intervención humana (por lo tanto, son "no supervisados").
Los modelos de aprendizaje no supervisado se utilizan para tres tareas principales: agrupación en clústeres, asociación y reducción de dimensionalidad:
La principal distinción entre los dos enfoques es el uso de conjuntos de datos etiquetados. En pocas palabras, el aprendizaje supervisado utiliza datos de entrada y salida etiquetados, mientras que un algoritmo de aprendizaje no supervisado no lo hace.
En el aprendizaje supervisado, el algoritmo "aprende" del conjunto de datos de entrenamiento haciendo predicciones iterativas sobre los datos y ajustándose a la respuesta correcta. Si bien los modelos de aprendizaje supervisado tienden a ser más precisos que los modelos de aprendizaje no supervisado, requieren una intervención humana inicial para etiquetar los datos adecuadamente. Por ejemplo, un modelo de aprendizaje supervisado puede predecir cuánto durará su viaje en función de la hora del día, las condiciones climáticas, etc. Pero primero, debe entrenarlo para saber que el clima lluvioso prolonga el tiempo de conducción.
Los modelos de aprendizaje no supervisado, por el contrario, funcionan por sí solos para descubrir la estructura inherente de los datos no etiquetados. Tenga en cuenta que aún requieren cierta intervención humana para validar las variables de salida. Por ejemplo, un modelo de aprendizaje no supervisado puede identificar que los compradores en línea a menudo compran grupos de productos al mismo tiempo. Sin embargo, un analista de datos tendría que validar que tiene sentido que un motor de recomendaciones agrupe la ropa de bebé con un pedido de pañales, puré de manzana y vasitos para sorber.
Elegir el enfoque adecuado para su situación depende de cómo sus científicos de datos evalúen la estructura y el volumen de sus datos, así como el caso de uso. Para tomar su decisión, asegúrese de hacer lo siguiente:
Clasificar big data puede ser un verdadero desafío en el aprendizaje supervisado, pero los resultados son muy precisos y confiables. Por el contrario, el aprendizaje no supervisado puede manejar grandes volúmenes de datos en tiempo real. Pero hay una falta de transparencia sobre cómo se agrupan los datos y un mayor riesgo de resultados inexactos. Aquí es donde entra en juego el aprendizaje semisupervisado.
¿No puede decidir si usar el aprendizaje supervisado o no supervisado? El aprendizaje semisupervisado es un término medio, en el que se utiliza un conjunto de datos de entrenamiento con datos etiquetados y no etiquetados. Es particularmente útil cuando es difícil extraer características relevantes de los datos y cuando tiene un gran volumen de datos.
El aprendizaje semisupervisado es ideal para imágenes médicas, donde una pequeña cantidad de datos de entrenamiento puede conducir a una mejora significativa en la precisión. Por ejemplo, un radiólogo puede etiquetar un pequeño subconjunto de tomografías computarizadas para tumores o enfermedades para que la máquina pueda predecir con mayor precisión qué pacientes podrían requerir más atención médica.
Los modelos de machine learning son una forma poderosa de obtener los insights de datos que mejoran nuestro mundo. Para aprender más sobre los algoritmos específicos que se utilizan con el aprendizaje supervisado y no supervisado, le recomendamos que profundice en los artículos de Learn Hub sobre estas técnicas. También recomendamos consultar la entrada en el blog que va un paso más allá, con una visión detallada del aprendizaje profundo y las redes neuronales.
Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Diseñe aplicaciones de IA en menos tiempo y con menos datos.
Ponga la IA a trabajar en su negocio con la experiencia en IA líder en la industria y la cartera de soluciones de IBM a su lado.
Reinvente los flujos de trabajo y las operaciones críticas añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.