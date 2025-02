A diferencia del supervisado, el aprendizaje no supervisado utiliza datos no etiquetados. A partir de esos datos, el algoritmo descubre patrones que ayudan a resolver problemas de agrupación o asociación. Esto es particularmente útil cuando los expertos en la materia no están seguros de las propiedades comunes dentro de un conjunto de datos. Los algoritmos de agrupación más comunes son los jerárquicos, K-medias, los modelos de mezcla gaussiana y los métodos de reducción de la dimensionalidad como PCA y t-SNE.

Agrupación: estos algoritmos pueden identificar patrones en datos para poder agruparlos. Los algoritmos pueden ayudar a los científicos de datos al identificar diferencias entre los datos que los humanos han pasado por alto.

Agrupación jerárquica: agrupa los datos en un árbol de clústeres8. La agrupación jerárquica comienza tratando cada punto de datos como un clúster independiente. A continuación, ejecuta repetidamente estos pasos: 1) identificar los dos clústeres que pueden estar más próximos entre sí, y 2) fusionar los dos clústeres comparables máximos. Estos pasos continúan hasta que se fusionan todos los clústeres.

Agrupación de k-medias: identifica grupos dentro de datos sin etiquetas9 en clústeres diferentes al localizar grupos de datos que sean similares entre sí. El nombre "K-medias" proviene de los centroides que utiliza para definir los clústeres. Un punto se asigna a un clúster en particular si está más cerca del centroide de ese clúster que cualquier otro centroide.

Algoritmos de aprendizaje semisupervisados

En este caso, el aprendizaje se produce cuando solo se ha etiquetado una parte de los datos de entrada dados, lo que le da al algoritmo una cierta «ventaja». Este enfoque puede combinar lo mejor de ambos mundos10: la mejora de la precisión asociada con el machine learning supervisado y la capacidad de utilizar datos rentables sin etiquetar, como en el caso del machine learning no supervisado.

Algoritmos de refuerzo



En este caso, los algoritmos se entrenan tal como aprenden los humanos, a través de recompensas y penalizaciones, que son medidas y rastreadas por un agente de aprendizaje por refuerzo11 que tiene una comprensión general de la probabilidad de subir o bajar la puntuación con éxito. A través de la prueba y el error, el agente aprende a tomar medidas que conducen a los resultados más favorables con el tiempo. El aprendizaje de refuerzo suele utilizarse12 en la gestión de recursos, robótica y videojuegos.