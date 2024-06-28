Estos son algunos de los tipos más populares de minería de datos:

Reglas de la asociación: una regla de asociación es un método basado en reglas si/entonces para encontrar relaciones entre variables en un conjunto de datos. La fuerza de las relaciones se mide por el apoyo y la confianza. El nivel de confianza se basa en la frecuencia con la que las sentencias si o entonces son verdaderas. La medida de soporte es la frecuencia con la que se muestran los elementos relacionados en los datos.

Estos métodos se utilizan con frecuencia para el análisis de la cesta de la compra, lo que permite a las empresas comprender mejor las relaciones entre diferentes productos, como los que se compran juntos con frecuencia. Comprender los hábitos de los clientes permite a las empresas desarrollar mejores estrategias de venta cruzada y motores de recomendación.



Clasificación: se predefinen clases de objetos, según las necesidades de la organización, con definiciones de las características que los objetos tienen en común. Esto permite agrupar los datos subyacentes para facilitar su análisis.

Por ejemplo, una empresa de productos de consumo podría examinar su estrategia de cupones revisando los reembolsos de cupones anteriores junto con los datos de ventas, las estadísticas de inventario y cualquier dato de consumo disponible para encontrar la mejor estrategia de campaña futura.



Agrupación: estrechamente relacionada con la clasificación, la agrupación informa de similitudes, pero también proporciona más agrupaciones basadas en diferencias. Las clasificaciones preestablecidas para un fabricante de jabón pueden incluir detergente, lejía, suavizante de ropa, limpiador de pisos y cera para pisos; mientras que la agrupación en clústeres puede crear grupos que incluyen productos de lavandería y cuidado del suelo.



Árbol de decisión: esta técnica de minería de datos utiliza el análisis de clasificación o regresión para clasificar o predecir posibles resultados en función de un conjunto de decisiones. Como sugiere el nombre del árbol de decisión, utiliza una visualización similar a un árbol para representar los posibles resultados de estas decisiones.

Vecino K más cercano (KNN): también conocido como algoritmo KNN, vecino K más cercano es un algoritmo no paramétrico que clasifica los puntos de datos según su proximidad y asociación con otros datos disponibles. Este algoritmo asume que se encuentran puntos de datos similares cerca unos de otros. Como resultado, trata de calcular la distancia entre los puntos de datos, generalmente a través de la distancia euclidiana, y luego asigna una categoría basada en la categoría o media más frecuente.



Redes neuronales: utilizadas principalmente para algoritmos de deep learning, redes neuronales procesan datos por medio de los algoritmos de conectividad. Cada nodo se compone de entradas, ponderaciones, un sesgo y una salida.

Si ese valor de salida supera un umbral determinado, se "dispara" o activa el nodo, pasando los datos a la siguiente capa de la red. Las redes neuronales aprenden esta función de mapeo a través del aprendizaje supervisado, realizando ajustes basados en la función de pérdida a través del proceso de descenso gradiente. Cuando la función de costes es igual o cercana a cero, una organización puede confiar en la precisión del modelo para dar con la respuesta correcta.

Análisis predictivo: Al combinar la minería de datos con técnicas de modelado estadístico y machine learning, se pueden analizar datos históricos utilizando el análisis predictivo para crear modelos gráficos o matemáticos destinados a identificar patrones, prever acontecimientos y resultados futuros e identificar riesgos y oportunidades.



Análisis de regresión: esta técnica descubre relaciones en los datos mediante la predicción de resultados basados en variables predeterminadas. Esto puede incluir árboles de decisión y regresión lineal multivariada. Los resultados pueden priorizarse según la cercanía de la relación para ayudar a determinar qué datos son más o menos significativos. Un ejemplo sería que un fabricante de refrescos estimara el inventario necesario de bebidas antes de la llegada del caluroso verano previsto.