Mi IBM

Iniciar sesión

Suscríbase

¿Qué es el algoritmo Apriori?

9 de junio de 2024

Autores

Joshua Noble

Data Scientist

El algoritmo Apriori es un algoritmo de machine learning no supervisado que se utiliza para el aprendizaje de reglas de asociación. El aprendizaje de reglas de asociación es una técnica de minería de datos que identifica patrones frecuentes, conexiones y dependencias entre distintos grupos de elementos denominados itemsets en los datos. Algunos casos de uso habituales son el pronóstico de enfermedades y los sistemas de recomendación, como el análisis de la cesta de la compra para plataformas de comercio electrónico.

Introducido en 1994 por Rakesh Agrawal y Ramakrishnan Srikant (enlace externo a ibm.com) el nombre, 'Apriori' reconoce el conocimiento previo de conjuntos de elementos frecuentes que el algoritmo utiliza en la computación. El algoritmo ejecuta iteraciones sobre los datos para identificar k-itemsets, es decir, k elementos que frecuentemente ocurren juntos. Luego utiliza los k-itemsets para identificar los conjuntos de elementos k+1. El algoritmo Apriori se basa en la idea de que agregar artículos a un grupo comprado con frecuencia solo puede hacerlo menos frecuente, no más. El proceso se basa en la propiedad Apriori que establece que si un conjunto de elementos aparece con frecuencia en un conjunto de datos, todos sus subconjuntos también deben ser frecuentes. Por el contrario, si un conjunto de elementos se identifica como poco frecuente, todos sus superconjuntos se consideran poco frecuentes.

El algoritmo Apriori es aplicable a todo tipo de conjuntos de datos, especialmente los generados por bases de datos transaccionales, y a menudo se emplea para el análisis de la cesta de la compra para respaldar los sistemas de recomendación. Por ejemplo, cuando se emplea una plataforma de comercio electrónico que vende ropa y zapatos, un comprador busca zapatos y decide agregar un par de zapatos negros formales a su carrito de compras. Luego, el comprador nota que la interfaz recomienda otros artículos para comprar, como calcetines. Una de las formas en que funciona este sistema de recomendación es conocer los patrones de compra de los clientes y asociar artículos que tienen un historial de probable compra conjunta.

Una de los mayores beneficios de emplear el algoritmo Apriori es su sencillez y adaptabilidad. Sin embargo, los algoritmos Apriori no son tan eficientes cuando se manejan grandes conjuntos de datos. El proceso de iteración múltiple de generación de candidatos a itemset puede resultar costoso desde el punto de vista informático y consumir mucha memoria. Apriori suele combinar con otras técnicas para mitigar estos problemas.

La función Apriori está integrada en muchos lenguajes de programación populares, incluidos Python, Java y R, lo que facilita la generación de reglas de asociación de calidad junto con conjuntos de elementos frecuentes en aplicaciones o sistemas existentes.

Funcionamiento del algoritmo Apriori

Cada uno de los pasos clave del algoritmo Apriori busca identificar conjuntos de elementos y todos sus posibles superconjuntos en busca de los más frecuentes para crear las reglas de asociación.

Paso 1: Generación frecuente de conjuntos de elementos

El algoritmo primero identifica los elementos únicos, a veces denominados conjuntos de elementos 1, en el conjunto de datos junto con sus frecuencias. Luego, combina los elementos que aparecen junto con una probabilidad por encima de un umbral especificado en conjuntos de elementos candidatos y filtra los conjuntos de elementos poco frecuentes para reducir el costo de cómputo en pasos adicionales. Este proceso, conocido como minería frecuente de conjuntos de elementos, busca solo conjuntos de objetos con frecuencias significativas.

Paso 2: Expandir y luego podar los conjuntos de elementos

Empleando la propiedad Apriori, el algoritmo combina los itemsets frecuentes para formar itemsets más grandes. Se podan las combinaciones de itemset más grandes con una probabilidad más baja. Esto reduce aún más el espacio de búsqueda y hace que el cálculo sea más eficiente.

Paso 3: Repita los pasos 1 y 2

El algoritmo repite los pasos 1 y 2 hasta que todos los conjuntos de elementos frecuentes que cumplen con el umbral de probabilidad definido se generan exhaustivamente. Cada iteración genera asociaciones más complejas y completas en los conjuntos de elementos.

Una vez que A priori creó los conjuntos de elementos, se puede investigar la fuerza de las asociaciones y relaciones generadas.

Las últimas novedades e insights sobre IA  

Descubra insights y noticias de expertos sobre IA, la nube y mucho más en el boletín semanal Think.

Suscríbase hoy

Medición de conjuntos de elementos

El algoritmo Apriori emplea las métricas de soporte, confianza y elevación para definir sus criterios operativos y mejorar la eficiencia del rendimiento.

Soporte

El apoyo se define como la relación entre el número de veces que un elemento aparece en las transacciones y el número total de transacciones. Esta métrica define así la probabilidad de que se produzca cada elemento individual en las transacciones. La misma lógica puede extender a los itemsets.

$S (I_{A}) = \frac{O c c (I_{A})}{T o t a L T r a N s a c t i o N s}$

donde I_Aes el elemento A, Occ(I_A) es el número de ocurrencias del elemento A y S(I_A) = soporte del elemento A

Por ejemplo, en una tienda de venta minorista, 250 de 2000 transacciones realizadas en un día podrían incluir una compra de manzanas. Usando la fórmula:

$S (I_{A p p L E s}) = \frac{250}{2000} = 0.125$

Este resultado implica que hay un 12.5 % de probabilidades de que se hayan comprado manzanas ese día.

Puede indicar un umbral de soporte mínimo requerido al aplicar el algoritmo Apriori. Esto significa que cualquier elemento o conjunto de elementos con soporte inferior al soporte mínimo especificado se considerará poco frecuente.

Confianza

La métrica de confianza identifica la probabilidad de que los elementos o conjuntos de elementos ocurran juntos en los conjuntos de elementos. Por ejemplo, si hay dos artículos en una transacción, se supone que la existencia de un artículo maneja al otro. El primer elemento o conjunto de elementos es el antecedente y el segundo es el consecuente. Por lo tanto, la confianza se define como la relación entre el número de transacciones que tienen tanto el antecedente como el consecuente, con el número de transacciones que solo tienen el antecedente. Este escenario se representa como:

$C (A, B) = \frac{O c c (A \cap B)}{O c c (A)}$

donde A es el antecedente, B es el consecuente y C(A,B) es la confianza de que A lleva a B.

Ampliando el ejemplo anterior, supongamos que hay 150 transacciones en las que se compraron manzanas y plátanos juntos. La confianza se calcula como:

$C (A p p L E s, B a N a N a s) = \frac{150}{250} = 0.6$

Este resultado indica un 60 % de posibilidades de que una compra de manzanas conduzca a una compra de bananas. Del mismo modo, suponiendo un total de 500 transacciones de plátanos, la confianza de que una compra de plátanos conduce a una compra de manzanas se calcula como:

$C (B a N a N a s, A p p L E s) = \frac{150}{500} = 0.3$

Aquí, solo hay un 30% de posibilidades de que una compra de bananos lleve a una compra de manzanas.

Si bien la confianza es una buena medida de probabilidad, no es una garantía de una asociación clara entre los elementos. El valor de la confianza puede ser alto por otras razones. Por esta razón, se aplica un umbral de confianza mínimo para filtrar asociaciones débilmente probables durante la minería con reglas de asociación.

Lift

El aumento es el factor por el cual la probabilidad de que el elemento A maneje al elemento B es mayor que la probabilidad del elemento A. Esta métrica cuantifica la fuerza de la asociación entre A y B. Puede ayudar a indicar si existe una relación real entre los elementos en el conjunto de elementos o se agrupan por coincidencia.

$L (A, B) = \frac{C (A, B)}{S (A)}$  

Donde L_A,B es el aumento del elemento A que maneja al elemento B, C_A,B es la confianza de que el elemento A maneja al elemento B, S_A es el soporte del elemento A.

Para el ejemplo anterior, podemos ver que:

$L (A p p L E s, B a N a N a s) = \frac{0.6}{0.125} = 4.8$

El valor de elevación alto indica que la probabilidad de que las manzanas y los plátanos se compren juntos es 4.8 veces mayor que la de comprar manzanas solas. Además, se puede observar que:

$L (B a N a N a s, A p p L E s) = \frac{0.3}{0.25} = 1.2$

El valor de elevación bajo aquí indica que una compra de bananos que lleva a una compra de manzanas podría ser solo una coincidencia.

Mixture of Experts | Podcast

Decodificación de la IA: Resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el revuelo de la IA para ofrecerle las últimas noticias e insights al respecto.

Ver los episodios

Combinar Apriori con otras técnicas

En muchos casos, aplicar un enfoque de fuerza bruta (enlace externo a ibm.com) para calcular los umbrales de soporte y confianza para cada regla y luego eliminar las reglas que no alcanzan un umbral puede ser computacionalmente prohibitivo. Para que la aplicación del algoritmo Apriori sea más eficiente, a menudo se combina con otras técnicas de minería de reglas de asociación. Dos de los más comunes son el algoritmo FP-growth (enlace externo a ibm.com) y su variante FP-Max para reducir las limitaciones de memoria y cálculo. El algoritmo Apriori también se puede combinar con decision trees, donde el algoritmo Apriori identifica el conjunto de elementos frecuente, y la técnica de decision trees ayuda a identificar las reglas de asociación.

Otra variante popular del algoritmo Apriori es el conteo dinámico de conjuntos de elementos (DIC) (enlace externo a ibm.com), que comienza a contar los conjuntos de elementos potenciales antes de tiempo, sin esperar a que se registren todas las transacciones. DIC divide el conjunto de datos en segmentos más pequeños y procesa cada segmento por separado. Esta segmentación permite la detención temprana cuando el algoritmo no puede identificar ningún conjunto de elementos frecuente, pero la partición de los datos también ayuda a reducir significativamente el costo de cálculo.

Los algoritmos a priori también pueden ser útiles en aplicaciones de inteligencia artificial basadas en el aprendizaje no monitoreado, como algoritmos de agrupamiento cuando los datos lo respaldan. Ayuda a identificar relaciones y asociaciones entre entidades aparentemente independientes, agrupándolas en posibles grupos.

Casos de uso del algoritmo Apriori

Descubrir y agrupar conjuntos de elementos tiene múltiples aplicaciones y, a veces, se hace referencia al algoritmo Apriori como lo primero que prueban los mineros de datos debido a su versatilidad. Veremos algunos de los casos de uso más comunes en diferentes industrias.

Análisis de la cesta de la compra

Una de las aplicaciones más comunes del algoritmo Apriori es realizar análisis de cesta de mercado. Los minoristas analizan el historial de compras de los clientes y optimizan la forma en que se colocan las tiendas colocando los artículos comprados con frecuencia cerca uno del otro o en el mismo estante. Las plataformas de comercio electrónico utilizan algoritmos Apriori para estudiar las relaciones basadas en productos basadas en las preferencias del usuario y el análisis de minería de patrones de compra para crear sistemas eficientes de recomendación de clientes. El mismo tipo de análisis se puede utilizar para optimizar la compra de servicios, por ejemplo, elegir cursos de capacitación de un catálogo, o recomendar otro tipo de cobertura al momento de seleccionar un seguro.

Atención médica

El algoritmo Apriori permite encontrar reglas de asociación estables entre síntomas y enfermedades para mejorar la eficacia del diagnóstico y diseñar planes de tratamiento específicos. Por ejemplo, qué pacientes son propensos a desarrollar diabetes (link resides outside ibm.com) o el papel que desempeñan la dieta o el estilo de vida en la enfermedad (link resides outside ibm.com). También puede ayudar a identificar los factores asociados a las reacciones adversas a los medicamentos.

Analytics sitio web

Los algoritmos a priori también son aplicables en bases de datos no transaccionales. Los analistas de datos suelen emplear Apriori para la minería de uso sitio web, para analizar los datos del flujo de clics y para interpretar el comportamiento del usuario.

Finanzas

Otra aplicación común del algoritmo Apriori es identificar patrones fraudulentos en las transacciones financieras. Identificar patrones de compra específicos como posiblemente fraudulentos permite a una institución financiera actuar rápidamente para suspender transacciones o poner en contacto con el titular de una cuenta.

Cómo elegir el modelo fundacional adecuado

Aprenda a elegir el enfoque correcto para preparar conjuntos de datos e implementar modelos fundacionales.

Recursos

IA en acción 2024

Encuestamos a 2000 organizaciones sobre sus iniciativas de IA para descubrir qué funciona, qué no y cómo pueden avanzar.

Explorar IBM Granite

IBM Granite es nuestra familia de modelos de IA abiertos, de alto rendimiento y confiables, diseñados para empresas y optimizados para escalar sus aplicaciones de IA. Explore opciones de lenguaje, código, series de tiempo y medidas de protección.

Aumente sus conocimientos sobre IA

Acceda a nuestro catálogo completo de más de 100 cursos en línea al adquirir hoy mismo una suscripción individual o multiusuario, que le permitirá ampliar sus conocimientos en una amplia gama de nuestros productos a un precio reducido.

Academia de IA de IBM

Dirigida por los principales líderes de opinión de IBM, el plan de estudios está diseñado para ayudar a los líderes empresariales a obtener los conocimientos necesarios para priorizar las inversiones en IA que pueden impulsar el crecimiento.

Ponga la IA a trabajar: Impulso del retorno de la inversión (ROI) con IA generativa

¿Quiere rentabilizar mejor sus inversiones en IA? Descubra cómo la IA generativa escalable en áreas clave impulsa el cambio ayudando a sus mejores mentes a crear y ofrecer nuevas soluciones innovadoras.

Desbloquee el poder de la IA generativa + ML

Aprenda a incorporar con confianza la IA generativa y el aprendizaje automático en su negocio.

Cómo prosperar en esta nueva era de la IA con confianza y seguridad

Indague en los 3 elementos críticos de una estrategia sólida de IA: crear una ventaja competitiva, escalar la IA en todo el negocio y avanzar en la IA confiable.

Soluciones relacionadas

IBM watsonx.ai

Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Diseñe aplicaciones de IA en menos tiempo y con menos datos.

Descubra watsonx.ai

Soluciones de inteligencia artificial

Ponga IBM watsonx a trabajar a escala en su negocio con la experiencia en IA líder del sector y la cartera de soluciones de IBM a su lado.

Explore las soluciones de IA

Consultoría y servicios de IA

Reinvente los flujos de trabajo y las operaciones críticas añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Conozca los servicios de IA

Dé el siguiente paso

Obtenga acceso único a capacidades que abarcan el ciclo de vida del desarrollo de IA. Produzca potentes soluciones de IA con interfaces fáciles de usar, flujos de trabajo y acceso a API y SDK estándar de la industria.

Explore watsonx.ai

Reserve una demostración en vivo