Introdotto nel 1994 da Rakesh Agrawal e Ramakrishnan Srikant (link esterno a ibm.com), il nome "Apriori" riconosce la conoscenza precedente di itemset frequenti utilizzati dall'algoritmo nel calcolo. L'algoritmo esegue iterazioni sui dati per identificare i k-itemset, ovvero k elementi che si verificano frequentemente insieme. Utilizza quindi i k-itemset per identificare i k+1 itemset. L'algoritmo Apriori si basa sull'insight che l'aggiunta di elementi a un gruppo acquistato di frequente può solo renderlo meno frequente, non di più. Il processo si basa sulla proprietà Apriori che indica che, se un itemset viene visualizzato frequentemente in un set di dati, anche tutti i relativi sottoinsiemi devono essere frequenti. Al contrario, se un itemset viene identificato come poco frequente, tutti i relativi superset vengono considerati non frequenti.

L'algoritmo Apriori è applicabile a tutti i tipi di set di dati, in particolare quelli generati da database transazionali ed è spesso utilizzato per la market basket analysis a supporto dei sistemi di raccomandazione. Ad esempio, quando si utilizza una piattaforma di e-commerce che vende vestiti e scarpe, un acquirente cerca scarpe e decide di aggiungere un paio di scarpe nere formali al carrello. L'acquirente nota quindi che l'interfaccia consiglia altri articoli da acquistare, come i calzini. Uno dei modi in cui funziona questo sistema di raccomandazione è apprendere i modelli di acquisto dei clienti e associare articoli che solitamente vengono acquistati insieme.

Uno dei maggiori vantaggi dell'utilizzo dell'algoritmo Apriori è la sua semplicità e adattabilità. Tuttavia, gli algoritmi Apriori non sono altrettanto efficienti quando si gestiscono set di dati di grandi dimensioni. Il processo multi-iterazione di generazione di itemset candidati può diventare computazionalmente costoso e richiede molta memoria. Apriori è spesso combinato con altre tecniche per mitigare questi problemi.

La funzione Apriori è integrata in molti linguaggi di programmazione popolari, tra cui Python, Java e R, rendendo la generazione di regole di associazione di qualità insieme a frequenti itemset semplice da integrare in applicazioni o sistemi esistenti.