Der Name „Apriori“ wurde 1994 von Rakesh Agrawal und Ramakrishnan Srikant (Link befindet sich außerhalb von ibm.com) eingeführt und verweist auf das Vorwissen über Frequent Itemsets, das der Algorithmus bei der Berechnung verwendet. Der Algorithmus führt Iterationen über die Daten aus, um k-Itemsets zu identifizieren, d. h. k Elemente, die häufig zusammen auftreten. Anschließend werden die k-Itemsets verwendet, um die k+1-Itemsets zu identifizieren. Der Apriori-Algorithmus beruht auf der Erkenntnis, dass das Hinzufügen von Elementen zu einer häufig gekauften Gruppe diese nur in ihrer Häufigkeit verringern kann, nicht erhöhen. Der Prozess beruht auf der Apriori-Eigenschaft, die besagt, dass, wenn ein Itemset häufig in einem Datensatz vorkommt, auch alle seine Teilmengen häufig vorkommen müssen. Umgekehrt gilt: Wenn ein Itemset als selten identifiziert wird, werden alle seine Obermengen als selten betrachtet.

Der Apriori-Algorithmus ist auf alle Arten von Datensätzen anwendbar, insbesondere auf solche, die von Transaktionsdatenbanken generiert werden, und wird häufig für die Warenkorbanalyse zur Unterstützung von Empfehlungssystemen verwendet. Nehmen wir zum Beispiel eine E-Commerce-Plattform, die Kleidung und Schuhe verkauft. Ein Käufer sucht nach Schuhen und entscheidet sich, ein Paar schwarze Anzugschuhe in seinen Warenkorb zu legen. Der Käufer bemerkt dann, dass die Benutzeroberfläche weitere Artikel zum Kauf empfiehlt, wie z. B. Socken. Dieses Empfehlungssystem funktioniert unter anderem so, dass es die Kaufmuster der Kunden lernt und Artikel miteinander verknüpft, die in der Vergangenheit wahrscheinlich zusammen gekauft wurden.

Einer der größten Vorteile des Apriori-Algorithmus ist seine Einfachheit und Anpassungsfähigkeit. Allerdings sind Apriori-Algorithmen bei der Verarbeitung großer Datensätze nicht so effizient. Der mehrfache Iterationsprozess der Generierung von Itemset-Kandidaten kann rechen- und speicherintensiv werden. Apriori wird oft mit anderen Techniken kombiniert, um diese Probleme zu mildern.

Die Apriori-Funktion ist in viele gängige Programmiersprachen wie Python, Java und R integriert, sodass sich die Generierung hochwertiger Assoziationsregeln zusammen mit Frequent Itemsets einfach in bestehende Anwendungen oder Systeme integrieren lässt.