La metrica di confidenza identifica la probabilità che elementi o itemset si trovino insieme negli itemset. Ad esempio, se in una transazione sono presenti due elementi, si presuppone che l'esistenza di un elemento porti all'altro. Il primo elemento o itemset è l'antecedente e il secondo è il conseguente. La confidenza è quindi definita come il rapporto tra il numero di transazioni aventi sia l'antecedente che il conseguente e il numero di transazioni che hanno solo l'antecedente. Questo scenario è rappresentato come:
dove A è l'antecedente, B è il conseguente e C (A, B) è la confidenza secondo cui A porta a B.
Estendendo l'esempio precedente, supponiamo che ci siano 150 transazioni in cui mele e banane sono state acquistate insieme. La confidenza è calcolata come:
Questo risultato indica una probabilità del 60% che un acquisto di mele porti poi a un acquisto di banane. Allo stesso modo, supponendo un totale di 500 transazioni di banane, la confidenza che un acquisto di banane porti a un acquisto di mele viene calcolata come:
Qui c'è solo il 30% di possibilità che l'acquisto di una banana porti all'acquisto di una mela.
Sebbene la confidenza sia una buona misura della probabilità, non è una garanzia di una chiara associazione tra gli elementi. Il valore della confidenza potrebbe essere alto per altri motivi. Per questo motivo, viene applicata una soglia di confidenza minima per filtrare le associazioni debolmente probabili durante il mining con le regole di associazione.