Dane tabelaryczne a dane transakcyjne

Dane używane przez modele reguł asocjacyjnych mogą mieć format transakcyjny lub tabelaryczny, zgodnie z opisem poniżej. Są to opisy ogólne; specyficzne wymagania mogą być inne, co omówiono w dokumentacji dla każdego typu modelu. Należy zwrócić uwagę, że podczas przeprowadzania oceny modeli dane poddawane ocenie muszą mieć taki sam format, jak dane użyte do utworzenia modelu. Modele utworzone z zastosowaniem danych tabelarycznych mogą być używane do oceniania wyłącznie danych tabelarycznych; modele utworzone przy użyciu danych transakcyjnych mogą przeprowadzać ocenę tylko danych transakcyjnych.

Format transakcyjny

Dane transakcyjne są zapisywane w postaci osobnego rekordu dla każdej transakcji lub pozycji. Jeśli klient dokonuje kilku zakupów, każdy będzie zapisany w osobnym folderze, wraz z powiązanymi elementami dowiązanymi na podstawie id. klienta. Jest on również znany jako format kasowy.

Klient Zakup  
1 dżem  
2 mleko  
3 dżem  
3 chleb  
4 dżem  
4 chleb  
4 mleko  

Węzły Apriori, CARMA i Sekwencje mogą korzystać z danych transakcyjnych.

Dane tabelaryczne

Dane tabelaryczne (znane również jako dane z koszyka lub tabeli prawdy) zawierają pozycje reprezentowane przez osobne flagi, a każda flaga reprezentuje obecność lub nieobecność konkretnej pozycji. Każdy rekord reprezentuje kompletny zestaw powiązanych pozycji. Zmienne flagi mogą być jakościowe lub numeryczne, choć dla niektórych modeli mogą istnieć bardziej specyficzne wymagania.

Klient Dżem Chleb Mleko  
1 T F F  
2 F F T  
3 T T F  
4 T T T  

Węzły Apriori, CARMA, GSAR i Sekwencje mogą korzystać z danych tabelarycznych.