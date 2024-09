Gitterbasierte Clustering-Algorithmen werden nicht so häufig verwendet wie die vier vorangegangenen Ansätze. Sie können jedoch beim hochdimensionalen Clustering hilfreich sein, wenn andere Clustering-Algorithmen möglicherweise nicht so leistungsfähig sind. Bei diesem Ansatz unterteilt der Algorithmus einen hochdimensionalen Datensatz in Zellen. Jeder Zelle wird eine eindeutige Kennung zugewiesen, die sogenannte Zell-ID, und alle Datenpunkte, die in eine Zelle fallen, werden als Teil desselben Clusters betrachtet.

Das gitterbasierte Clustering ist ein effizienter Algorithmus für die Analyse großer mehrdimensionaler Datensätze, da es die Zeit für die Suche nach den nächsten Nachbarn reduziert, die bei vielen Clustering-Methoden üblich ist.

Ein beliebter gitterbasierter Clustering-Algorithmus nennt sich STING, was für STatistical INformation Grid steht. Bei STING wird der räumliche Bereich in rechteckige Zellen und mehrere Zellebenen mit unterschiedlichen Auflösungsgraden unterteilt. Zellen auf hoher Ebene werden in mehrere Zellen auf niedriger Ebene unterteilt. STING kann bei der Berechnung von Clustern in Big-Data-Szenarien, in denen die Datensätze extrem groß sind, sehr effizient sein, da es den Datensatz einfach iterativ in feinere Gitter unterteilt und die Anzahl der Punkte innerhalb dieses Gitters auswertet. Ein Nachteil von STING ist, dass die Grenzen von Clustern horizontal oder vertikal definiert sein müssen. Der Algorithmus kann keine nicht-rechteckigen Clustergrenzen erkennen.

Ein weiterer gitterbasierter Algorithmus, der bei hochdimensionalen Daten besonders leistungsfähig ist, ist der Clustering In Quest oder CLIQUE-Algorithmus. CLIQUE kombiniert einen gitterbasierten und einen dichtebasierten Ansatz zum Clustering. Bei diesem Algorithmus wird der Datenraum in ein Gitter unterteilt und die relative Dichte der Punkte in den Zellen des Gitters verglichen. Unterräume, die eine ähnliche Dichte aufweisen, werden zusammengeführt. Dieser Ansatz findet dichte Einheiten in allen relevanten Unterräumen und misst dann, ob ähnliche Cluster miteinander verbunden werden sollten. Das bedeutet, dass CLIQUE Cluster beliebiger Form in hochdimensionalen Daten erkennen kann.