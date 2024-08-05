Clustering atau pengelompokan adalah teknik dalam machine learning yang tanpa pengawasan yang digunakan untuk mengelompokkan objek yang memiliki kesamaan. Pengelompokan hierarkis (hierarchical clustering analysis/HCA) mengelompokkan objek ke dalam struktur hierarki kluster tanpa mengikuti urutan linier. Berbagai disiplin ilmu, seperti biologi, analisis gambar dan ilmu sosial, menggunakan metode pengelompokan hierarkis untuk menjelajahi dan mengenali pola dalam kumpulan data. Beberapa contoh penggunaan antara lain mengategorikan populasi dalam penelitian klinis, segmentasi pelanggan, dan identifikasi node komunitas dalam model jaringan.

Ada dua jenis pengelompokan hierarkis:

- Pendekatan aglomeratif atau pendekatan bawah ke atas 1 yang berulang kali menggabungkan cluster menjadi yang lebih besar sampai muncul satu cluster.

- Pendekatan divisif atau pendekatan dari atas ke bawah yang2 dimulai dengan semua data dalam satu kluster dan melanjutkan untuk membagi kluster-kluster berikutnya hingga semua kluster menjadi tunggal.

Analisis pengelompokan hierarkis menimbulkan biaya komputasi yang tinggi. Meskipun penggunaan heap dapat mengurangi waktu komputasi, kebutuhan memori meningkat. Jenis pengelompokan divisif maupun aglomeratif bersifat “serakah,” yang berarti bahwa algoritma memutuskan klaster mana yang akan digabungkan atau dipecah dengan membuat pilihan optimal secara setempat pada setiap tahap proses. Selain itu, kriteria penghentian dapat diterapkan, di mana algoritma akan menghentikan aglomerasi atau memisahkan klaster setelah mencapai jumlah kluster yang telah ditentukan sebelumnya.

Diagram berbentuk pohon yang disebut dendrogram3 sering digunakan untuk memvisualisasikan hierarki kluster. Dendrogram ini menunjukkan urutan kluster yang telah digabungkan atau dibagi, serta mengilustrasikan kemiripan atau jarak antara titik data. Secara sederhana, dendrogram juga bisa dianggap sebagai daftar bersarang 4 yang memiliki atribut.