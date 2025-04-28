Data tidak terstruktur adalah informasi yang tidak memiliki format yang ditentukan sebelumnya. Kumpulan data tidak terstruktur sangat besar (seringkali mencapai terabytes atau petabytes) dan mengandung 90% dari seluruh kumpulan data yang dihasilkan oleh perusahaan.1

Perkembangan data tidak terstruktur didorong oleh sumber data yang beragam dan luas, termasuk dokumen teks, media sosial, file gambar dan audio, pesan instan, dan perangkat pintar. Hampir semua data baru yang dihasilkan saat ini bersifat tidak terstruktur: setiap pesan yang dikirim, foto yang diunggah, atau sensor yang diaktifkan menambah volume data yang terus bertambah.

Tidak seperti data terstruktur (yang memiliki model data yang telah ditentukan sebelumnya), data tidak terstruktur tidak mudah menyesuaikan diri dengan skema tetap database konvensional. Sebaliknya, data tidak terstruktur sering disimpan dalam sistem file, database non-relasional (atau NoSQL) atau dalam data lake.

Kompleksitas data tidak terstruktur dan struktur data yang tidak seragam juga memerlukan metode analisis data yang lebih canggih. Teknologi seperti machine learning (ML) dan pemrosesan bahasa alami (NLP) sering digunakan untuk mengekstrak insight dari kumpulan data yang tidak terstruktur.

Sebelumnya, data tidak terstruktur dianggap sebagai data gelap. Tantangan data tidak terstruktur (yaitu, volumenya yang besar dan ketidakseragamannya) membuatnya tidak dapat digunakan untuk banyak contoh penggunaan bisnis.

Namun, saat ini, perusahaan dengan data tidak terstruktur yang melimpah memiliki aset strategis yang signifikan. Bila digabungkan, data terstruktur dan tak terstruktur memberikan tampilan data lengkap di seluruh perusahaan. Dan, terutama relevan pada saat ini, data tidak terstruktur juga dapat membantu bisnis membuka potensi penuh AI generatif (gen AI).