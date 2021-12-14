ELT (ekstrak, muat, transformasi) dan ETL (ekstrak, transformasi, muat) keduanya merupakan proses Integrasi data yang pindah data mentah dari sistem sumber ke basis data target, seperti data lake atau gudang data. Sumber data ini dapat berada di beberapa repositori yang berbeda atau dalam sistem lama yang kemudian ditransfer menggunakan ELT atau ETL ke lokasi data target.
Dengan ELT, data tidak terstruktur diekstraksi dari sistem sumber dan dimuat ke sistem target untuk diubah nanti, sesuai kebutuhan. Data yang tidak terstruktur dan diekstraksi ini tersedia untuk sistem intelijen bisnis, dan tidak perlu pementasan data. ELT memanfaatkan data warehousing untuk melakukan transformasi data dasar, seperti validasi data atau penghapusan data duplikat. Proses ini diperbarui secara real-time dan digunakan untuk sejumlah besar data mentah. ELT adalah proses yang lebih baru yang belum mencapai potensi penuhnya dibandingkan dengan kakak perempuannya, ETL. Proses ELT awalnya didasarkan pada skrip SQL hard-code. Skrip SQL tersebut lebih cenderung memiliki kesalahan pengodean potensial daripada metode yang lebih canggih yang digunakan dalam ETL.
Dengan ETL, data tidak terstruktur diekstraksi dari sistem sumber dan titik data spesifik dan “kunci” potensial diidentifikasi sebelum memuat data ke sistem target. Dalam skenario ETL tradisional, data sumber diekstraksi ke area pementasan dan dipindah ke sistem target. Di area pementasan, data mengalami proses transformasi yang mengatur dan membersihkan semua tipe data. Proses transformasi ini memungkinkan data yang sekarang terstruktur menjadi kompatibel dengan sistem penyimpanan data target. ETL pada awalnya dirancang untuk bekerja dengan basis data relasional, yang secara historis mendominasi pasar. Insinyur data telah bekerja pada proses ETL sejak tahun 1970-an, memberi mereka waktu untuk menyempurnakan proses ETL ilmu data secara signifikan.
Dalam video berikut, Jamil Spanyol memberikan pembahasan lebih dalam ke ETL:
Pendekatan ELT memungkinkan implementasi yang lebih cepat daripada proses ETL, meskipun data menjadi berantakan setelah pindah. Transformasi terjadi setelah fungsi beban, mencegah perlambatan migrasi yang dapat terjadi selama proses ini. ELT memisahkan tahap Transformasi dan beban, memastikan bahwa kesalahan pengodean (atau kesalahan lain dalam tahap Transformasi) tidak menghentikan upaya migrasi. Selain itu, ELT menghindari masalah penskalaan server dengan menggunakan kekuatan pemrosesan dan ukuran gudang data untuk memungkinkan Transformasi (atau komputasi dapat diskalakan) dalam skala besar. ELT juga bekerja dengan solusi gudang data cloud untuk mendukung tipe data terstruktur, tidak terstruktur, semi-terstruktur, dan data mentah.
ETL membutuhkan waktu lebih lama untuk diimplementasikan namun menghasilkan data yang lebih bersih . Proses ini sangat cocok untuk repositori data target yang lebih kecil yang memerlukan pembaruan lebih jarang. ETL juga bekerja dengan gudang data cloud dengan menggunakan platform SaaS berbasis cloud dan gudang data di tempat.
Terdapat juga banyak alat ETL sumber terbuka dan komersial dengan kemampuan dan manfaat yang meliputi:
Proses ELT paling baik digunakan dalam kumpulan data volume tinggi atau lingkungan penggunaan data real-time.
Contoh-contoh spesifiknya adalah sebagai berikut:
ETL paling baik digunakan untuk menyinkronkan beberapa lingkungan penggunaan data dan migrasi data dari sistem lama.
Berikut ini adalah beberapa contoh spesifiknya:
Perbedaan utama antara ELT dan ETL adalah urutan operasi antara dua proses yang membuatnya cocok secara unik untuk situasi yang berbeda. Perbedaan lainnya adalah dalam ukuran data dan tipe data yang dapat ditangani oleh setiap proses. Meskipun ELT dan ETL terdengar mirip, aplikasinya berbeda.
Dengan ELT, prosesnya disederhanakan karena tidak memerlukan “kunci” atau pengidentifikasi lain untuk data yang akan ditransfer dan digunakan. Proses ELT telah disempurnakan dan ada banyak alat ELT yang dikembangkan yang digunakan untuk membantu migrasi data. Waktu muat lebih pendek karena prosesnya tidak memiliki banyak langkah untuk dilalui. Solusi ELT untuk sistem intelijen bisnis berasal dari kebutuhan untuk dapat memuat data tidak terstruktur dengan cepat. Solusi ELT otomatis berbasis cloud juga dapat memerlukan pemeliharaan yang relatif rendah untuk didukung.
Data ETL memberikan lebih banyak definisi dari awal, yang biasanya membutuhkan lebih banyak waktu untuk mentransfer data secara akurat. Proses ini hanya memerlukan pembaruan informasi secara berkala, bukan pembaruan real-time. Waktu muat ETL lebih lama dari ELT karena banyak langkah dalam tahap transformasi yang harus terjadi sebelum memuat data.
IBM® menawarkan beberapa layanan dan solusi integrasi data yang dirancang untuk mendukung pipeline data siap bisnis dan memberi perusahaan Anda alat yang dibutuhkan untuk menskalakan secara efisien.
IBM, pemimpin dalam integrasi data lokal dan berbasis cloud, memberi perusahaan kepercayaan yang mereka butuhkan saat mengelola proyek big data, aplikasi, dan teknologi machine learning. Dengan platform terdepan di industri seperti IBM Cloud Pak® for Data, organisasi dapat memodernisasi proses DataOps mereka sambil dapat menggunakan alat virtualisasi terbaik di kelasnya untuk mencapai kecepatan dan skalabilitas yang dibutuhkan bisnis mereka sekarang dan di masa depan.
Untuk informasi lebih lanjut tentang bagaimana perusahaan Anda dapat membangun dan menjalankan strategi integrasi data yang efektif, jelajahi rangkaian penawaran integrasi data IBM®.
