Apa itu manajemen data?

Pemandangan udara lokasi konstruksi Barangaroo

Penyusun

Staff Writer

IBM Think

Apa itu manajemen data?

Manajemen data adalah praktik pengumpulan, pemrosesan, dan penggunaan data secara aman dan efisien untuk hasil bisnis yang lebih baik.

72% CEO dengan kinerja terbaik setuju bahwa keunggulan kompetitif bergantung pada siapa yang memiliki AI generatif paling canggih. Namun, untuk memanfaatkan kecerdasan buatan (AI), organisasi harus terlebih dahulu mengatur arsitektur informasi mereka agar data mereka dapat diakses dan digunakan. Tantangan manajemen data yang mendasar meliputi volume data, dan silo data di berbagai lokasi dan penyedia cloud. Jenis data baru dan berbagai format seperti dokumen, gambar, dan video, juga menghadirkan tantangan. Selain itu, kompleksitas dan kumpulan data yang tidak konsisten dapat membatasi kemampuan organisasi untuk menggunakan data untuk AI.

Sebagai akibat dari tantangan ini, strategi manajemen data yang efektif telah menjadi prioritas yang meningkat bagi organisasi untuk mengatasi tantangan yang dihadirkan oleh big data. Sistem manajemen data modern yang fleksibel terintegrasi dengan teknologi yang ada dalam organisasi untuk mengakses data berkualitas tinggi yang dapat digunakan untuk ilmuwan data, insinyur AI dan machine learning (ML), dan pengguna bisnis organisasi. 

Strategi manajemen data yang lengkap memperhitungkan berbagai faktor, termasuk cara:

Mengumpulkan, mengintegrasikan, dan menyimpan data dari berbagai sumber, termasuk data terstruktur dan tidak terstruktur, dan dari berbagai cloud hybrid dan beberapa cloud.
Pertahankan ketersediaan tinggi, ketahanan, dan pemulihan bencana data yang disimpan di beberapa lokasi.
Bangun atau peroleh basis data yang sesuai dengan tujuan untuk memenuhi berbagai beban kerja dan kebutuhan harga-kinerja.
Membantu memastikan berbagi data bisnis dan metadata di seluruh organisasi, untuk memungkinkan layanan mandiri, kolaborasi, dan akses data yang lebih baik.
Amankan dan atur data, sekaligus membantu memenuhi persyaratan kepatuhan dan memenuhi persyaratan privasi data.
Kelola siklus hidup data mulai dari pembuatan hingga penghapusan dengan integrasi ujung ke ujung, tata kelola, silsilah, pengamatan, dan master data management (MDM).
Otomatiskan penemuan dan analisis data dengan AI generatif untuk manajemen data.

Desain 3D bola yang menggelinding di lintasan

Berita + Insight AI terbaru  

Temukan insight dan berita yang dikurasi oleh para pakar tentang AI, cloud, dan lainnya di Buletin Think mingguan.

Mengapa manajemen data penting

Meskipun alat manajemen data untuk membangun aplikasi AI generatif tersedia secara luas, data itu sendiri memiliki nilai bagi pelanggan dan bisnis. Data berkualitas dalam volume tinggi harus diatur dan diproses dengan benar agar berhasil melatih model. Pendekatan ini adalah contoh penggunaan yang berkembang pesat untuk manajemen data modern.

Misalnya, komentar generatif berbasis AI ditawarkan selama The Championship 2023 di Wimbledon, yang mengakses informasi dari 130 juta dokumen dan 2,7 juta titik data kontekstual terkait secara real time. Pengunjung yang menggunakan aplikasi atau situs web turnamen dapat mengakses statistik lengkap, narasi permainan, dan komentar permainan, serta prediksi pemenang yang tepat setiap saat ketika pertandingan berlangsung. Memiliki strategi manajemen data yang tepat dapat membantu memastikan bahwa data yang berharga selalu tersedia, terintegrasi, diatur, aman, dan akurat.

Mengubah data menjadi aset tepercaya

AI generatif dapat memberi organisasi keunggulan kompetitif yang kuat, dengan strategi AI mereka bergantung pada kekuatan data yang digunakan. Banyak organisasi masih bergelut dengan tantangan data mendasar yang diperburuk oleh permintaan untuk AI generatif, yang membutuhkan lebih banyak data - yang menyebabkan lebih banyak lagi masalah dalam manajemen data.

Data mungkin disimpan di beberapa lokasi, aplikasi dan cloud, sering mengarah ke silo data yang terisolasi. Untuk menambah kompleksitas, penggunaan data telah menjadi lebih bervariasi, dengan data dalam bentuk yang beragam dan kompleks-seperti gambar, video, dokumen, dan audio. Diperlukan lebih banyak waktu untuk pembersihan data, integrasi, dan persiapan. Tantangan-tantangan ini dapat membuat organisasi menghindari penggunaan data penuh mereka untuk tujuan analitik dan AI.

Namun, dilengkapi dengan peralatan modern untuk arsitektur data, tata kelola, dan keamanan, data dapat berhasil digunakan untuk mendapatkan insight baru dan membuat prediksi yang lebih tepat secara konsisten. Kemampuan ini dapat memungkinkan pemahaman yang lebih mendalam tentang preferensi pelanggan dan dapat meningkatkan pengalaman pelanggan (CX) dengan memberikan insight yang diperoleh dari analisis data. Selain itu, hal ini memfasilitasi pengembangan model bisnis inovatif berbasis data, seperti penawaran layanan yang bergantung pada AI generatif, yang membutuhkan fondasi data berkualitas tinggi untuk pelatihan model.

Menciptakan fondasi data yang tepat untuk transformasi digital

Pemimpin data dan analitik menghadapi tantangan besar ketika mengubah organisasi mereka karena meningkatnya kompleksitas lingkungan data di seluruh hybrid cloud. AI generatif dan asisten AI, machine learning (ML), analitik tingkat lanjut, Internet of Things (IoT), dan otomatisasi juga membutuhkan volume data yang sangat besar untuk bekerja secara efektif. Data ini perlu disimpan, diintegrasikan, diatur, diubah, dan disiapkan untuk dasar data yang tepat. Dan untuk membangun fondasi data yang kuat untuk AI, organisasi perlu fokus membangun dasar data yang terbuka dan tepercaya, yang berarti menciptakan strategi manajemen data yang berpusat pada keterbukaan, kepercayaan, dan kolaborasi.

Persyaratan AI dirangkum oleh seorang analis Gartner® ¹: “Data yang siap untuk AI berarti bahwa data Anda harus mewakili contoh penggunaan, termasuk semua pola, kesalahan, outlier, dan kemunculan tak terduga yang diperlukan untuk melatih atau menjalankan model AI untuk contoh penggunaan tertentu.”

Para eksekutif data dan analitik mungkin merasa bahwa data yang disiapkan untuk AI sama dengan data berkualitas tinggi, tetapi standar data berkualitas tinggi untuk tujuan selain AI belum tentu memenuhi standar kesiapan AI. Dalam bidang analitik, misalnya, data biasanya disempurnakan untuk menghilangkan outlier atau menyesuaikan dengan ekspektasi manusia. Namun, ketika melatih algoritma, diperlukan data representatif.

Memastikan data yang diatur, patuh, dan aman

Tata kelola data adalah bagian dari manajemen data. Artinya, ketika tim tata kelola data mengidentifikasi kesamaan di seluruh kumpulan data yang berbeda dan ingin mengintegrasikannya, mereka perlu bermitra dengan tim arsitektur atau rekayasa basis data untuk menentukan model data dan arsitektur data guna memfasilitasi hubungan dan aliran data. Contoh lain berkaitan dengan akses data. Tim tata kelola data mungkin menetapkan kebijakan seputar akses data ke jenis data tertentu, seperti informasi identifikasi pribadi (PII). Sementara itu, tim manajemen data akan menyediakan akses langsung atau menetapkan mekanisme untuk menyediakan akses, seperti menyesuaikan peran pengguna yang ditetapkan secara internal untuk menyetujui akses.

Manajemen data yang efektif, termasuk praktik tata kelola data yang kuat, dapat membantu dalam mematuhi kepatuhan terhadap peraturan. Kepatuhan ini mencakup peraturan privasi data nasional dan global, seperti Peraturan Perlindungan Data Umum (GDPR) dan Undang-Undang Privasi Konsumen California (CCPA), bersama dengan standar privasi dan keamanan khusus industri. Menetapkan kebijakan dan prosedur manajemen data yang komprehensif menjadi sangat penting untuk mendemonstrasikan atau menjalani audit untuk memvalidasi perlindungan ini.

AI Academy

Apakah manajemen data merupakan rahasia AI generatif?

Jelajahi mengapa data berkualitas tinggi sangat penting untuk keberhasilan penggunaan AI generatif.

Buka episode

Aspek penting dari manajemen data

Solusi manajemen data modern menyediakan cara yang efisien untuk mengelola data dan metadata di beragam kumpulan data. Sistem modern dibangun dengan perangkat lunak manajemen data terbaru dan database atau penyimpanan data yang andal. Ini dapat mencakup data lake transaksional , gudang data, atau data lakehouse, yang dikombinasikan dengan arsitekturstruktur data termasuk penyerapan data, tata kelola, silsilah, observabilitas, dan master data management. Bersama-sama, yayasan data tepercaya ini dapat memberikan data berkualitas kepada konsumen data sebagai produk data, intelijen bisnis (BI) dan dasbor, dan model AI—baik ML tradisional maupun AI generatif.

Strategi manajemen data yang kuat biasanya mencakup beberapa komponen untuk merampingkan strategi dan operasi di seluruh organisasi.

Database dan arsitektur data lakehouse yang tepat

Sementara data dapat disimpan sebelum atau sesudah pemrosesan data, jenis data dan tujuannya biasanya akan menentukan penyimpanan yang digunakan. Sementara basis data relasional mengatur data ke dalam format tabel, basis data nonrelasional tidak memiliki skema basis data yang kaku.

Database relasional juga biasanya dikaitkan dengan database transaksional, yang menjalankan perintah atau transaksi secara kolektif. Contohnya adalah transfer bank. Jumlah yang ditentukan ditarik dari satu akun dan kemudian disimpan di akun lain. Tetapi bagi perusahaan untuk mendukung tipe data terstruktur dan tidak terstruktur, mereka memerlukan database yang dibuat khusus. Database ini juga harus memenuhi berbagai contoh penggunaan di seluruh analitik, AI, dan aplikasi. Mereka harus menjangkau database relasional dan nonrelasional, seperti nilai kunci, dokumen, kolom lebar, grafik, dan dalam memori. Database multimodal ini menyediakan dukungan asli untuk berbagai jenis data dan model pengembangan terbaru, dan dapat menjalankan berbagai jenis beban kerja, termasuk IoT, analitik, ML, dan AI.

Praktik terbaik manajemen data menyarankan agar data warehousing dioptimalkan untuk analitik kinerja tinggi pada data terstruktur. Hal ini membutuhkan skema yang ditentukan untuk memenuhi persyaratan analisis data tertentu untuk contoh penggunaan tertentu, seperti dasbor, visualisasi data, dan tugas intelijen bisnis lainnya. Kebutuhan data ini biasanya diarahkan dan didokumentasikan oleh pengguna bisnis dalam kemitraan dengan insinyur data, yang pada akhirnya akan bekerja dengan model data yang telah ditetapkan.

Struktur dasar gudang data biasanya diorganisasikan sebagai sistem relasional yang menggunakan format data terstruktur, mengambil data dari basis data transaksional. Namun, untuk data tidak terstruktur dan semiterstruktur, danau data menggabungkan data dari sistem relasional dan nonrelasional, dan tugas intelijen bisnis lainnya. Danau data sering kali lebih disukai daripada opsi penyimpanan lain karena danau data biasanya merupakan lingkungan penyimpanan berbiaya rendah, yang dapat menampung petabyte data mentah.

Danau data memberikan manfaat bagi ilmuwan data khususnya, karena memungkinkan mereka untuk memasukkan data terstruktur dan tidak terstruktur ke dalam proyek ilmu data mereka. Namun, data warehouse dan data lake memiliki keterbatasannya sendiri. Format data eksklusif dan biaya penyimpanan yang tinggi membatasi kolaborasi dan penerapan model AI dan ML dalam lingkungan data warehouse.

Sebaliknya, data lake ditantang untuk mengekstrak insight secara langsung dengan cara yang diatur dan berkinerja. Data lakehouse terbuka mengatasi keterbatasan ini dengan menangani beberapa format terbuka melalui cloud object storage dan menggabungkan data dari berbagai sumber, termasuk repositori yang ada, untuk memungkinkan analitik dan AI dalam skala besar.

Strategi database hybrid cloud

Strategi multicloud dan hybrid terus menjadi lebih populer. Teknologi AI didukung oleh sejumlah besar data yang membutuhkan penyimpanan data modern yang berada pada arsitektur cloud native untuk memberikan skalabilitas, pengoptimalan biaya, kinerja, dan keberlangsungan bisnis. Menurut Gartner², pada akhir tahun 2026, "90% alat dan platform manajemen data yang gagal mendukung kemampuan multi-cloud dan hybrid akan dinonaktifkan."

Sementara peralatan yang ada membantu administrator basis data (DBA) dalam mengotomatiskan berbagai tugas manajemen konvensional, keterlibatan manual tetap diperlukan karena sifat pengaturan basis data yang biasanya besar dan rumit. Kapan pun intervensi manual diperlukan, kemungkinan terjadinya kesalahan meningkat. Meminimalkan keperluan manajemen data manual merupakan tujuan utama dalam mengoperasikan basis data sebagai layanan yang terkelola sepenuhnya.

Database cloud yang dikelola sepenuhnya mengotomatiskan tugas yang memakan waktu seperti peningkatan, backup, tambalan, dan pemeliharaan. Pendekatan ini membantu membebaskan DBA dari tugas manual yang memakan waktu untuk menghabiskan lebih banyak waktu pada tugas-tugas berharga seperti pengoptimalan skema, aplikasi cloud native baru, dan dukungan untuk contoh penggunaan AI baru. Tidak seperti penerapan lokal, penyedia penyimpanan cloud juga memungkinkan pengguna untuk memutar klaster besar sesuai kebutuhan, seringkali hanya memerlukan pembayaran untuk penyimpanan yang ditentukan. Ini berarti bahwa jika organisasi membutuhkan lebih banyak daya komputasi untuk menjalankan pekerjaan dalam beberapa jam (dibandingkan beberapa hari), ia dapat melakukan ini di platform cloud dengan membeli lebih banyak node komputasi.

Peralihan ke platform data cloud ini juga memfasilitasi adopsi pemrosesan data streaming. Alat seperti Apache Kafka memungkinkan pemrosesan data yang lebih real-time, sehingga konsumen dapat berlangganan topik untuk menerima data dalam hitungan detik. Meskipun demikian, pemrosesan batch masih mempunyai kelebihan karena lebih efisien dalam memproses data bervolume besar. Sementara pemrosesan batch mematuhi jadwal yang ditetapkan, seperti harian, mingguan, atau bulanan, pemrosesan batch ideal untuk dasbor kinerja bisnis, yang biasanya tidak memerlukan data waktu nyata.

Arsitektur struktur data

Baru-baru ini, struktur data telah muncul untuk membantu kompleksitas pengelolaan sistem data ini. Data fabric menggunakan sistem cerdas dan otomatis untuk memfasilitasi integrasi ujung ke ujung jalur data dan lingkungan cloud. Struktur data juga menyederhanakan pengiriman data berkualitas dan menyediakan kerangka kerja untuk menegakkan kebijakan tata kelola data untuk membantu memastikan bahwa data yang digunakan sesuai. Ini memfasilitasi akses layanan mandiri ke produk data yang dapat dipercaya dengan menghubungkan ke data yang berada di seluruh silo organisasi, sehingga para pemimpin bisnis mendapatkan pandangan yang lebih holistik tentang kinerja bisnis. Penyatuan data di seluruh bagian SDM, pemasaran, penjualan, rantai pasokan, dan lainnya memberikan pemahaman yang lebih baik kepada para pemimpin tentang pelanggan mereka.

Mesh data mungkin juga berguna. Struktur data adalah arsitektur yang memfasilitasi integrasi ujung ke ujung. Sebaliknya, data mesh adalah arsitektur data terdesentralisasi yang mengatur data berdasarkan domain bisnis tertentu — misalnya, pemasaran, penjualan, layanan pelanggan, dan banyak lagi. Pendekatan ini memberikan lebih banyak kepemilikan kepada produsen kumpulan data.

Integrasi dan pemrosesan data

Dalam tahap siklus manajemen data ini , data mentah diserap dari berbagai sumber data, seperti API web , aplikasi mobile, perangkat Internet of Things (IoT), formulir, survei, dan banyak lagi. Setelah pengumpulan data, data biasanya diproses atau dimuat dengan menggunakan teknik integrasi data, seperti extract, transform, load (ETL) atau extract, load, transform (ELT). Meskipun ETL secara historis telah menjadi metode standar untuk mengintegrasikan dan mengatur data di seluruh kumpulan data yang berbeda, ELT semakin populer dengan munculnya platform data cloud dan meningkatnya permintaan akan data real-time.

Selain pemrosesan batch, data replication merupakan metode alternatif untuk mengintegrasikan data dan terdiri dari sinkronisasi data dari lokasi sumber ke satu atau beberapa lokasi target, membantu memastikan ketersediaan, keandalan, dan ketahanan data. Teknologi seperti penangkapan data perubahan (CDC) menggunakan replikasi berbasis log untuk menangkap perubahan yang dibuat pada data di sumber dan menyebarkan perubahan tersebut ke sistem target, membantu organisasi membuat keputusan berdasarkan informasi terkini.

Terlepas dari teknik integrasi data yang digunakan, data biasanya disaring, digabungkan, atau dikumpulkan selama tahap pemrosesan data untuk memenuhi persyaratan untuk tujuan yang dimaksudkan. Aplikasi ini dapat berkisar dari dasbor intelijen bisnis hingga algoritma machine learning prediktif.

Menggunakan integrasi berkelanjutan dan penerapan berkelanjutan (CI/CD) untuk kontrol versi dapat memungkinkan tim data melacak perubahan pada kode dan aset data mereka. Kontrol versi memungkinkan tim data berkolaborasi dengan lebih efektif, karena mereka dapat mengerjakan berbagai bagian proyek secara bersamaan dan menggabungkan perubahan tanpa konflik.

Tata kelola data dan manajemen metadata

Tata kelola data mempromosikan ketersediaan dan penggunaan data. Untuk membantu memastikan kepatuhan, tata kelola umumnya mencakup proses, kebijakan, dan alat seputar kualitas data, akses data, kegunaan, dan keamanan data. Misalnya, dewan tata kelola data cenderung menyelaraskan taksonomi untuk membantu memastikan bahwa metadata ditambahkan secara konsisten di berbagai sumber data. Taksonomi juga dapat didokumentasikan lebih lanjut melalui katalog data untuk membuat data lebih mudah diakses oleh pengguna, memfasilitasi demokratisasi data di seluruh organisasi.

Memperkaya data dengan konteks bisnis yang tepat sangat penting untuk penegakan kebijakan tata kelola data dan kualitas data secara otomatis. Di sinilah aturan perjanjian tingkat layanan (SLA) mulai berlaku, membantu memastikan bahwa data dilindungi dan sesuai kualitas yang diperlukan. Penting juga untuk memahami asal-usul data dan mendapatkan transparansi dalam perjalanan data saat berpindah melalui pipeline. Hal ini membutuhkan kemampuan silsilah data yang kuat untuk mendorong visibilitas karena data organisasi dapat berjalan dari sumber data ke pengguna akhir. Tim tata kelola data juga mendefinisikan peran dan tanggung jawab untuk membantu memastikan bahwa akses data disediakan dengan tepat. Akses terkontrol ini sangat penting untuk menjaga privasi data.

Keamanan data

Keamanan data menetapkan pembatas untuk melindungi informasi digital dari akses yang tidak sah, korupsi, atau pencurian. Seiring dengan semakin meningkatnya teknologi digital dalam kehidupan kita, semakin banyak pengawasan yang diberikan pada praktik keamanan bisnis modern. Pengawasan ini penting untuk membantu melindungi data pelanggan dari penjahat siber atau untuk membantu mencegah insiden yang membutuhkan pemulihan bencana. Sementara kehilangan data dapat merusak bisnis apa pun, pelanggaran data, khususnya, dapat mengakibatkan konsekuensi mahal dari sudut pandang keuangan dan merek. Tim keamanan data dapat mengamankan data mereka dengan lebih baik dengan menggunakan enkripsi dan penyembunyian data dalam strategi keamanan data mereka. 

Observabilitas data

Observabilitas data mengacu pada praktik pemantauan, pengelolaan, dan pemeliharaan data dengan cara yang membantu memastikan kualitas, ketersediaan, dan keandalannya di berbagai proses, sistem, dan jalur pipa dalam suatu organisasi. Observabilitas data adalah tentang memahami kesehatan data organisasi dan keadaannya di seluruh ekosistem data. Ini mencakup berbagai kegiatan yang melampaui pemantauan tradisional, yang hanya menggambarkan masalah. Observabilitas data dapat membantu mengidentifikasi, memecahkan masalah, dan menyelesaikan masalah data secara hampir real-time.

Master data management

Master data management (MDM) berfokus pada penciptaan pandangan tunggal berkualitas tinggi dari entitas bisnis inti termasuk produk, pelanggan, karyawan, dan pemasok. Dengan memberikan pandangan akurat dari data master dan hubungannya, MDM memungkinkan insight yang lebih cepat, peningkatan kualitas data, dan kesiapan kepatuhan. Dengan satu tampilan 360 derajat data master di seluruh perusahaan, MDM memungkinkan bisnis dengan data yang tepat untuk mendorong analisis bisnis, menentukan produk dan pasar yang paling sukses, serta pelanggan yang paling berharga.

Manfaat manajemen data

Organisasi mengalami banyak manfaat saat memulai dan memelihara inisiatif manajemen data. 

Berkurangnya silo data

Banyak perusahaan secara tidak sengaja membuat silo data dalam organisasi mereka. Alat dan kerangka kerja manajemen data modern, seperti struktur data dan data lake, membantu menghilangkan silo data dan ketergantungan pada pemilik data. Misalnya, struktur data membantu mengungkapkan potensi integrasi di seluruh kumpulan data yang berbeda di seluruh fungsi, seperti sumber daya manusia, pemasaran, dan penjualan. Namun, data lake menyerap data mentah dari fungsi-fungsi yang sama, menghilangkan ketergantungan dan menghilangkan pemilik tunggal kumpulan data.

Peningkatan kepatuhan dan keamanan

Dewan tata kelola membantu menempatkan pembatas untuk melindungi bisnis dari denda dan publisitas negatif yang dapat terjadi karena ketidakpatuhan terhadap peraturan dan kebijakan pemerintah. Kesalahan langkah di sini bisa mahal baik dari perspektif merek maupun keuangan.

Pengalaman pelanggan yang ditingkatkan

Meskipun manfaat ini mungkin tidak segera terlihat, bukti konsep yang berhasil dapat meningkatkan pengalaman pengguna secara keseluruhan, memungkinkan tim untuk lebih memahami dan mempersonalisasi perjalanan pelanggan melalui analisis yang lebih holistik.

Skalabilitas

Manajemen data dapat membantu bisnis berkembang, tetapi ini sangat tergantung pada teknologi dan proses yang ada. Sebagai contoh, platform cloud memungkinkan fleksibilitas yang lebih besar, sehingga pemilik data dapat meningkatkan atau menurunkan daya komputasi mereka sesuai kebutuhan.

Komponen manajemen data baru

Selama dekade terakhir, perkembangan dalam hybrid cloud, kecerdasan buatan, Internet of Things (IoT) dan komputasi edge telah menyebabkan pertumbuhan eksponensial big data, menciptakan kompleksitas yang lebih besar bagi perusahaan untuk dikelola. Komponen baru terus meningkatkan kemampuan manajemen data. Berikut adalah beberapa yang terbaru:

Manajemen data yang ditambah

Untuk lebih meningkatkan kemampuan manajemen data, manajemen data yang ditingkatkan menjadi semakin populer. Ini adalah cabang dari augmented intelligence, didukung oleh teknologi kognitif, yang meliputi AI, ML, otomatisasi data, data fabric, dan data mesh. Manfaat otomatisasi ini termasuk memungkinkan pemilik data untuk membuat produk data seperti katalog aset data, dengan kemampuan untuk mencari dan menemukan produk data, dan kueri visual dan produk data dengan menggunakan API. Selain itu, insight dari metadata data fabric dapat membantu mengotomatisasi tugas dengan belajar dari pola sebagai bagian dari proses pembuatan produk data atau sebagai bagian dari proses manajemen data untuk memantau produk data.

AI Generatif

Penyimpanan data untuk AI generatif seperti IBM® watsonx.data™ dapat membantu organisasi menyatukan, mengkurasi, dan menyiapkan data secara efisien untuk model AI dan aplikasi. Kemampuan penyematan yang terpadu dan tervektorisasi memungkinkan contoh penggunaan generasi dengan dukungan pengambilan data (RAG) dalam skala besar di seluruh rangkaian data besar yang tepercaya dan tertata.

Penerapan hybrid cloud

Untuk menyederhanakan konektivitas dan keamanan aplikasi di seluruh platform, klaster, dan cloud, penerapan hybrid cloud dapat membantu. Aplikasi dapat dengan mudah diterapkan dan dipindahkan antar lingkungan karena kontainer dan object storage telah membuat komputasi dan data portabel.

Lapisan semantik

Untuk mempercepat akses data dan membuka insight data baru tanpa SQL, organisasi membuat lapisan semantik yang dapat disematkan dan didukung AI. Ini adalah lapisan metadata dan abstraksi yang dibangun di atas data sumber organisasi, seperti data lake atau gudang. Metadata dapat memperkaya model data yang digunakan dan juga cukup jelas bagi pengguna bisnis untuk memahami.

Lapisan metadata bersama

Organisasi dapat mengakses data di seluruh hybrid cloud dengan menghubungkan lingkungan penyimpanan dan analitik. Akses ini dapat melalui satu titik masuk dengan lapisan metadata bersama di awan dan lingkungan lokal. Beberapa mesin kueri dapat digunakan untuk mengoptimalkan analitik dan beban kerja AI.

Membuat lapisan metadata bersama di data lakehouse untuk membuat katalog dan berbagi data adalah praktik terbaik. Hal ini mempercepat penemuan dan pengayaan, analisis data di berbagai sumber, menjalankan berbagai beban kerja dan contoh penggunaan.

Selain itu, alat manajemen metadata bersama mempercepat pengelolaan objek dalam repositori bersama. Dapat digunakan untuk menambah sistem host baru, menambah basis data atau berkas data baru, atau menambah skema baru, selain menghapus item dari repositori bersama.

IBM dinobatkan sebagai Pemimpin dalam Integrasi iPaaS, Forrester Wave Q3 2025

Baca laporan untuk mengetahui mengapa Forrester menempatkan IBM sebagai Pemimpin dengan skor tertinggi dalam kategori Penawaran Terkini. Pelajari bagaimana kepemimpinan ini memperkuat IBM WebMethods MFT dengan memberikan transfer file yang aman dan dapat diskalakan dalam strategi integrasi perusahaan yang lebih luas.

Poster AI Value Creators dengan bunglon di atas tongkat

Unduh buku elektronik AI Value Creators

Sumber daya

Mengelola data untuk AI dan analitik dalam skala besar

Pelajari bagaimana pendekatan data lakehouse terbuka dapat memberikan data yang dapat dipercaya, serta mempercepat analitik dan eksekusi proyek AI.

Gartner Magic Quadrant 2024 untuk Alat Integrasi Data

IBM dinobatkan sebagai Pemimpin selama 19 tahun berturut-turut dalam Gartner Magic Quadrant 2024 untuk Alat Integrasi Data.

Pembeda data

Jelajahi panduan pemimpin data untuk membangun organisasi berbasis data dan mendorong keunggulan bisnis.

Tingkatkan adopsi AI dengan data yang siap AI

Temukan mengapa kecerdasan data yang didukung AI dan integrasi data sangat penting untuk mendorong kesiapan data terstruktur dan tidak terstruktur, serta mempercepat hasil AI.

Hybrid, buka data lakehouse untuk AI

Sederhanakan akses data dan otomatiskan tata kelola data. Temukan kekuatan mengintegrasikan strategi data lakehouse ke dalam arsitektur data Anda, termasuk mengoptimalkan biaya beban kerja Anda dan menskalakan AI dan analitik dengan semua data Anda, di mana saja.

Publikasi manajemen data IBM Research

Jelajahi cara IBM Research secara berkala diintegrasikan ke dalam fitur-fitur baru untuk IBM Cloud Pak for Data.

Gartner predicts 2024: How AI will impact analytics users

Dapatkan insight unik tentang lingkungan solusi ABI yang terus berkembang dengan menyoroti temuan utama, asumsi, dan rekomendasi bagi para pemimpin data dan analitik.

Solusi terkait

Perangkat lunak dan solusi manajemen data

Rancang strategi data yang menghilangkan silo data, mengurangi kompleksitas, dan meningkatkan kualitas data untuk pengalaman pelanggan dan karyawan yang luar biasa.

Jelajahi solusi manajemen data

IBM watsonx.data™

watsonx.data memungkinkan Anda untuk menskalakan analitik dan AI dengan semua data Anda, di mana pun data berada, melalui penyimpanan data yang terbuka, hybrid, dan diatur.

Temukan watsonx.data

Layanan konsultasi data dan analitik

Dapatkan nilai data perusahaan dengan IBM Consulting, untuk membangun organisasi berbasis insight yang memberikan keuntungan bisnis.

Temukan layanan analitik

Ambil langkah selanjutnya

Rancang strategi data yang menghilangkan silo data, mengurangi kompleksitas, dan meningkatkan kualitas data untuk pengalaman pelanggan dan karyawan yang luar biasa.

Catatan kaki

1 Wire19.com: “Ways to ensure that your data is AI-ready”, 14 Juni 2024
2 Gartner: "Strategic Roadmap for Migrating Data Management Solutions to the Cloud", 27 September 2023