Apa itu data?

Rendering 3D dari berbagai bentuk

Penyusun

Annie Badman

Staff Writer

IBM Think

Matthew Kosinski

Staff Editor

IBM Think

Apa itu data?

Data adalah kumpulan fakta, angka, kata-kata, pengamatan atau informasi berguna lainnya. Melalui pemrosesan data dan analisis data, organisasi mengubah titik data mentah menjadi insight berharga yang meningkatkan pengambilan keputusan dan mendorong hasil bisnis yang lebih baik.

Organisasi mengumpulkan data dari berbagai sumber dan dalam berbagai format, termasuk data kualitatif non-numerik (seperti ulasan pelanggan) dan data kuantitatif numerik (seperti angka penjualan). Contoh lain dari data adalah data publik, seperti statistik pemerintah dan catatan sensus, dan data pribadi, seperti riwayat pembelian pelanggan atau catatan perawatan kesehatan seseorang.

Selama dekade terakhir, big data—kumpulan data besar dan kompleks dari berbagai sumber seperti media sosial, e-commerce, dan transaksi keuangan—telah menjadi pendorong utama transformasi digital di berbagai industri. Faktanya, big data telah mendapatkan julukan “minyak baru” karena nilainya sebagai pemangku pertumbuhan dan inovasi bisnis.

Dalam beberapa tahun terakhir, kebangkitan kecerdasan buatan (AI) semakin meningkatkan fokus pada data. Organisasi membutuhkan data untuk melatih model (ML) dan menyempurnakan algoritma prediktif. Semakin banyak data berkualitas tinggi yang dianalisis oleh sistem AI ini, semakin akurat dan efektif jadinya.

Dengan meningkatnya volume, kompleksitas, dan nilai data, organisasi memerlukan manajemen data yang efektif agar informasi tetap terstruktur dan mudah diakses untuk analisis data.

Meningkatnya kekhawatiran tentang keamanan data dan privasi—baik dari pengguna maupun regulator—menegaskan pentingnya perlindungan data serta kepatuhan terhadap peraturan seperti Peraturan Perlindungan Data Umum (GDPR) dan California Consumer Privacy Act (CCPA).

Jenis data

Data memiliki berbagai bentuk, masing-masing dengan karakteristik, sumber, dan format yang unik. Memahami perbedaan ini membantu dalam pengorganisasian dan analisis data yang lebih efektif, karena setiap jenis data mendukung contoh penggunaan yang berbeda.

Selanjutnya, satu titik data atau kumpulan data dapat jatuh dalam beberapa kategori. Misalnya, terstruktur dan kuantitatif, tidak terstruktur, kualitatif dan sebagainya.

Beberapa jenis data yang paling umum meliputi:

  • Data kuantitatif
  • Data kualitatif

  • Data terstruktur

  • Data tidak terstruktur

  • Data semi-terstruktur

  • Metadata

  • Big data

Data kuantitatif

Data kuantitatif adalah data yang dapat diukur secara numerik. Contoh data kuantitatif termasuk data diskrit (seperti jumlah produk terjual) dan data kontinu (seperti suhu atau pendapatan).

Data kuantitatif sering terstruktur, sehingga mudah untuk menganalisis menggunakan alat matematika dan algoritma.

Contoh umum penggunaan data kuantitatif meliputi peramalan tren, analisis statistik, penganggaran, identifikasi pola, dan evaluasi kinerja.

Data kualitatif

Data kualitatif bersifat deskriptif dan non-numerik, menangkap karakteristik, konsep, atau pengalaman yang tidak dapat diukur dengan angka. Contohnya termasuk masukan pelanggan, ulasan produk, dan komentar media sosial.

Data kualitatif dapat terstruktur (seperti tanggapan survei berkode) atau tidak terstruktur (seperti tanggapan teks bebas atau transkrip wawancara).

Contoh penggunaan umum untuk data kualitatif termasuk memahami perilaku pelanggan, tren pasar, dan pengalaman.

Data terstruktur

Data terstruktur disusun dalam format yang jelas dan terdefinisi, biasanya disimpan dalam basis data relasional atau lembar kerja. Data ini dapat berupa data kuantitatif (seperti angka penjualan) maupun data kualitatif (seperti label kategori “yes” atau “no”).

Contoh data terstruktur meliputi catatan pelanggan dan laporan keuangan, yang disimpan dalam format baris dan kolom dengan bidang yang sudah ditentukan.

Data terstruktur yang sangat terorganisir memungkinkan pengajuan pertanyaan dan analisis data dengan cepat, menjadikannya ideal untuk sistem intelijen bisnis dan proses pelaporan.

Data tidak terstruktur

Data tidak terstruktur tidak memiliki format yang ditentukan secara ketat. Seringnya dalam bentuk kompleks seperti dokumen teks, gambar dan video. Data tidak terstruktur dapat mencakup informasi kualitatif (seperti komentar pelanggan) dan elemen kuantitatif (seperti nilai numerik yang disematkan dalam teks).

Contoh data tidak terstruktur termasuk email, konten media sosial, dan file multimedia.

Data tidak terstruktur tidak mudah masuk ke dalam database relasional tradisional, dan organisasi sering menggunakan teknik seperti pemrosesan bahasa alami (NLP) dan machine learning untuk merampingkan analisis data tidak terstruktur.

Data tidak terstruktur sering berperan penting dalam analisis sentimen, identifikasi pola kompleks, dan berbagai proyek analitik tingkat lanjut.

Data semi-terstruktur

Data semi-terstruktur menggabungkan elemen dari data terstruktur dan tidak terstruktur. Meskipun tidak memiliki format yang kaku, data ini sering kali menggunakan tag atau penanda yang mempermudah pengorganisasian dan analisis. Contohnya termasuk file XML dan objek JSON.

Data semi-terstruktur banyak digunakan dalam skenario seperti web scraping dan proyek integrasi data karena menawarkan fleksibilitas sekaligus mempertahankan struktur yang memungkinkan pencarian dan analisis.

Metadata

Metadata adalah data tentang data. Dengan kata lain, metadata adalah informasi yang mendeskripsikan atribut suatu titik data atau kumpulan data, seperti nama file, penulis, tanggal pembuatan, dan tipe data.

Metadata membantu meningkatkan pengorganisasian, pencarian, dan pengelolaan data. Perannya sangat penting dalam sistem seperti basis data, perpustakaan digital, dan platform manajemen konten, karena memudahkan pengguna dalam mengurutkan dan menemukan data yang diperlukan.

Big data

Big data mengacu pada kumpulan data besar dan kompleks yang tidak dapat ditangani oleh sistem tradisional. Big data mencakup data terstruktur dan tidak terstruktur dari sumber seperti sensor, media sosial, dan transaksi.

Analisis data besar membantu organisasi memproses dan menganalisis kumpulan data besar ini untuk secara sistematis mengekstrak insight berharga. Sering kali membutuhkan alat canggih seperti machine learning.

Contoh penggunaan umum untuk big data mencakup analisis perilaku pelanggan, deteksi penipuan, dan pemeliharaan prediktif.

Mengapa data itu penting

Data memungkinkan organisasi mengubah informasi mentah menjadi insight yang dapat ditindaklanjuti untuk memprediksi perilaku pelanggan, mengoptimalkan rantai pasokan, dan mendorong inovasi.

Istilah "data" berasal dari bentuk jamak dari "datum", kata Latin yang berarti "sesuatu yang diberikan": definisi yang masih tetap relevan hingga saat ini. Setiap hari, jutaan orang memberikan data kepada bisnis melalui interaksi seperti tayangan, klik, transaksi, pembacaan sensor, atau bahkan sekadar menjelajah online. 

Organisasi di seluruh industri kemudian dapat menggunakan aliran informasi yang konstan ini untuk mendorong pertumbuhan dan inovasi. Misalnya, pengecer e-commerce menganalisis kumpulan data besar untuk memprediksi permintaan, sehingga dapat menyediakan produk yang tepat pada waktu yang tepat.

Demikian pula, platform streaming berbasis data memanfaatkan algoritma machine learning tidak hanya untuk merekomendasikan konten, tetapi juga untuk mengoptimalkannya, menganalisis adegan yang paling berkesan bagi pemirsa guna memberikan informasi bagi keputusan produksi di masa depan.

Di era kecerdasan buatan (AI), data menjadi semakin penting karena model machine learning memerlukan kumpulan data yang besar dan berkualitas tinggi untuk dilatih. (Lihat “Peran Data dalam kecerdasan buatan (AI)” untuk informasi lebih lanjut.)

Selain itu, kemampuan pemrosesan data real-time AI sangat penting di berbagai bidang seperti keamanan siber, di mana analisis data yang cepat mengidentifikasi ancaman sebelum meningkat; perdagangan keuangan, di mana keputusan sepersekian detik berdampak pada keuntungan; dan edge computing, di mana menangani data lebih dekat ke sumbernya menghasilkan insight yang lebih cepat, pengambilan keputusan yang lebih cepat, dan bandwidth yang lebih baik.

Perempuan kulit hitam yang bekerja di laptop

Tetap terdepan dengan berita teknologi terbaru

Insight mingguan, penelitian, dan pandangan pakar tentang AI, keamanan, cloud, dan lebih banyak di Buletin Think.

Bagaimana data digunakan?

Organisasi di berbagai industri memanfaatkan data untuk meningkatkan pengambilan keputusan, mengoptimalkan operasi, dan mendorong inovasi.

Cara umum organisasi menggunakan data dalam operasi meliputi:

  • Analisis prediktif

  • AI Generatif

  • Inovasi layanan kesehatan

  • Penelitian ilmu sosial

  • Keamanan siber dan manajemen risiko

  • Efisiensi Operasional

  • Pengalaman pelanggan

  • Inisiatif pemerintah

  • Intelijen bisnis (BI)

Analisis prediktif

Analisis prediktif adalah cabang dari analisis lanjutan yang memprediksi tren dan hasil di masa depan menggunakan data historis yang dikombinasikan dengan pemodelan statistik, penggalian data, dan machine learning.

Perusahaan e-commerce menggunakan analisis prediktif untuk memprediksi perilaku pembelian pelanggan berdasarkan riwayat transaksi mereka. Dalam manufaktur dan transportasi, analisis prediktif digunakan untuk pemeliharaan preventif dengan menganalisis data mesin secara real-time. Hal ini memungkinkan prediksi kegagalan peralatan dan rekomendasi pemeliharaan sebelum kerusakan terjadi.

AI Generatif

AI generatif, terkadang disebut gen AI, adalah kecerdasan buatan (AI) yang dapat membuat konten orisinal, seperti teks, gambar, video, audio, atau kode perangkat lunak, sebagai tanggapan atas prompt atau permintaan pengguna.

AI generatif bergantung pada model machine learning canggih yang disebut model pembelajaran mendalam. Model ini dilatih dengan kumpulan data besar, memungkinkan mereka memahami permintaan pengguna, menghasilkan konten pemasaran yang dipersonalisasi, dan menulis kode.

Inovasi layanan kesehatan

Analisis data memungkinkan penyedia layanan kesehatan meningkatkan kualitas perawatan pasien, memprediksi wabah penyakit, dan mengoptimalkan protokol pengobatan.

Contohnya, pemantauan pasien menggunakan data deret waktu, seperti melacak perubahan tanda-tanda vital secara berkala, dapat memberikan insight real-time tentang kondisi pasien. Ini, pada gilirannya, memungkinkan intervensi yang lebih cepat dan perawatan yang lebih personal.

Penelitian ilmu sosial

Peneliti ilmu sosial sering menganalisis data kuantitatif dan kualitatif dari survei, laporan sensus, dan media sosial. Dengan meneliti data ini, mereka dapat memahami perilaku, mengidentifikasi tren, dan mengevaluasi dampak kebijakan.

Misalnya, peneliti dapat menggunakan data sensus untuk melacak perubahan populasi, tanggapan survei untuk mengukur opini publik, dan data media sosial untuk menganalisis tren yang sedang berkembang.

Keamanan siber dan manajemen risiko

Dengan meningkatnya serangan siber dan pelanggaran data, organisasi semakin mengandalkan analisis data untuk mendeteksi dan merespons ancaman lebih cepat, mengurangi kerusakan, serta meminimalkan waktu henti.

Misalnya, sistem Informasi Keamanan dan Manajemen Peristiwa (SIEM) dapat mendeteksi dan merespons anomali secara real-time dengan mengumpulkan serta menganalisis peringatan keamanan dari seluruh jaringan.

Efisiensi Operasional

Algoritma machine learning, dilatih pada kumpulan data yang luas, dapat membantu organisasi meningkatkan efisiensi operasional dengan mengoptimalkan logistik, memprediksi permintaan, meningkatkan penjadwalan, dan mengotomatiskan alur kerja.

Misalnya, perusahaan e-commerce secara real-time mengumpulkan dan menganalisis data penjualan untuk mengoptimalkan manajemen inventaris, sehingga dapat mencegah kehabisan atau kelebihan stok.

Pengalaman pelanggan

Data adalah tulang punggung pengalaman pelanggan yang dipersonalisasi, terutama dalam pemasaran, di mana organisasi dapat menggunakan analisis data untuk menyesuaikan konten dan iklan untuk pengguna yang berbeda.

Misalnya, layanan streaming mengandalkan machine learning untuk menganalisis kebiasaan menonton dan merekomendasikan konten.

Inisiatif pemerintah

Pemerintah di seluruh dunia sering menerapkan kebijakan data terbuka untuk menyediakan akses publik ke kumpulan data berharga, sehingga mendorong bisnis dan organisasi memanfaatkan data tersebut untuk keperluan penelitian dan inovasi.

Misalnya, Data.govpemerintah AS Platform menyediakan akses ke berbagai kumpulan data di seluruh perawatan kesehatan, pendidikan, dan transportasi. Akses ini meningkatkan transparansi dan memungkinkan bisnis di berbagai industri mengembangkan solusi berbasis data dari informasi yang tersedia secara publik.

Intelijen bisnis (BI)

Business Intelligence (BI) adalah serangkaian proses teknologi yang digunakan untuk mengumpulkan, mengelola, dan menganalisis data. Proses ini mengubah data mentah menjadi insight yang dapat mendukung pengambilan keputusan bisnis.

Analitik bisnis melengkapi BI dengan memungkinkan organisasi menafsirkan dan memvisualisasikan data melalui grafik, dasbor, dan laporan, sehingga mempermudah identifikasi tren dan pengambilan keputusan yang lebih tepat.

Pengumpulan data  

Pengumpulan data adalah proses sistematis untuk mengumpulkan data dari berbagai sumber dengan memastikan kualitas dan integritasnya. Biasanya dilakukan oleh ilmuwan data dan analis, proses ini menjadi dasar bagi analisis data yang akurat dan andal.

Pengumpulan data dimulai dengan menetapkan tujuan yang jelas dan mengidentifikasi sumber yang relevan. Data kemudian diperoleh, dibersihkan dan diintegrasikan ke dalam kumpulan data terpadu. Sistempenyimpanan data dan pemeriksaan kualitas yang berkelanjutan membantu memastikan data yang dikumpulkan akurat dan dapat diandalkan.

Tanpa pengumpulan data yang tepat, organisasi berisiko mendasarkan analisis mereka pada data yang tidak lengkap, tidak akurat, atau menyesatkan, yang dapat menghambat insight dan pengambilan keputusan.

Beberapa sumber data umum meliputi:

  • Interaksi media sosial: Data real-time dari platform seperti Twitter dan Facebook dapat digunakan untuk memantau keterlibatan merek, menganalisis opini publik, dan mengidentifikasi sentimen konsumen.
  • Data publik: Kumpulan data yang tersedia secara bebas dari pemerintah dan organisasi, seperti data sensus dan indikator ekonomi, dapat membantu memberikan konteks untuk pergeseran demografi, segmentasi pasar, dan analisis keuangan.
  • Kumpulan data terbuka: Data dari institusi akademis dan pemerintah, seperti perubahan iklim dan informasi geospasial, sering digunakan untuk penelitian dan perumusan kebijakan.
  • Data transaksional: Data dari transaksi bisnis, seperti catatan penjualan, faktur, dan informasi pembayaran, dapat membantu bisnis melacak kinerja, mengoptimalkan harga, dan meningkatkan pengalaman pelanggan.
  • Survei dan kuesioner: Data kualitatif maupun kuantitatif yang dikumpulkan dari masukan pelanggan atau penelitian dapat memberikan insight tentang preferensi, opini, dan tren.
  • Analisis web: Data dari interaksi situs web, seperti jumlah tampilan halaman dan rasio klik-tayang, membantu perusahaan memahami perilaku pengguna, mengoptimalkan konten, dan meningkatkan pengalaman mereka.
  • Perangkat IoT: Data dari perangkat Internet of Things (IoT), seperti meter pintar dan pelacak wearable, dapat mendukung analisis waktu nyata, pemeliharaan prediktif, serta membantu mencegah waktu henti peralatan.

Manajemen data

Organisasi mengelola data dalam berbagai format yang tersebar di cloud publik dan privat, sehingga menghadapi tantangan besar dalam mengatasi fragmentasi data dan mencegah kesalahan pengelolaan.

Menurut IBM Data Differentiator, 82% perusahaan berjuang dengan silo data yang mengganggu alur kerja, dan 68% data tidak dianalisis, membatasi potensi penuhnya.

Manajemen data adalah praktik pengumpulan, pemrosesan, dan penggunaan data secara aman dan efisien untuk hasil bisnis yang lebih baik. Alamat ini menjawab tantangan kritis seperti mengelola kumpulan data yang besar, memecah silo, dan menangani format data yang tidak konsisten.

Solusi manajemen data biasanya terintegrasi dengan infrastruktur yang ada untuk memastikan akses ke data berkualitas tinggi yang dapat dimanfaatkan oleh ilmuwan data, analis, dan pemangku kepentingan lainnya. Solusi ini sering menggabungkan danau data, gudang data, atau data lakehouse, digabungkan dalam struktur data terpadu. 

  • Data lake adalah lingkungan penyimpanan berbiaya rendah yang menampung data mentah dan tidak terstruktur untuk diproses dan dianalisis di kemudian hari.  
  • Gudang data menyimpan data terstruktur dari berbagai sumber dan dioptimalkan untuk penambangan serta analisis data.  
  • Data lakehouses menggabungkan keunggulan gudang data dan danau data, menyediakan solusi terpadu untuk mengelola baik data terstruktur maupun tak terstruktur.

Sistem ini membangun fondasi manajemen data yang kuat dengan memastikan data berkualitas tinggi dapat digunakan dalam alat intelijen bisnis (BI), dasbor, serta model AI, termasuk machine learning (ML) dan AI generatif.

Selain itu, AI mengubah cara organisasi menangani data. Manajemen data AI adalah praktik menggunakan kecerdasan buatan (AI) dan machine learning dalam siklus hidup manajemen data. Contohnya termasuk menggunakan AI untuk otomatisasi atau mempermudah proses pengumpulan data, pembersihan data, analisis data, keamanan data dan proses manajemen data lainnya.

Ilmuwan data dan analis data

Seiring meningkatnya ketergantungan bisnis di berbagai industri pada data untuk pengambilan keputusan, optimasi operasional, dan peningkatan pengalaman pelanggan, permintaan akan profesional data yang terampil pun melonjak.

Dua peran paling penting dalam bidang ilmu data adalah ilmuwan data dan analis data.

  • Ilmuwan data: Ilmuwan data melakukan tugas-tugas data yang kompleks dan mendasar. Misalnya, mereka mengembangkan model dan algoritma untuk menemukan insight dalam kumpulan data besar, sering kali menggunakan teknologi canggih seperti machine learning dan pemodelan prediktif.
  • Analis data: Analis data berfokus pada tugas-tugas yang lebih langsung dan praktis. Mereka menggunakan statistik untuk menganalisis data dan menjawab pertanyaan bisnis yang spesifik. Tujuan utama mereka adalah menemukan insight yang berguna yang membantu dalam pengambilan keputusan dan strategi sehari-hari.

Kedua peran mencakup pengumpulan data, pemodelan data, analisis data, dan memastikan data berkualitas tinggi. Analis dan ilmuwan sama-sama dapat menggunakan berbagai metodologi dan alat untuk memperebutkan dan menyiapkan data, termasuk Microsoft Excel, Python, dan bahasa kueri terstruktur (SQL).

Mereka mungkin juga menggunakan teknik visualisasi data, seperti dasbor dan grafik, untuk membantu menemukan tren, korelasi, dan insight dalam data, meskipun dengan cara yang berbeda.

Misalnya, seorang ilmuwan data dapat menggunakan machine learning untuk mengembangkan model prediktif yang memperkirakan perilaku pelanggan di masa depan. Model ini membantu perusahaan mengantisipasi tren, menyesuaikan kampanye pemasaran, dan membuat keputusan strategis jangka panjang yang lebih akurat. 

Sebagai perbandingan, seorang analis data pada proyek yang sama dapat menggunakan alat visualisasi untuk membuat dasbor yang menunjukkan pola perilaku pelanggan dari waktu ke waktu. Kemampuan untuk memetakan tren penjualan historis di samping metrik keterlibatan ini dapat membantu tim mengoptimalkan strategi pemasaran saat ini atau menyesuaikan penawaran produk untuk meningkatkan keuntungan.

Perlindungan data

Perlindungan data adalah upaya untuk menjaga informasi sensitif dari kehilangan, pencurian, dan kerusakan. Pentingnya perlindungan data terus meningkat seiring dengan semakin besarnya volume data sensitif yang dikelola oleh organisasi di lingkungan yang kompleks dan terdistribusi.

Meningkatnya risiko ancaman siber dan peraturan privasi data yang lebih ketat juga menjadikan perlindungan data sebagai prioritas bagi bisnis dan konsumen. Menurut sebuah studi baru-baru ini, 81% orang Amerika khawatir tentang bagaimana perusahaan menggunakan data yang dikumpulkan tentang mereka.1

Ada juga kasus bisnis yang kuat yang harus dibuat untuk memprioritaskan perlindungan data. Rata-rata pelanggaran data merugikan organisasi sebesar USD 4,88 juta antara kehilangan bisnis, waktu henti sistem, kerusakan reputasi, dan upaya respons, menurut Laporan Biaya Pelanggaran Data

Keamanan data dan privasi data

Perlindungan data memiliki 2 subbidang penting: keamanan data dan privasi data. Keduanya memiliki peran yang berbeda, namun saling mendukung dalam menjaga dan mengelola data.

Keamanan data melibatkan perlindungan informasi digital dari akses yang tidak sah, korupsi, atau pencurian. Ini mencakup berbagai aspek keamanan informasi, yang mencakup physical security, kebijakan organisasi, dan kontrol akses.

Privasi data berfokus pada kebijakan yang mendukung prinsip umum bahwa seseorang harus memiliki kendali atas data pribadi mereka, termasuk kemampuan untuk memutuskan cara organisasi mengumpulkan, menyimpan, dan menggunakan data mereka.

Kerentanan data

Data semakin rentan terhadap berbagai ancaman siber, terutama dengan kemajuan teknologi AI.

Beberapa ancaman yang paling umum meliputi:

  • Ancaman dari orang dalam: Karyawan atau kontraktor dengan akses resmi dapat menjadi risiko signifikan. Menurut Laporan Biaya Pelanggaran Data, pelanggaran yang disengaja oleh orang dalam yang jahat menimbulkan kerugian rata-rata sebesar 4,99 juta USD.
  • Rekayasa sosial: Pelaku ancaman sering memanfaatkan serangan seperti phishing untuk mengeksploitasi kelemahan manusia dan menipu korban agar membocorkan informasi sensitif. Alat AI generatif kini mampu menghasilkan email phishing yang sangat meyakinkan, sehingga meningkatkan efektivitas serangan.
  • Ransomware: Penjahat siber menggunakan ransomware untuk mengenkripsi data organisasi dan meminta tebusan sebagai imbalan atas kunci dekripsi. Sistem perawatan kesehatan, lembaga keuangan, dan lembaga data pemerintah sangat rentan terhadap serangan ini.
  • Keamanan cloud: Dengan adopsi layanan cloud yang meluas, kesalahan konfigurasi, API yang tidak aman, dan kontrol akses yang buruk dapat menyebabkan kebocoran data publik. Menurut Laporan Biaya Pelanggaran Data, pelanggaran data yang melibatkan cloud publik adalah yang paling mahal, dengan biaya rata-rata USD 5,17 juta.

Solusi perlindungan data

Organisasi menggunakan berbagai teknologi perlindungan data untuk mempertahankan diri dari pelaku ancaman dan membantu memastikan integritas, kerahasiaan, dan ketersediaan data.

Beberapa solusi paling populer meliputi:

  • Pencadangan data secara rutin membuat dan menyimpan salinan data penting, memungkinkan pemulihan cepat saat terjadi kehilangan atau kerusakan, sekaligus meminimalkan waktu henti.
  • Firewall memantau dan mengontrol lalu lintas jaringan, berfungsi sebagai pertahanan pertama untuk mencegah akses yang tidak sah.
  • Manajemen identitas dan akses (IAM) mengontrol bagaimana pengguna mengakses sumber daya digital serta tindakan yang dapat mereka lakukan, guna mencegah akses tidak sah dan mengurangi risiko ancaman dari dalam.
  • Alat antivirus dan anti-malware deteksi, mencegah, dan menghapus perangkat lunak berbahaya seperti virus, spyware, dan ransomware yang dapat membahayakan data.
  • Alat pencegahan kehilangan data (DLP) memantau aktivitas pengguna dan mendeteksi perilaku mencurigakan untuk mencegah akses, pengiriman, atau kebocoran informasi sensitif secara tidak sah.

Peran data dalam kecerdasan buatan (AI)

Sebanyak 72% CEO berkinerja terbaik setuju bahwa keunggulan kompetitif bergantung pada siapa yang memiliki AI generatif paling canggih. Namun, memiliki AI mutakhir hanyalah bagian dari persamaan. Tanpa data yang dikelola dan dapat diakses dengan baik, bahkan alat AI yang paling kuat pun tidak dapat mencapai potensi penuhnya.

Data adalah fondasi untuk kemajuan dan keberhasilan kecerdasan buatan. Sistem AI, khususnya model machine learning, bergantung pada data untuk belajar, beradaptasi, dan memberikan nilai di seluruh industri.

Kualitas dan bias data

Model machine learning dilatih dengan kumpulan data besar untuk mengenali pola dan membuat keputusan berdasarkan data tersebut.

Keberagaman dan kualitas data dalam pelatihan model AI secara langsung memengaruhi kinerjanya. Jika data yang digunakan bias atau tidak lengkap, hasil yang dihasilkan AI bisa menjadi tidak akurat dan tidak dapat diandalkan.

Misalnya, dalam dunia kesehatan, model AI yang dilatih dengan data bias mungkin tidak cukup akurat dalam menganalisis kelompok ras tertentu, sehingga dapat menghasilkan diagnosis yang kurang tepat. Demikian pula, dalam perekrutan, data yang tidak akurat dapat menghasilkan prediksi keliru, memperkuat stereotip gender atau ras, dan membuat model AI cenderung memihak kelompok demografis tertentu.

Singkatnya, AI hanya sebagus data yang diprosesnya.

Memastikan input berkualitas tinggi melalui validasi dan pembersihan data yang komprehensif sangat penting untuk membangun sistem AI yang etis dan andal yang dapat menghindari bias.

AI generatif dan kerentanan data

Meskipun AI generatif dapat menciptakan konten yang berharga, ia juga menghadirkan tantangan baru. Model AI dapat menghasilkan data yang palsu atau menyesatkan, yang berpotensi dimanfaatkan oleh penyerang untuk mengeksploitasi sistem atau individu.

Keaslian dan keamanan data menjadi perhatian yang berkembang. Laporan terkini menemukan bahwa 75% profesional senior keamanan siber melihat makin banyak serangan siber, dengan 85% mengaitkan peningkatan tersebut dengan pelaku kejahatan yang menggunakan AI generatif.2

Untuk menghadapi ancaman ini, banyak organisasi beralih ke keamanan AI, memanfaatkan AI untuk mengotomatiskan deteksi, pencegahan, dan respons, serta memperkuat perlindungan data.

Catatan kaki

Semua tautan berada di luar ibm.com

1  How Americans View Data Privacy, Pew Research Center, 18 Oktober 2023. 

2 AI advances risk facilitating cyber crime, top US officials say, Reuters, 9 Januari 2024. 

Solusi terkait
Alat dan solusi analitik

Untuk berkembang, perusahaan harus menggunakan data untuk membangun loyalitas pelanggan, mengotomatiskan proses bisnis, dan berinovasi dengan solusi yang didorong oleh AI.

Jelajahi solusi analitik
Layanan konsultasi data dan analitik

Buka nilai data perusahaan dengan IBM Consulting, membangun organisasi berbasis insight yang memberikan keuntungan bisnis.

Temukan layanan analitik
IBM Cognos Analytics

Memperkenalkan Cognos Analytics 12.0, wawasan yang didukung AI untuk pengambilan keputusan yang lebih baik.

Jelajahi Cognos Analytics
Ambil langkah selanjutnya

Untuk berkembang, perusahaan harus menggunakan data untuk membangun loyalitas pelanggan, mengotomatiskan proses bisnis, dan berinovasi dengan solusi yang didorong oleh AI.

Jelajahi solusi analitik Temukan layanan analitik