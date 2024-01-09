Munculnya AI generatif mendorong beberapa perusahaan terkemuka untuk membatasi penggunaannya karena kesalahan penanganan data internal yang sensitif. Menurut CNN, beberapa perusahaan memberlakukan larangan internal pada alat AI generatif sementara mereka berusaha untuk lebih memahami teknologi ini dan banyak juga yang memblokir penggunaan ChatGPT internal.
Perusahaan masih sering menerima risiko penggunaan data internal ketika menjelajahi model bahasa besar (LLM) karena data kontekstual inilah yang memungkinkan LLM untuk berubah dari tujuan umum menjadi pengetahuan khusus domain. Dalam AI generatif atau siklus pengembangan AI tradisional, konsumsi data berfungsi sebagai titik masuk. Di sini, data mentah yang disesuaikan dengan kebutuhan perusahaan dapat dikumpulkan, diproses sebelumnya, disamarkan, dan diubah ke dalam format yang sesuai untuk LLM atau model lainnya. Saat ini, tidak ada proses standar yang tersedia untuk mengatasi tantangan konsumsi data, tetapi akurasi model bergantung pada proses tersebut.
Buletin industri
Ikuti perkembangan tren industri yang paling penting—dan menarik—di bidang AI, otomatisasi, data, dan lainnya dengan buletin Think. Lihat Pernyataan Privasi IBM.
Langganan Anda akan disediakan dalam bahasa Inggris. Anda akan menemukan tautan berhenti berlangganan di setiap buletin. Anda dapat mengelola langganan atau berhenti berlangganan di sini. Lihat Pernyataan Privasi IBM kami untuk informasi lebih lanjut.
Penyerapan data harus dilakukan dengan benar sejak awal, karena salah penanganan dapat menyebabkan sejumlah masalah baru. Pekerjaan dasar pada data pelatihan dalam model AI sebanding dengan mengemudikan pesawat terbang. Jika sudut lepas landas berjarak satu derajat, Anda mungkin mendarat di benua lain yang tidak sesuai harapan.
Seluruh saluran AI generatif bergantung pada saluran data yang memberdayakannya, sehingga sangat penting untuk melakukan tindakan pencegahan yang benar.
IBM DataStage merampingkan integrasi data dengan menggabungkan berbagai alat, memungkinkan Anda untuk dengan mudah menarik, mengatur, mengubah, dan menyimpan data yang diperlukan untuk model pelatihan AI di lingkungan hybrid cloud. Praktisi data dari semua tingkat keahlian dapat menggunakan alat ini dengan menggunakan GUI no-code atau mengakses API dengan kode khusus yang dipandu.
Opsi waktu proses jarak jauh DataStage sebagai Layanan Di Mana Saja yang baru ini memberikan fleksibilitas untuk mengeksekusi transformasi data Anda. Ini memberdayakan Anda untuk menggunakan mesin paralel dari mana saja, memberi Anda kontrol atas lokasinya yang belum pernah ada sebelumnya. DataStage sebagai Layanan Di Mana Saja berbentuk kontainer ringan, sehingga Anda dapat menjalankan semua kemampuan transformasi data di lingkungan apa pun. Hal ini memungkinkan Anda untuk menghindari banyak jebakan dari penyerapan data yang buruk saat Anda menjalankan integrasi, pembersihan, dan prapemrosesan data dalam cloud pribadi virtual Anda. Dengan DataStage, Anda mempertahankan kontrol penuh atas keamanan, kualitas data, dan kemanjuran, menangani semua kebutuhan data Anda untuk inisiatif AI generatif.
Meskipun hampir tidak ada batasan pada apa yang dapat dicapai dengan AI generatif, ada batasan pada data yang digunakan model—dan data itu juga dapat membuat semua perbedaan.
Pelajari bagaimana pendekatan data lakehouse terbuka dapat memberikan data yang dapat dipercaya, serta mempercepat analitik dan eksekusi proyek AI.
IBM dinobatkan sebagai Pemimpin selama 19 tahun berturut-turut dalam Gartner Magic Quadrant 2024 untuk Alat Integrasi Data.
Jelajahi panduan pemimpin data untuk membangun organisasi berbasis data dan mendorong keunggulan bisnis.
Temukan mengapa kecerdasan data yang didukung AI dan integrasi data sangat penting untuk mendorong kesiapan data terstruktur dan tidak terstruktur, serta mempercepat hasil AI.
Sederhanakan akses data dan otomatiskan tata kelola data. Temukan kekuatan mengintegrasikan strategi data lakehouse ke dalam arsitektur data Anda, termasuk mengoptimalkan biaya beban kerja Anda dan menskalakan AI dan analitik dengan semua data Anda, di mana saja.
Jelajahi cara IBM Research secara berkala diintegrasikan ke dalam fitur-fitur baru untuk IBM Cloud Pak for Data.
Buat dan kelola pipeline data streaming cerdas melalui antarmuka grafis yang intuitif, yang memfasilitasi integrasi data tanpa batas di seluruh lingkungan hybrid dan multicloud.
watsonx.data memungkinkan Anda untuk menskalakan analitik dan AI dengan semua data Anda, di mana pun data berada, melalui penyimpanan data yang terbuka, hybrid, dan diatur.
Buka nilai data perusahaan dengan IBM Consulting, membangun organisasi berbasis insight yang memberikan keuntungan bisnis.
Rancang strategi data yang menghilangkan silo data, mengurangi kompleksitas, dan meningkatkan kualitas data untuk pengalaman pelanggan dan karyawan yang luar biasa.