Menurut penelitian dari IBM, sekitar 42% perusahaan yang disurvei memiliki AI yang digunakan dalam bisnis mereka. Dari semua contoh penggunaan, banyak dari kita sekarang sangat akrab dengan chatbot AI pemrosesan bahasa alami yang dapat menjawab pertanyaan kita dan membantu tugas-tugas seperti menulis email atau esai. Namun bahkan dengan adopsi chatbot ini secara meluas, perusahaan terkadang masih mengalami beberapa tantangan. Misalnya, chatbot ini dapat menghasilkan Hasil yang tidak konsisten karena mereka menarik dari toko data besar yang mungkin tidak relevan dengan kueri yang ada.
Untungnya, Generasi dengan dukungan pengambilan data (RAG) telah muncul sebagai solusi yang menjanjikan untuk mendasarkan model bahasa besar (LLM) pada informasi yang paling akurat dan terkini. Sebagai kerangka kerja AI, RAG bekerja untuk meningkatkan kualitas respons yang dihasilkan LLM dengan mendasarkan model pada sumber pengetahuan untuk melengkapi representasi informasi internal LLM. IBM meluncurkan portofolio produk AI barunya, watsonx™, yang menawarkan RAG, pada Mei 2023.
Secara sederhana, memanfaatkan RAG seperti membuat model mengikuti ujian buku terbuka saat Anda meminta chatbot untuk menanggapi pertanyaan dengan semua informasi yang tersedia. Tetapi bagaimana RAG beroperasi pada tingkat infrastruktur? Dengan campuran layanan platform-as-a-service (PaaS), RAG dapat berjalan dengan sukses dan mudah, memungkinkan hasil AI generatif untuk organisasi di seluruh industri yang menggunakan LLM.
AI kelas enterprise, termasuk AI generatif, membutuhkan infrastruktur terdistribusi yang sangat berkelanjutan dengan komputasi dan padat data. Meskipun AI adalah komponen utama dari kerangka kerja RAG, “bahan“ lain seperti solusi PaaS merupakan bagian yang tidak terpisahkan dari campuran tersebut. Penawaran ini, khususnya penawaran tanpa server dan penyimpanan, beroperasi dengan rajin di belakang layar, memungkinkan data diproses dan disimpan dengan lebih mudah, yang memberikan output yang semakin akurat dari chatbot.
Teknologi tanpa server mendukung beban kerja intensif komputasi, seperti yang dilakukan oleh RAG, dengan mengelola dan mengamankan infrastruktur di sekelilingnya. Solusi ini memberi waktu kembali kepada pengembang, sehingga mereka dapat berkonsentrasi pada pengodean. Tanpa server memungkinkan pengembang untuk membangun dan menjalankan kode aplikasi tanpa menyediakan atau mengelola server atau infrastruktur backend.
Jika pengembang mengunggah data ke LLM atau chatbot tetapi tidak yakin bagaimana memproses data sehingga dalam format yang tepat atau difilter untuk titik data tertentu, IBM Cloud Code Engine dapat melakukan semua ini untuk mereka—memudahkan proses keseluruhan mendapatkan output yang benar dari model AI. Sebagai platform tanpa server yang dikelola sepenuhnya, IBM Cloud Code Engine dapat menskalakan aplikasi dengan mudah melalui kemampuan otomatisasi yang mengelola dan mengamankan infrastruktur yang mendasarinya.
Selain itu, jika pengembang mengunggah sumber untuk LLM, penting untuk memiliki penyimpanan yang sangat aman, tangguh, dan tahan lama. Hal ini sangat penting terutama dalam industri yang sangat diatur seperti layanan keuangan, perawatan kesehatan, dan telekomunikasi.
IBM Cloud Object Storage, misalnya, menyediakan keamanan dan daya tahan data untuk menyimpan volume data yang besar. Dengan kemampuan kontrol audit dan retensi data yang tidak dapat diubah, IBM Cloud Object Storage mendukung RAG dengan cara membantu melindungi data Anda dari gangguan atau manipulasi oleh serangan ransomware dan membantu memastikannya memenuhi persyaratan kepatuhan dan bisnis.
Dengan tumpukan teknologi IBM yang luas termasuk IBM Code Engine dan Cloud Object Storage, organisasi di seluruh industri dapat dengan lancar memanfaatkan RAG dan fokus pada memanfaatkan AI secara lebih efektif untuk bisnis mereka.
Kami telah menetapkan bahwa RAG sangat berharga untuk memungkinkan hasil AI generatif, tetapi seperti apa hal ini dalam praktiknya?
Blendow Group, penyedia layanan hukum terkemuka di Swedia, menangani beragam dokumen hukum—membedah, meringkas, dan mengevaluasi dokumen-dokumen ini yang berkisar dari putusan pengadilan hingga undang-undang dan hukum kasus. Dengan tim yang relatif kecil, Blendow Group membutuhkan solusi yang dapat diskalakan untuk membantu analisis hukum mereka. Bekerja dengan IBM Client Engineering dan NEXER, Blendow Group menciptakan alat berbasis AI yang inovatif, memanfaatkan kemampuan komprehensif untuk meningkatkan penelitian dan analisis, dan merampingkan proses pembuatan konten legal, sambil menjaga kerahasiaan data sensitif sepenuhnya.
Memanfaatkan berbagai teknologi IBM, termasuk IBM Cloud Object Storage dan IBM Code Engine, solusi AI dirancang untuk meningkatkan efisiensi dan luasnya analisis dokumen hukum Blendow.
Mawson's Huts Foundation juga merupakan contoh yang sangat baik dalam memanfaatkan RAG untuk memungkinkan hasil AI yang lebih besar. Mawson's Huts Foundation ini memiliki misi untuk melestarikan Mawson lama, yang mencakup 42 persen klaim teritorial Australia atas Antartika dan mengedukasi anak-anak sekolah dan orang lain tentang Antartika itu sendiri serta pentingnya mempertahankan lingkungannya yang masih asli.
Dengan The Antarctic Explorer, platform pembelajaran didukung AI yang berjalan di IBM Cloud, Mawson memberikan anak-anak dan orang lain akses ke Antartika dari browser di mana pun mereka berada. Pengguna dapat mengirimkan pertanyaan melalui antarmuka berbasis browser dan platform pembelajaran menggunakan kemampuan pemrosesan bahasa alami yang didukung AI yang disediakan oleh IBM watsonx Assistant untuk menafsirkan pertanyaan dan memberikan jawaban yang sesuai dengan media terkait—video, gambar, dan dokumen—yang disimpan dan diambil dari IBM Cloud Object Storage.
Dengan memanfaatkan penawaran infrastruktur sebagai layanan bersama dengan watsonx, baik Mawson's Huts Foundation dan Blendow Group dapat memperoleh insight yang lebih besar dari model AI mereka dengan memudahkan proses pengelolaan dan menyimpan data yang terkandung di dalamnya.
AI dan LLM generatif telah terbukti memiliki potensi besar untuk mengubah organisasi di seluruh industri. Baik itu mendidik populasi yang lebih luas atau menganalisis dokumen hukum, solusi PaaS di dalam cloud sangat penting untuk keberhasilan RAG dan menjalankan model AI.
Di IBM, kami percaya bahwa beban kerja AI kemungkinan akan menjadi tulang punggung beban kerja sangat penting dan pada akhirnya menampung dan mengelola data paling tepercaya, sehingga infrastruktur di sekitarnya harus dapat dipercaya dan tangguh berdasarkan desain. Dengan IBM Cloud, perusahaan di seluruh industri yang menggunakan AI dapat memanfaatkan tingkat ketahanan, kinerja, keamanan, kepatuhan, dan total biaya kepemilikan yang lebih tinggi. Pelajari selengkapnya tentang IBM Cloud Code Engine dan IBM Cloud Object Storage di bawah ini.
Red Hat OpenShift on IBM Cloud adalah OpenShift Container Platform (OCP) yang dikelola sepenuhnya.
Solusi kontainer menjalankan dan meningkatkan beban kerja dalam kontainer dengan keamanan, inovasi sumber terbuka, dan penerapan yang cepat.
Dapatkan kemampuan baru dan dorong ketangkasan bisnis dengan layanan konsultasi cloud IBM. Temukan cara berkolaborasi dalam menciptakan solusi, mempercepat transformasi digital, dan mengoptimalkan kinerja melalui strategi hybrid cloud dan kemitraan pakar.