Ledakan konten digital telah menghasilkan begitu banyak variasi format dokumen dan tata letak serta input baru dengan berbagai kualitas atau kemampuan untuk dipahami. Seseorang mungkin berada di kursi belakang berbagi tumpangan, mencoba mengambil gambar tagihan utilitas untuk mengajukan izin parkir yang berbatas waktu. Atau seseorang mungkin sedang bertukar email dengan pasien, mencoba memproses klaim layanan kesehatan sambil bekerja dari kantor jarak jauh. Pada tahun 2018, Forbes menyatakan dua tahun belakangan telah menghasilkan 90% dari data di dunia. Kita hanya bisa membayangkan seberapa besar percepatan yang terjadi pada tahun 2020 antara pekerjaan jarak jauh, telemedicine, interaksi sosial digital, dan banyak lagi.
Selain ledakan konten digital dan saluran input, teknologi dan teknik penangkapan data yang ada saat ini sudah tidak dapat ditingkatkan lagi. Sebagai contoh, fungsionalitas sidik jari telah digunakan untuk menentukan zona pengenalan dan informasi posisi untuk mengekstraksi data yang tepat yang diperlukan pada format dokumen tertentu atau kecocokan yang serupa. Namun, dengan banyaknya format dokumen unik yang muncul dari program sosial atau ekonomi baru atau hubungan B2B baru, menyiapkannya membutuhkan waktu yang lama, baik untuk menutup bisnis, meningkatkan ekonomi, maupun memajukan kesejahteraan sosial masyarakat. Selain itu, lembar pemisah seperti tajuk atau kode batang untuk mengidentifikasi komponen aplikasi tidak efektif ketika Anda memiliki input yang berasal dari saluran yang berbeda seperti formulir mobile, email, dan online.
Akibatnya, organisasi menghabiskan lebih banyak waktu untuk memproses dokumen secara manual, dan kita tidak bisa hanya menyalahkan kualitas gambar yang buruk dari mesin faks. Survei 2019 yang dilakukan oleh Levvel Research menemukan 57% data faktur dimasukkan secara manual dan 49% persetujuan faktur memerlukan dua hingga tiga pemberi persetujuan.
Meskipun kecerdasan buatan (AI) bukanlah hal baru, sulit bagi organisasi untuk berhasil menggunakannya dalam pemrosesan dokumen agak terstruktur dan tidak terstruktur. Menggunakan AI telah membutuhkan keterampilan ilmu data yang signifikan dan ribuan dokumen sampel untuk melatih model. Hal ini, pada gilirannya, telah menghasilkan siklus panjang untuk mengumpulkan dokumen dan data guna mewujudkan manfaat bisnis.
Namun, kemajuan dalam AI dan alat sederhana telah mampu mempercepat penggunaan untuk pemrosesan dokumen. Pertama, algoritma pembelajaran mendalam telah muncul, yang mulai meniru pemikiran otak manusia. Algoritma ini dapat mengidentifikasi pola kontekstual yang valid untuk mendapatkan pemahaman tentang informasi yang tidak terstruktur (seperti isi dokumen) dan menerapkan pembelajaran tersebut pada hal-hal yang belum pernah dilihat sebelumnya — yang disebut dengan pembelajaran transfer. Ini membantu mengurangi proses pengumpulan dokumen dan siklus pelatihan yang panjang. Kedua, alat no-code dengan panduan langkah demi langkah sederhana memudahkan pengguna bisnis untuk melatih model AI, memformat atau mengonversi output, dan menyesuaikan toleransi risiko bisnis.
Meskipun implementasi pemrosesan dokumen cerdas dan penggunaan model AI mungkin berbeda di setiap vendor, namun aktivitas intinya tetap sama:
Pertama, klasifikasi dokumen adalah tugas yang digunakan untuk mengidentifikasi jenis dokumen, seperti faktur atau formulir pajak. Dengan menggunakan satu kumpulan dokumen sampel, seseorang dapat melatih model klasifikasi AI pada berbagai jenis dokumen dan bidang serta nilai yang sesuai dengan jenis dokumen tersebut. Aktivitas ini tidak hanya menjadi bahan untuk aktivitas ekstraksi data berikutnya, namun juga memungkinkan pembelajaran transfer untuk jenis dokumen lain yang serupa, dan memfasilitasi pencarian dokumen yang lebih baik di dalam repositori konten.
Selanjutnya, ekstraksi data cerdas adalah aktivitas inti di mana informasi penting dan relevan ditarik dari halaman. Ini terdiri dari mengidentifikasi pasangan kunci dan nilai seperti nomor akun atau jumlah terutang, menentukan seperti apa data seharusnya dan di mana data itu berada di halaman, dan melatih model AI untuk informasi yang relevan dalam masing-masing jenis dokumen yang berbeda. Dalam langkah ini, metadata mungkin juga diekstraksi dan dikaitkan dengan dokumen untuk memudahkan pencarian kemudian.
Terakhir, output data terdiri dari pengayaan data yang diekstraksi dan pembuatan file output akhir untuk digunakan di hilir. Model berbasis AI dapat digunakan untuk mengoreksi kesalahan ejaan umum secara otomatis, mengubah data menjadi format output standar (misalnya, nomor telepon), dan memformat data agar terlihat konsisten (misalnya, dua tempat desimal untuk nilai dolar). Langkah terakhir adalah membuat file output — biasanya file JSON — yang kemudian dapat memberi umpan pada alur kerja atau memasukkannya ke repositori konten untuk digunakan nanti.
Penerima manfaat utama dari pemrosesan dokumen cerdas adalah otomatisasi proses, di mana data terstruktur yang telah divalidasi dapat dimasukkan ke dalam transaksi, memungkinkan pemrosesan yang lebih cepat dan operasi yang dapat diskalakan. Sebagai contoh, pengaturan alur kerja secara manual, entri data, dan validasi data sebelumnya mungkin memakan waktu berjam-jam oleh pekerja manusia. Integrasi antara pemrosesan dokumen cerdas dan alur kerja dapat menghilangkan langkah-langkah manual ini dan output data dapat secara otomatis didorong ke dalam proses bisnis. Demikian pula, data buruk yang dimasukkan ke dalam bot otomatisasi proses robotik (RPA) dapat mengakibatkan kesalahan dalam langkah selanjutnya, yang dapat menyebabkan hambatan atau kesalahan dalam proses bisnis. Dengan memanfaatkan output yang berkelanjutan dari pemrosesan dokumen cerdas, bot RPA dapat meningkatkan skala di seluruh organisasi dengan lebih mudah. Terakhir, dasbor visualisasi dapat memberdayakan pengguna bisnis untuk mengungkap pola dan insight yang terkait dengan data yang diekstraksi atau hambatan dalam proses bisnis, yang dapat mengarah pada pengambilan keputusan yang lebih tepat.
Untuk mempelajari lebih lanjut tentang peran RPA dalam otomatisasi, lihat “SeniOtomatisasi: Bab 2 — Robotic Process Automation (RPA).”
Ada bukti kuat bahwa terdapat permintaan untuk mengotomatiskan pemrosesan dokumen, di mana kombinasi kecerdasan buatan (AI) bersama dan kode rendah akan meningkatkan produktivitas pekerja di organisasi dan mendorong kinerja bisnis.
Faktanya, dalam bekerja dengan klien IBM sendiri, kami telah menemukan sejumlah contoh penggunaan di mana pemrosesan dokumen cerdas dapat diterapkan. Kami akan membahas tiga contoh kasus penggunaan di bawah ini dan manfaat potensial yang mungkin disadari oleh organisasi.
Proses penawaran dan persetujuan untuk asuransi komersial sangat kompetitif, di mana perusahaan pertama yang memberikan penawaran sering kali memenangkan bisnis. Tantangannya adalah bahwa di banyak perusahaan asuransi, proses ini memerlukan peninjauan, entri data aplikasi, dan membaca dokumentasi pendukung, sehingga sulit untuk bersaing atau melakukan peningkatan. Ini juga menjauhkan fokus agen dari layanan konsultasi, yang diperlukan untuk mempertahankan dan menumbuhkan bisnis yang ada. Pemrosesan dokumen cerdas dapat mengotomatiskan proses ini menggunakan AI dengan pembelajaran mendalam untuk membaca dan mengklasifikasikan setiap jenis dokumen dan mengekstraksi data yang sesuai dari format yang berbeda ini. Data yang diekstraksi kemudian dapat dihubungkan ke alur kerja untuk mempercepat pemrosesan bisnis untuk membuat penawaran dan menyetujui aplikasi.
Tiga manfaat potensial dari menerapkan pemrosesan dokumen cerdas adalah sebagai berikut:
Pendaftaran untuk puluhan program pemerintah daerah — seperti bantuan makanan atau perumahan bersubsidi — memerlukan pemrosesan spreadsheet manual yang tidak efisien karena tim TI tidak memiliki sumber daya untuk membangun solusi yang diperlukan. Menggunakan alat kode rendah dan pemrosesan dokumen cerdas, pengguna bisnis dapat membangun aplikasi pemrosesan sederhana namun sesuai tujuan dan melatih sistem untuk mengenali bidang kunci dari formulir pendaftaran. Selain itu, validator yang mudah dikonfigurasi dapat memastikan kolom tanggal dan kolom mata uang dikenali secara akurat, dan validator yang sederhana dan khusus juga dapat dibuat untuk menangani kolom yang unik seperti nomor jaminan sosial.
Tiga manfaat potensial dari menerapkan pemrosesan dokumen cerdas adalah sebagai berikut:
Bank dapat memiliki lebih dari 20 formulir layanan akun yang berbeda yang tersedia untuk diunduh dari situs webnya. Pemegang akun menggunakan formulir ini untuk membuat perubahan pada akun atau menutup akun. Hari ini, ini dapat memerlukan tim agen yang cukup besar untuk membaca formulir ini, memverifikasi data, dan kemudian memasukkan data ke dalam sistem manajemen akun. Namun, dengan alat kode rendah dan pemrosesan dokumen cerdas, bank dapat dengan cepat membangun solusi untuk memproses setiap formulir layanan rekening dan menggunakan pemrosesan dokumen cerdas untuk melatih sistem pada setiap formulir agar tidak hanya mengenali kolom umum seperti alamat nasabah dan nomor rekening, tetapi juga kolom unik untuk setiap formulir.
Dengan menggabungkannya dengan RPA, bank juga dapat mengambil data yang diekstraksi dan mengotomatiskan perubahan ke dalam sistem backend bank. Selain itu, dengan memanfaatkan klasifikasi dokumen yang cerdas, formulir penutupan akun dapat dengan cepat ditandai dan agen dapat memberi tahu klien yang mungkin memiliki potensi risiko penerbangan.
Tiga manfaat potensial dari menerapkan pemrosesan dokumen cerdas adalah sebagai berikut:
Pendekatan IBM® terhadap pemrosesan dokumen cerdas muncul dalam IBM® Cloud Pak for Business Automation. Solusi cloud-native, Automation Document Processing adalah serangkaian layanan didukung AI yang secara otomatis membaca dan mengoreksi data dari dokumen. Perancang pemrosesan dokumen menyediakan antarmuka no-code yang mudah digunakan untuk model pelatihan tentang klasifikasi dokumen, ekstraksi data, dan pengayaan data.
Selain itu, IBM menyediakan templat aplikasi pemrosesan dokumen yang dapat digunakan untuk memproses dokumen satu halaman atau kumpulan dokumen. Toolkit di Desainer Aplikasi juga dapat digunakan untuk menyesuaikan aplikasi pengguna akhir agar terlihat dan terasa seperti aplikasi lain dalam suatu organisasi. Terakhir, IBM menyediakan alat penerapan sederhana dan integrasi siap pakai dengan kemampuan layanan kontennya, IBM FileNet Content Manager, untuk menyimpan dokumen dan file output data.
Sementara bab ini memberikan gambaran umum tentang bagaimana pemrosesan dokumen siap untuk perubahan dan di mana AI memainkan peran utama dalam memajukan pemrosesan dokumen, ada lebih banyak inovasi yang akan datang di bidang ini. Ada dua bidang utama, khususnya, yang harus diperhatikan. Pertama, karena ledakan format dan struktur dokumen agak terstruktur dan tidak terstruktur yang terus terjadi, model AI harus mengimbanginya. Dari membaca struktur tabel yang sangat kompleks hingga memproses ID yang dikeluarkan pemerintah dengan hologram atau tanda air, model AI akan ditantang untuk tetap akurat.
Kedua, sementara bidang ini telah menciptakan pemrosesan dokumen cerdas, jenis file video dan audio terus meningkat. Hanya masalah waktu saja sebelum kedua jenis file ini berada di jalur penting untuk pemrosesan klaim asuransi atau pengajuan laporan insiden polisi.
Ikuti terus perkembangan yang pasti menarik ini.
Pastikan Anda menyaksikan podcast Seni Otomatisasi, terutama Episode 7, di mana saya duduk bersama Jerry Cuomo untuk membahas pemrosesan dokumen cerdas.
Pikirkan kembali bisnis Anda dengan AI dan IBM Automation, menjadikan sistem TI lebih proaktif, proses lebih efisien, dan orang-orang lebih produktif.
IBM memastikan transformasi bisnis untuk klien perusahaan dengan layanan konsultasi otomatisasi ekstrem.
IBM Cloud Pak for Business Automation adalah seperangkat modular komponen perangkat lunak terintegrasi untuk manajemen operasi dan otomatisasi.