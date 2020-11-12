NLP vs NLU vs NLG: perbedaan antara tiga konsep pemrosesan bahasa alami

Pengusaha yang percaya diri menggunakan laptop bersama di meja.

Penyusun

Eda Kavlakoglu

Business Development + Partnerships

IBM Research

Rishi Vaish

VP and Head

IBM Software, Cloud and AI Acceleration

Meskipun pemrosesan bahasa alami (NLP), natural language understanding (NLU), dan pembuatan bahasa alami (NLG) semuanya adalah topik terkait, mereka adalah topik yang berbeda. Pada tingkat tinggi, NLU dan NLG hanyalah komponen NLP. Mengingat bagaimana keduanya saling bersinggungan, keduanya sering kali membingungkan dalam percakapan, tetapi dalam artikel ini, kami akan mendefinisikan setiap istilah secara terpisah dan merangkum perbedaannya untuk mengklarifikasi ketidakpastian.

 

Buletin industri

Tren AI terbaru, dipersembahkan oleh para pakar

Dapatkan kurasi insight tentang berita AI yang paling penting dan menarik. Berlangganan buletin Think mingguan. Lihat Pernyataan Privasi IBM.

Terima kasih! Anda telah berlangganan.

Langganan Anda akan dikirimkan dalam bahasa Inggris. Anda akan menemukan tautan berhenti berlangganan di setiap buletin. Anda dapat mengelola langganan atau berhenti berlangganan di sini. Lihat Pernyataan Privasi IBM kami untuk informasi lebih lanjut.

Apa itu pemrosesan bahasa alami?

Pemrosesan bahasa alami yang berkembang dari linguistik komputasi, menggunakan metode dari berbagai disiplin ilmu, seperti ilmu komputer, kecerdasan buatan, linguistik, dan ilmu data, untuk memungkinkan komputer memahami bahasa manusia, baik dalam bentuk tulisan maupun lisan. Sementara linguistik komputasi lebih berfokus pada aspek bahasa, pemrosesan bahasa alami menekankan penggunaan machine learning dan teknik pembelajaran mendalam untuk menyelesaikan tugas, seperti penerjemahan bahasa atau menjawab pertanyaan. Pemrosesan bahasa alami bekerja dengan mengambil data tidak terstruktur dan mengubahnya menjadi format data terstruktur. Ini dilakukan melalui identifikasi entitas bernama (proses yang disebut named entity recognition) dan identifikasi pola kata menggunakan metode seperti tokenisasi, stemming, dan lematisasi, yang memeriksa bentuk akar kata. Misalnya, akhiran -ed pada sebuah kata, seperti called, menunjukkan bentuk lampau, tapi memiliki kata dasar infinitif (to call) yang sama dengan kata kerja bentuk sekarang, calling.

Meskipun terdapat sejumlah algoritma NLP, pendekatan yang berbeda cenderung digunakan untuk berbagai jenis tugas bahasa. Misalnya, rantai Markov tersembunyi cenderung digunakan untuk penandaan bagian dari ucapan. Neural networks membantu menghasilkan urutan teks yang sesuai. N-gram, sebuah model bahasa sederhana (LM), memberikan probabilitas pada kalimat atau frasa untuk memprediksi keakuratan respons. Semua teknik ini bekerja sama untuk mendukung teknologi populer seperti chatbot, atau produk pengenalan suara seperti Alexa dari Amazon atau Siri dari Apple. Namun, aplikasinya lebih luas dari itu, memengaruhi industri lain seperti pendidikan dan perawatan kesehatan.

Gabungan Para Pakar | 28 Agustus, episode 70

Decoding AI: Rangkuman Berita Mingguan

Bergabunglah dengan panel insinyur, peneliti, pemimpin produk, dan sosok kelas dunia lainnya selagi mereka mengupas tuntas tentang AI untuk menghadirkan berita dan insight terbaru seputar AI.
Simak episode terbaru podcast

Apa itu natural language understanding?

Natural language understanding adalah bagian dari pemrosesan bahasa alami, yang menggunakan analisis sintaksis dan semantik teks dan ucapan untuk menentukan makna kalimat. Sintaksis mengacu pada struktur tata bahasa kalimat, sedangkan semantik menyinggung makna yang dimaksudkan. NLU juga menetapkan ontologi yang relevan: struktur data yang menentukan hubungan antara kata dan frasa. Meskipun manusia secara alami melakukan hal ini dalam percakapan, kombinasi analisis ini diperlukan agar mesin dapat memahami makna yang dimaksudkan dari teks yang berbeda.

Kemampuan kita untuk membedakan antara homonim dan homofon menggambarkan nuansa bahasa dengan baik. Sebagai contoh, mari kita ambil dua kalimat berikut:

  1. Alice berenang melawan arus.
  2. Versi laporan saat ini ada di folder.

Pada kalimat pertama, kata arus adalah kata benda. Kata kerja yang mendahuluinya, berenang, memberikan konteks tambahan kepada pembaca, memungkinkan kita untuk menyimpulkan bahwa yang dimaksud adalah aliran air di lautan. Kalimat kedua menggunakan kata saat ini, tetapi sebagai kata sifat. Kata benda yang dijelaskannya, versi, menunjukkan beberapa iterasi laporan, memungkinkan kita untuk menentukan bahwa kita mengacu pada status file yang paling baru.

Pendekatan ini juga umum digunakan dalam penambangan data untuk memahami sikap konsumen. Secara khusus, analisis sentimen memungkinkan merek untuk memantau masukan pelanggan mereka dengan lebih saksama, memungkinkan mereka untuk mengelompokkan komentar media sosial positif dan negatif dan melacak net promoter score. Dengan meninjau komentar yang mengandung sentimen negatif, perusahaan dapat mengidentifikasi dan menangani area masalah potensial dalam produk atau layanan mereka dengan lebih cepat.

Apa itu pembuatan bahasa alami?

Pembuatan bahasa alami adalah bagian lain dari pemrosesan bahasa alami. Sementara natural language understanding berfokus pada pemahaman bacaan komputer, pembuatan bahasa alami memungkinkan komputer untuk menulis. NLG adalah proses menghasilkan respons teks bahasa manusia berdasarkan beberapa input data. Teks ini juga dapat diubah menjadi format ucapan melalui layanan text to speech.

NLG juga mencakup kemampuan peringkasan teks yang menghasilkan ringkasan dari dokumen yang dimasukkan seraya mempertahankan integritas informasi. Ringkasan ekstraktif adalah inovasi AI yang mendukung Analisis Titik Kunci yang digunakan dalam That's Debatable.

Awalnya, sistem NLG menggunakan templat untuk menghasilkan teks. Berdasarkan beberapa data atau kueri, sistem NLG akan mengisi kekosongan, seperti permainan Mad Libs. Namun seiring waktu, sistem pembuatan bahasa alami berkembang dengan aplikasi rantai Markov tersembunyi, recurrent neural networks, dan transformator, memungkinkan pembuatan teks yang lebih dinamis secara real-time.

Seperti halnya NLU, aplikasi NLG perlu mempertimbangkan aturan bahasa berdasarkan morfologi, leksikon, sintaksis, dan semantik untuk menentukan pilihan cara menyusun respons dengan tepat. Mereka menangani ini dalam tiga tahap:

  • Perencanaan teks: Selama tahap ini, konten umum dirumuskan dan diurutkan secara logis.
  • Perencanaan kalimat: Tahap ini mempertimbangkan tanda baca dan alur teks, membagi konten ke dalam paragraf dan kalimat, serta memasukkan kata ganti atau konjungsi yang sesuai.
  • Realisasi: Tahap ini memperhitungkan akurasi tata bahasa, memastikan bahwa aturan seputar tanda baca dan konjugasi diikuti. Misalnya, bentuk lampau dari kata kerja run adalah ran, bukan runned.

Ringkasan NLP vs NLU vs NLG

  • Pemrosesan bahasa alami (NLP) berupaya mengubah data bahasa tidak terstruktur menjadi format data terstruktur untuk memungkinkan mesin memahami ucapan dan teks serta merumuskan respons yang relevan dan sesuai konteks. Subtopiknya termasuk pemrosesan bahasa alami dan pembuatan bahasa alami.
  • Natural language understanding (NLU) berfokus pada pemahaman bacaan mesin melalui tata bahasa dan konteks, yang memungkinkannya untuk menentukan makna yang dimaksudkan dari sebuah kalimat.
  • Natural language generation (NLG) berfokus pada pembuatan teks atau konstruksi teks dalam bahasa Inggris atau bahasa lain, oleh mesin, dan berdasarkan kumpulan data yang diberikan.

Menanamkan data Anda untuk AI

Pemrosesan bahasa alami dan bagiannya memiliki banyak aplikasi praktis di dunia saat ini, seperti diagnosis perawatan kesehatan atau layanan pelanggan online.

Jelajahi beberapa riset NLP terbaru di IBM atau lihat beberapa penawaran produk IBM, seperti Watson Natural Language Understanding. Layanan analisis teksnya menawarkan insight tentang kategori, konsep, entitas, kata kunci, hubungan, sentimen, dan sintaksis dari data tekstual Anda untuk membantu Anda menanggapi kebutuhan pengguna dengan cepat dan efisien. Bantu bisnis Anda berada di jalur yang benar untuk menganalisis dan menanamkan data Anda dalam skala besar untuk AI.
Solusi terkait
IBM watsonx Orchestrate

Rancang asisten dan agen AI yang dapat diskalakan dengan mudah, otomatiskan tugas berulang, dan sederhanakan proses kompleks dengan IBM watsonx Orchestrate.

 Temukan watsonx Orchestrate
Alat dan API pemrosesan bahasa alami

Mempercepat nilai bisnis kecerdasan buatan dengan portofolio pustaka, layanan, dan aplikasi yang kuat dan fleksibel.

 Jelajahi solusi NLP
Konsultasi dan layanan AI

Temukan kembali alur kerja dan operasi yang penting dengan menambahkan AI untuk memaksimalkan pengalaman, pengambilan keputusan secara real-time, dan nilai bisnis.

 Jelajahi layanan AI
Ambil langkah selanjutnya

Rancang asisten dan agen AI yang dapat diskalakan dengan mudah, otomatiskan tugas berulang, dan sederhanakan proses kompleks dengan IBM watsonx Orchestrate.

 Temukan watsonx Orchestrate Jelajahi solusi NLP