Apa itu LangSmith?

Latar belakang futuristik abstrak tentang Transfer Data. konsep teknologi

Apa itu LangSmith?

Salah satu tantangan terbesar dalam membangun aplikasi model bahasa besar (LLM) yang andal adalah memahami mengapa sistem kecerdasan buatan (AI) gagal atau berperilaku tak terduga setelah diterapkan. Pengembang sering kesulitan untuk melacak bug, menyempurnakan prompt, mengevaluasi kinerja di seluruh kasus tepi atau melakukan debug pada penggunaan alat dan masalah memori dalam alur kerja agen yang kompleks. LangSmith, yang dikembangkan oleh tim di balik LangChain, menawarkan solusi yang kuat untuk mengatasi tantangan ini. Platform ini berfungsi sebagai platform khusus untuk memantau, melakukan debug, dan mengevaluasi aplikasi yang dibangun dengan model bahasa besar. Ini memungkinkan pengembang memeriksa jejak, memantau kinerja, menguji versi prompt yang berbeda, dan melacak bagaimana alat eksternal dan memori digunakan secara real-time, semua dalam antarmuka terpadu yang dirancang untuk membuat aplikasi LLM lebih kuat dan siap produksi. 

Memahami LangSmith dan LangChain

LangChain dan LangSmith adalah alat untuk mendukung pengembangan LLM, tetapi tujuan masing-masing alat bervariasi.  

LangChain adalah kerangka kerja Python sumber terbuka yang menyederhanakan pembuatan dan penerapan aplikasi LLM. Ini menghubungkan beberapa komponen LLM ke dalam alur kerja terstruktur dengan menggunakan fondasi modular seperti rantai, agen, dan memori. Semua komponen ini memungkinkan integrasi LLM dengan alat eksternal, antarmuka pemrograman aplikasi (API), dan sumber data untuk membangun aplikasi yang kompleks. Alih-alih mengandalkan satu model, kerangka kerja ini mendukung penggabungan model untuk berbagai tugas seperti pemahaman teks, pembuatan respons, dan penalaran, sehingga setiap langkah dapat dibangun di atas langkah terakhir. LangChain mendukung rekayasa prompt melalui templat yang dapat digunakan kembali dan terintegrasi dengan LangGraph untuk merancang alur kerja secara visual. Kemampuan ini membuatnya sangat efektif untuk membangun agen percakapan dan sistem AI yang memerlukan penanganan konteks dan perkembangan logis.  

Selain itu, LangSmith adalah tulang punggung operasional pada kemampuan pengembangan LangChain. Sementara LangChain membantu Anda membangun alur kerja, LangSmith membantu memastikan bahwa alur kerja tersebut berjalan lancar dengan menawarkan alat untuk melakukan debug, pemantauan, dan pengelolaan sistem AI yang kompleks. LangSmith memberikan visibilitas mendalam tentang perilaku model sehingga lebih mudah untuk mengidentifikasi masalah kinerja, melacak kesalahan, dan mengoptimalkan respons secara real-time. Platform ini juga mendukung orkestrasi di banyak model dan saluran, memungkinkan penerapan dan koordinasi yang lancar. LangSmith menawarkan integrasi tanpa batas dengan alat eksternal seperti TensorFlow, Kubernetes. Platform ini juga dapat diintegrasikan dengan penyedia cloud utama seperti AWS, GCP, dan Azure, sekaligus memberikan dukungan yang kuat untuk pengaturan hybrid dan penerapan on premises. LangSmith mendukung pengembangan aplikasi AI dunia nyata, termasuk chatbot dan sistem interaktif lainnya seperti agen AI, asisten virtual, dan antarmuka percakapan. Kemampuan ini membantu pengembang merampingkan alur kerja mereka. 

Bersama-sama, LangChain dan LangSmith menyederhanakan seluruh proses pengembangan dari pembuatan prototipe hingga produksi.

Bagaimana cara kerja LangSmith?

LangSmith beroperasi dengan menanamkan dirinya ke dalam tumpukan aplikasi LLM, baik Anda menggunakan LangChain atau membangun saluran khusus untuk memberikan visibilitas, keterlacakan, dan kontrol pada setiap tahap pengembangan dan produksi. Platform ini menangkap data terperinci dari setiap interaksi LLM dan memvisualisasikannya, membantu pengembang menentukan masalah, menguji solusi, dan mengoptimalkan kinerja.  

Fungsi utama LangSmith adalah:

  1. Debugging

  2. Pengujian

  3. Mengevaluasi

  4. Pemantauan

Debugging

Aplikasi LLM sering melibatkan jalur penalaran yang kompleks, penggunaan alat dinamis, dan rantai dengan banyak langkah. Ketika kesalahan terjadi, seperti siklus tidak terbatas, output yang salah, atau kegagalan pemanggilan alat, metode debug tradisional akan mengalami kegagalan. LangSmith menawarkan visibilitas terperinci dan berurutan tentang setiap interaksi dengan LLM, membantu memastikan keterlacakan yang jelas selama proses berlangsung. Telusuri, lacak, dan tampilkan aliran data langkah demi langkah melalui aplikasi dengan menggunakan LangChain Expression Language (LCEL). Visibilitas ini membantu memecahkan masalah waktu respons yang lama, kesalahan, atau perilaku tak terduga. LangSmith menyediakan alat visualisasi komprehensif untuk menampilkan jejak panggilan LLM, membantu pengembang memahami dan melakukan debug pada alur kerja yang kompleks dengan mudah. Pengembang dapat memeriksa tiap prompt dan respons, langkah-langkah perantara dalam rantai dan agen, dan panggilan alat serta output yang sesuai. Visibilitas mendetail ini memungkinkan identifikasi dan penyelesaian masalah yang cepat, secara signifikan mengurangi waktu pengembangan, dan meningkatkan stabilitas aplikasi.

Pengujian 

Aplikasi LLM memerlukan pembaruan yang sering dengan mengoptimalkan prompt, menyesuaikan logika rantai, atau mengubah parameter model. Sangat penting untuk membantu memastikan bahwa perubahan ini tidak menyebabkan regresi. LangSmith mendukung pengujian berbasis kumpulan data, memungkinkan pengembang untuk menjalankan rangkaian pengujian yang telah ditetapkan atau kustom di seluruh versi aplikasi, membandingkan output secara visual dan semantik serta mengidentifikasi perubahan perilaku sebelum penerapan pada produksi. Pengujian ini memfasilitasi penjaminan kualitas yang ketat dan meningkatkan pengembangan berulang yang aman. Dukungan LangSmith untuk evaluasi otomatis memungkinkan tim untuk dengan cepat mengulangi desain prompt dan parameter model untuk memastikan kualitas yang konsisten.

Mengevaluasi

Di luar kebenaran fungsional, kualitas output yang dihasilkan LLM harus terus dievaluasi terhadap harapan bisnis dan pengguna. LangSmith menawarkan evaluator bawaan dan dapat disesuaikan untuk menilai kinerja di berbagai dimensi seperti akurasi, relevansi, dan koherensi. Dengan kemampuan evaluasi LangSmith, tim dapat membandingkan kinerja di seluruh kumpulan data dan variasi prompt, memunculkan kasus tepi yang menurunkan pengalaman pengguna dan melacak peningkatan atau regresi dengan metrik yang jelas. Proses evaluasi terstruktur ini membantu memastikan bahwa sistem LLM tetap efektif, akurat, dan selaras dengan hasil yang diinginkan.

Pemantauan

Menerapkan aplikasi LLM ke dalam produksi memerlukan pemantauan yang kuat untuk membantu memastikan kinerja yang konsisten dan respons insiden segera. LangSmith memberikan observabilitas menyeluruh untuk alur kerja LLM seperti pencatatan eksekusi secara real-time, latensi, dan tingkat kesalahan, integrasi dengan sistem peringatan untuk pelaporan insiden yang cepat dan dasbor yang memberikan insight tentang pola penggunaan dan kesehatan sistem. Kecerdasan operasional ini memungkinkan tim teknik untuk secara proaktif mengelola perilaku aplikasi, membantu memastikan keandalan dan responsivitas dalam lingkungan langsung. Pemantauan penerapan dunia nyata dengan LangSmith membantu tim merampingkan respons insiden dan mempertahankan kesehatan sistem yang kuat. 

LangSmith bekerja melalui Python SDK sederhana yang membantu pengembang membangun dan mengelola aplikasi AI dengan mudah. Platform ini terhubung dengan model AI seperti GPT dari OpenAI dan menggunakan berbagai teknik seperti retrieval-augmented generation (RAG) untuk meningkatkan cara kerja model ini. Dengan menggunakan kunci API, pengembang dapat melacak dan melakukan debug pada agen AI, termasuk agen berbasis ChatGPT, memastikan semuanya berjalan lancar dan berkinerja baik dalam proyek AI generatif. 

Misalnya, riset ini menyajikan editor LangSmith yang membantu peneliti bukan penutur asli dalam menulis makalah akademik dalam bahasa Inggris, terutama dalam domain NLP. Sistem ini menawarkan tiga fitur utama: saran revisi teks berdasarkan draf kasar, penyelesaian teks yang disesuaikan dengan konteks dan koreksi kesalahan tata bahasa atau ejaan.[1] Hasil menunjukkan bahwa LangSmith meningkatkan kualitas revisi draf, terutama ketika kolaborasi manusia dan mesin terlibat, sehingga penulis bukan penutur asli dapat menghasilkan teks akademik yang lebih lancar dan sesuai dengan gaya. Sistem ini meningkatkan keberagaman dan inklusi dengan menurunkan hambatan bahasa dalam komunikasi ilmiah. Contoh ini menyoroti contoh penggunaan dunia nyata di mana LangSmith memfasilitasi riset ilmu data dengan meningkatkan kolaborasi antara manusia dan AI dalam penulisan akademis. Contoh penggunaan tersebut menunjukkan kemampuan LangSmith untuk meningkatkan inklusivitas dan produktivitas di berbagai bidang berbasis AI. 

Factory, sebuah perusahaan yang membangun agen AI untuk mengotomatiskan Siklus Hidup Pengembangan Perangkat Lunak (SDLC), menggunakan LangSmith untuk membantu memastikan operasi LLM yang aman dan andal di lingkungan perusahaan.[2] Mereka mengintegrasikan LangSmith dengan AWS CloudWatch dan memperoleh keterlacakan penuh di seluruh saluran LLM, yang memungkinkan percepatan debug dan manajemen konteks yang lebih baik. Menggunakan API masukan LangSmith, mereka mengotomatiskan evaluasi dan penyempurnaan prompt berdasarkan input pengguna nyata. Ini membantu menggandakan kecepatan iterasi dan penurunan waktu penggabungan terbuka sebesar 20%, menjadikan LangSmith bagian penting dari pengembangan AI dan alur kerja observabilitas mereka. 

Manfaat dan tantangan LangSmith

Manfaat

Platform multifungsi: LangSmith mengonsolidasikan semua fungsi inti—debug, pengujian, penerapan, pemantauan—menjadi satu platform kohesif. Pemantauan penerapan dunia nyata dengan LangSmith membantu tim merampingkan respons insiden dan mempertahankan kesehatan sistem yang kuat. Antarmukanya yang bersih dan ramah pengembang memudahkan pengendalian alur kerja yang kompleks dan mengelola proyek secara efisien tanpa beralih di antara berbagai alat. 

Debug dan evaluasi yang kuat: Memberikan analisis jejak terperinci, pengujian prompt, dan alat manajemen kumpulan data yang membantu menentukan masalah, mengukur kinerja, dan menyempurnakan perilaku LLM dengan presisi. 

Skalabilitas siap perusahaan: Dirancang untuk mendukung aplikasi tingkat produksi bervolume tinggi membuatnya sangat cocok untuk tim perusahaan yang membangun dan memelihara sistem AI yang kompleks.

Tantangan

Kurva pembelajaran yang curam untuk pemula: LangSmith dapat menjadi tantangan bagi pemula, karena menuntut pemahaman yang kuat tentang alat LLM dan proses DevOps, yang dapat membatasi aksesibilitasnya bagi pendatang baru. 

Ketergantungan sangat besar pada ekosistem LangChain: LangSmith sangat terkait dengan LangChain. Meskipun bagus untuk pengguna kerangka kerja tersebut, ini mungkin tidak terlalu membantu bagi mereka yang menggunakan alat orkestrasi lain atau tumpukan khusus. 

Skalabilitas dan biaya untuk proyek skala besar: Untuk penggunaan perusahaan, biaya dapat tumbuh seiring dengan penskalaan, terutama ketika berhadapan dengan evaluasi yang sering, penyimpanan jejak besar, atau analitik canggih. 

Pilihan antara LangChain, LangSmith, atau kombinasi keduanya tergantung pada persyaratan spesifik aplikasi LLM Anda. LangChain sangat cocok untuk merancang dan membuat prototipe alur kerja model bahasa yang kompleks, memungkinkan integrasi yang lancar dengan alat eksternal dan API. Gunakan LangSmith saat Anda siap untuk beralih ke produksi dan membutuhkan alat yang kuat untuk melakukan debug, pengujian, pemantauan, dan pemeliharaan aplikasi LLM dalam skala besar. Ketika digunakan bersama, kedua platform ini memberikan solusi komprehensif dan dapat diskalakan untuk membangun, menerapkan, dan memelihara aplikasi LLM berkualitas tinggi.

Catatan kaki

1 Ito, T., Kuribayashi, T., Hidaka, M., Suzuki, J., & Inui, K. (2020). Langsmith: An interactive academic text revision system. arXiv preprint arXiv:2010.04332. 

2 LangChain. (2024, 19 Juni). Bagaimana Factory menggunakan LangSmith untuk mengotomatiskan siklus masukan mereka dan meningkatkan kecepatan iterasi hingga 2x. Blog LangChain. https://blog.langchain.dev/customers-factory/ 

Solusi terkait
RAG di watsonx.AI

Merampingkan pembuatan aplikasi RAG. Bangun, optimalkan, dan terapkan saluran RAG dengan basis pengetahuan perusahaan Anda.

Jelajahi RAG di watsonx.ai
Solusi kecerdasan buatan (AI)

Manfaatkan AI di bisnis Anda dengan perpaduan antara keahlian AI terdepan di industri dari IBM dan portofolio solusi Anda.

Jelajahi solusi AI
Konsultasi dan layanan AI

Ciptakan kembali alur kerja dan operasi yang penting dengan menambahkan AI untuk memaksimalkan pengalaman, pengambilan keputusan secara waktu nyata, dan nilai bisnis.

Jelajahi layanan AI
Ambil langkah selanjutnya

Dapatkan akses satu atap ke kemampuan yang mencakup siklus hidup pengembangan AI. Hasilkan solusi AI yang kuat dengan antarmuka ramah pengguna, alur kerja yang efisien, serta akses ke API dan SDK berstandar industri.

Jelajahi watsonx.ai Pesan demo langsung