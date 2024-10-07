Teknologi Voice AI berkembang pesat, menjanjikan untuk merevolusi operasi perusahaan mulai dari layanan pelanggan ke komunikasi internal.
Dalam beberapa minggu terakhir, OpenAI telah meluncurkan alat baru untuk menyederhanakan pembuatan asisten suara AI dan memperluas Mode Suara Canggih pada lebih banyak pelanggan berbayar. Microsoft telah memperbarui Copilot AI dengan kemampuan suara dan fitur penalaran yang ditingkatkan, sementara Meta telah memperkenalkan AI suara ke aplikasi perpesanan.
Menurut IBM Distinguished Engineer Chris Hay, kemajuan ini “dapat mengubah cara bisnis berbicara dengan pelanggan.”
Hay membayangkan perubahan drastis dalam bagaimana bisnis dari semua ukuran terlibat dengan pelanggan mereka dan mengelola operasi. Dia mengatakan penyediaan akses ke alat komunikasi didukung AI dapat menciptakan peluang yang belum pernah terjadi sebelumnya bagi usaha kecil untuk bersaing dengan perusahaan yang lebih besar.
“Kami memasuki era pusat kontak AI,” kata Hay. “Setiap toko keluarga dapat memiliki tingkat layanan pelanggan yang sama dengan perusahaan. Itu luar biasa.”
Hay mengatakan kuncinya adalah pengembangan API real-time yang memungkinkan komunikasi latensi rendah antara manusia dan AI. Ini memungkinkan jenis pertukaran dua arah yang diharapkan orang dalam percakapan sehari-hari.
“Untuk memiliki percakapan bahasa alami, latensi model harus sekitar 200 milidetik,” ujar Hay. “Saya tidak ingin menunggu tiga detik... saya perlu mendapatkan tanggapan dengan cepat.”
Teknologi AI suara baru menjadi dapat diakses oleh pengembang melalui API yang ditawarkan oleh perusahaan seperti OpenAI. “Ada API pengembang untuk produksi dalam skala besar di mana siapa pun dapat memanggil API dan membangun fungsionalitas itu untuk diri mereka sendiri, dengan pengetahuan model dan pengetahuan pengembangan yang sangat terbatas,” kata Hay.
Implikasinya bisa sangat luas. Hay memprediksi “gelombang besar asisten virtual audio” muncul dalam beberapa bulan dan tahun mendatang karena bisnis dari semua ukuran mengadopsi teknologi tersebut. Hal ini dapat menyebabkan layanan pelanggan yang lebih personal, munculnya industri komunikasi AI baru, dan pergeseran pekerjaan menuju manajemen AI.
Bagi konsumen, pengalaman itu mungkin tidak dapat dibedakan dengan jelas dari berbicara dengan agen manusia. Hay menunjuk pada demonstrasi terbaru dari podcast yang dihasilkan AI melalui NotebookLM dari Google yang membuktikan sejauh mana teknologi ini telah berkembang.
“Jika tidak ada yang memberi tahu saya bahwa itu adalah AI, sejujurnya saya tidak akan mempercayainya,” katanya tentang salah satu demo tersebut. "Suaranya emosional. Sekarang Anda berbicara dengan AI secara real-time dan kualitasnya akan lebih baik lagi.”
Perusahaan teknologi besar berlomba untuk meningkatkan kepribadian dan kemampuan asisten AI mereka. Pendekatan Meta melibatkan pengenalan suara selebriti untuk asisten AI-nya di seluruh platform perpesanan. Pengguna dapat memilih suara yang dihasilkan AI berdasarkan tokoh terkenal seperti Awkwafina dan Judi Dench.
Namun, potensi risiko menyertai semua janji itu. Hay mengakui bahwa teknologi bisa menjadi anugerah bagi pengirim penipuan dan penipu jika jatuh ke tangan yang salah.
“Anda akan melihat generasi baru scammer dalam enam bulan ke depan yang memiliki suara yang terdengar autentik seolah seperti host podcast yang Anda dengar, dengan infleksi dan emosi dalam suara mereka,” ia memperingatkan. “Model yang muncul untuk mencuri uang dari orang, pada dasarnya.” Hal ini dapat membuat tanda bahaya tradisional menjadi ketinggalan zaman, seperti aksen yang tidak biasa atau suara yang terdengar seperti robot. “Itu akan disembunyikan,” kata Hay.
Dia menyamakan situasi ini dengan sebuah titik plot dalam novel Harry Potter, di mana para karakter harus mengajukan pertanyaan pribadi untuk memverifikasi identitas seseorang. Di dunia nyata, orang mungkin perlu mengadopsi taktik serupa.
“Bagaimana saya bisa tahu bahwa saya sedang berbicara dengan bank saya,” Hay merenung. “Bagaimana saya tahu bahwa saya berbicara dengan putri saya, yang meminta uang? Manusia harus terbiasa untuk mengajukan pertanyaan-pertanyaan seperti itu.”
Terlepas dari kekhawatiran ini, Hay tetap optimis dengan potensi teknologi. Dia menunjukkan bahwa AI suara dapat secara signifikan meningkatkan aksesibilitas, memungkinkan orang untuk berinteraksi dengan bisnis dan layanan pemerintah dalam bahasa ibu mereka.
“Pikirkan berbagai hal seperti aplikasi tunjangan. Dan Anda akan mendapatkan semua dokumen yang membingungkan ini. Pikirkan kemampuan untuk dapat memanggil [penyedia manfaat Anda] dalam bahasa ibu Anda, kemudian dapat menerjemahkan berbagai hal — dokumen yang sangat rumit — ke dalam bahasa lebih sederhana yang kemungkinan besar akan Anda pahami.”
Teknologi suara AI terus berkembang, dan Hay percaya bahwa kita baru menyentuh permukaan dari kemungkinan aplikasi. Dia membayangkan masa depan di mana asisten AI terintegrasi dengan lancar ke dalam perangkat wearable seperti kacamata augmented reality Orion yang baru-baru ini diluncurkan oleh Meta.
“Ketika API real-time itu ada di kacamata saya, saya dapat berbicara secara real-time saat saya sedang bepergian,” kata Hay. “Dikombinasikan dengan AR, itu akan revolusioner.” Meskipun ia mengakui tantangan etika, termasuk insiden baru-baru ini ketika kacamata pintar dapat langsung menemukan identitas orang, Hay tetap percaya diri pada prospek teknologi.
“Etika perlu dikembangkan dan etika sangat penting,” akunya. “Tapi saya optimis.”
