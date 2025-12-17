Kecerdasan Buatan Otomatisasi IT

Membangun pipeline data sebagai kode: Memperkenalkan SDK Python IBM® watsonx.data integration

Ketersediaan umum SDK Python watsonx.data integration merupakan tonggak penting dalam visi IBM® untuk fondasi data siap AI, memungkinkan tim data untuk menskalakan pengembangan pipeline dan memberi daya agen dengan data berkualitas tinggi. 

diterbitkan 17 Desember 2025
Python SDK watsonx.data integration memperkenalkan model code-first yang dibangun di atas keterampilan Python yang ada dan memberi agen antarmuka yang konsisten untuk pembuatan dan validasi kode. Saat tim data bersiap untuk AI agen, pengembangan pipeline harus memiliki opsi lain yang ramah untuk generasi LLM.

Python SDK memungkinkan pergeseran itu dengan memungkinkan tim untuk membangun, membuat versi, mengotomatiskan, dan mengatur pipeline batch dan streaming real-time sebagai kode—mengurangi upaya manual dan memungkinkan integrasi data yang dapat diskalakan. Bersama dengan investasi lanjutan kami dalam pembuatan pipeline agen (dalam pratinjau), rilis ini memperkuat komitmen IBM® untuk memenuhi klien di mana mereka berada saat mereka membangun fondasi data siap AI.

Memenuhi tuntutan AI agen membutuhkan pengembangan pipeline yang fleksibel

Setiap organisasi merasakan tekanan dari lingkungan data: tim bisnis membutuhkan insight yang lebih cepat, tim data terbebani oleh sistem yang rapuh dan terfragmentasi, sementara pemimpin kepatuhan khawatir terhadap data sensitif yang berpotensi terlewat atau bocor. Tekanan ini semakin meningkat seiring munculnya AI agen, di mana keberhasilan tidak hanya ditentukan oleh kekuatan modelnya, tetapi juga oleh kuatnya fondasi data yang mendasarinya.

Inti dari fondasi tersebut adalah integrasi data: pipeline yang menghubungkan, mengubah, dan mengirimkan data sehingga dapat dipercaya dan digunakan. Ketika integrasi tersendat, AI pun gagal. Menurut MIT’s The GenAI Divide, 95% pilot AI generatif gagal bukan akibat kelemahan model, tetapi karena fondasi data yang belum matang. Pada saat yang sama, tim data diminta untuk membangun dan mengelola lebih banyak pipeline di lebih banyak jenis dan lingkungan data, bahkan ketika 77% organisasi melaporkan kekurangan keterampilan yang dibutuhkan.

Kesenjangan yang semakin besar antara permintaan dan kapasitas ini memperjelas bahwa pengembangan pipeline harus fleksibel, memenuhi pengguna di mana mereka berada. “Pendekatan penulisan tradisional tidak lagi memadai. Pengguna bisnis ingin mengekspresikan niat melalui bahasa alami. Para praktisi teknis menginginkan kode. Dan banyak tim mengandalkan kanvas visual untuk desain yang cepat.

IBM® berinvestasi secara mendalam dalam pendekatan multimodal ini sehingga watsonx.data integration dapat mendukung setiap pengguna dalam alur kerja pilihan mereka.

Pendekatan berbasis kode untuk membangun pipeline data

SDK Python IBM® watsonx.data integration menjadi lompatan penting dalam mewujudkan visi ini, karena memungkinkan pengembang dan insinyur data membangun serta mengelola pipeline secara programatis melalui pendekatan code-first, sekaligus mengurangi pekerjaan manual dan mempercepat time to value.

Insinyur data dan pengembang ETL telah lama menghargai pilihan cara membangun pipeline data, termasuk menggunakan antarmuka visual no-code/low-code atau pengodean secara langsung. Terlepas dari gaya penulisan, pipeline dapat didefinisikan satu kali, diberi versi di Git, dan diterapkan secara konsisten melalui alur kerja CI/CD. Setiap pendekatan melayani kebutuhan dan keahlian yang berbeda dalam tim data.

Sekarang, dengan Python SDK, tim dapat membuat dan mengelola pipeline integrasi data menggunakan salah satu bahasa yang paling banyak diadopsi dalam rekayasa data. Karena insinyur data nyaman membaca, menulis, dan meninjau kode Python, mereka menerapkan keterampilan yang sama ke IBM® watsonx.data integration. Pipeline sebagai kode akan membuka jalur baru untuk penggunaan kembali kode. Dengan menyediakan Python SDK ini, tim data dapat memilih dari beberapa opsi penulisan yang selaras dengan keterampilan dan preferensi mereka.

Dengan SDK, tim dapat:

1. Pipeline sebagai kode:

  • Tentukan dan gunakan kembali logika pipeline di Python di seluruh lingkungan
  • Versi, tinjauan, dan audit perubahan melalui permintaan Git dan pull
  • Buat koneksi dan desain, kelola, dan jalankan pipeline sepenuhnya dalam kode
  • Otomatisasi pengujian, promosi, dan penerapan dengan CI/CD
  • Menerapkan tata kelola yang konsisten dan kontrol akses secara terprogram

2. Akses pengalaman integrasi data terpadu dengan satu SDK

  • Menggunakan satu SDK untuk saluran streaming batch (ETL/ELT/TETL) dan real-time
  • Menghilangkan skrip kustom dan paket khusus alat dengan satu model pemrograman yang konsisten
  • Dibangun untuk memperluas gaya integrasi tambahan, termasuk data tidak terstruktur, replikasi , dan lainnya
  • Merampingkan administrasi platform dengan kontrol terprogram atas pengguna, proyek, dan pengaturan keamanan

3. Jembatan dua arah antara desain visual dan kode:

  • Membangun prototipe pipeline di kanvas visual, atau tulis langsung dalam Python
  • Memindahkan dengan lancar antara UI dan kode dengan ekspor instan dan impor melalui generator kode Python SDK kami
  • Mempercepat orientasi sekaligus mengaktifkan otomatisasi dan CI/CD dalam skala besar
  • Menjaga agar alur kerja visual dan terprogram tetap terhubung erat

Secara bersama-sama, kemampuan ini membangun fondasi bagi era baru integrasi data, di mana pipeline berperilaku seperti perangkat lunak, otomatisasi menjadi standar, dan agen AI di masa depan dapat melakukan penalaran, mengoptimalkan, bahkan memelihara aliran data dalam skala besar.

Pola dunia nyata: Bagaimana tim menggunakan SDK Python untuk menskalakan pekerjaan integrasi

Sementara SDK memperkenalkan pendekatan terprogram untuk pengembangan pipeline, dampaknya paling terlihat dalam bagaimana tim menerapkannya dari hari ke hari. Pengadopsi awal berkumpul pada serangkaian pola umum yang membantu mereka meningkatkan skala lebih cepat, mengurangi duplikasi, dan beroperasi dengan konsistensi yang lebih besar.

Contoh penggunaan 1: Mengubah satu pipeline menjadi templat yang dapat digunakan kembali

Titik awal yang umum adalah pipeline buatan UI sederhana. Misalnya, menyerap CSV, menerapkan transformasi, dan menulis hasil ke penyimpanan cloud. Seiring meningkatnya permintaan, tim lain menginginkan logika yang sama dengan input yang berbeda.

Dengan Python SDK, pipeline asli itu dapat diekspor ke Python menggunakan fitur pembuatan Kode Python baru kami dan diubah menjadi template parameter yang dapat digunakan kembali. Fitur Set Parameter dan Set Nilai SDK yang baru memungkinkan Anda memindahkan konfigurasi ini keluar dari UI dan masuk ke kontrol versi. Alih-alih mengetik nilai secara manual ke dalam formulir, Anda dapat secara terprogram menentukan dan menyuntikkan konfigurasi untuk lingkungan Dev, Test, dan Prod sekaligus. Variasi dibuat hanya dengan mengubah beberapa baris kode, bukan mendesain ulang pipeline dari awal sehingga menghasilkan pengiriman yang lebih cepat, lebih sedikit kesalahan, serta pola yang dapat diskalakan dan distandardisasi oleh tim.

Contoh penggunaan 2: Memodifikasi pipeline dalam skala besar untuk migrasi infrastruktur

Tantangan umum lainnya muncul ketika pipeline harus diperbarui pada banyak sumber data atau lingkungan yang terdampak, misalnya saat terjadi migrasi basis database atau penyimpanan data. Alih-alih memperbarui pipeline melalui UI, tim dapat menggunakan SDK untuk menduplikasi flow secara programatis, memperbarui konektor dan konfigurasi koneksi, menyesuaikan parameter, serta mempublikasikan pembaruan hanya dalam hitungan detik. Hal ini sangat berharga di lingkungan di mana pipeline harus berkembang dengan cepat seiring perubahan sumber data.

SDK dapat terhubung dengan aman ke lingkungan hybrid Anda, baik di cloud publik/SaaS atau di lingkungan perangkat lunak yang dikelola sendiri. Bukan lagi banyak edit manual, satu perubahan kode bisa diterapkan seragam ke semua area.

Pola-pola ini menunjukkan adanya pergeseran yang lebih luas: dari konfigurasi manual menuju pengembangan yang berulang dan digerakkan oleh perangkat lunak. Dengan memperlakukan pipeline sebagai kode, organisasi dapat menskalakan integrasi data secara lebih andal serta membangun fondasi data yang kuat untuk mendukung AI agen.

Memadukan semuanya

SDK Python watsonx.data integration adalah tonggak penting dalam visi IBM® untuk fondasi data yang siap AI. Dengan menghadirkan otomatisasi programatis ke dalam watsonx.data integration, tim dapat membangun dan memelihara pipeline dengan tingkat ketelitian dan skalabilitas yang sama seperti pengembangan perangkat lunak sekaligus tetap mendukung pengguna melalui cara kerja yang mereka sukai, sehingga membantu menjembatani kesenjangan keterampilan rekayasa data.

Sebagai bagian dari portofolio watsonx.data yang lebih luas, watsonx.data integration bekerja dengan lancar dengan watsonx.data intelligence untuk menghadirkan fondasi data menyeluruh yang tepercaya. Bersama-sama, penawaran ini memungkinkan organisasi untuk memindahkan, memahami, mengatur, dan mengaktifkan data di seluruh lingkungan hybrid, mendukung AI dan alur kerja agen dalam skala besar.

