Apa itu AutoML?
Automated machine learning (AutoML) adalah proses mengotomatiskan tugas-tugas manual yang harus diselesaikan oleh para ilmuwan data saat mereka membangun dan melatih model machine learning (model ML). Tugas-tugas ini termasuk rekayasa dan pemilihan fitur, memilih jenis algoritma machine learning; membangun model analitik berdasarkan algoritma; optimasi hiperparameter, melatih model pada set data yang diuji dan menjalankan model untuk menghasilkan skor dan temuan. Para peneliti mengembangkan AutoML untuk membantu ilmuwan data membangun model prediktif tanpa memiliki keahlian model ML yang mendalam. AutoML juga membebaskan para ilmuwan data dari tugas-tugas repetitif yang diperlukan dalam membangun pipeline machine learning, sehingga mereka dapat fokus pada penggalian insight yang diperlukan untuk memecahkan masalah bisnis yang penting.
Apa itu AutoAI?
AutoAI adalah variasi dari AutoML. Proses ini memperluas otomatisasi pembuatan model ke seluruh siklus hidup AI. Seperti AutoML, AutoAI menerapkan otomatisasi cerdas pada langkah-langkah membangun model machine learning yang prediktif. Langkah-langkah ini termasuk menyiapkan set data untuk pelatihan; mengidentifikasi jenis model terbaik untuk data yang diberikan, seperti model klasifikasi atau regresi; dan memilih kolom data yang paling mendukung masalah yang dipecahkan oleh model, dikenal sebagai seleksi fitur. Otomatisasi kemudian menguji berbagai opsi penyetelan hyperparameter untuk mencapai hasil terbaik saat menghasilkan, dan kemudian memberi peringkat, pipeline kandidat model berdasarkan metrik seperti akurasi dan presisi. Pipeline berkinerja terbaik dapat dimasukkan ke dalam produksi untuk memproses data baru dan memberikan prediksi berdasarkan pelatihan model.
Persiapan data | ||
Rekayasa fitur | ||
Optimalisasi hyperparameter
Penerapan model otomatis | ||
Penerapan satu klik | ||
Pengujian dan penilaian model |
Pembuatan kode |
| Dukungan untuk: |
Mitigasi bias dan penyimpangan | ||
Manajemen risiko model
Manajemen siklus hidup AI | ||
Pembelajaran transfer
Model AI apa pun
Pengolahan data tingkat lanjut |
*Harga yang ditampilkan bersifat indikatif, dapat berbeda di setiap negara, tidak termasuk pajak dan bea yang berlaku, serta tergantung pada ketersediaan penawaran produk di wilayah setempat.
Bangun machine learning dan model AI secara otomatis tanpa keahlian ilmu data yang mendalam. Berdayakan ilmuwan data, pengembang, insinyur dan analis ML untuk menghasilkan pipeline model kandidat terbaik. Atasi kesenjangan keahlian dan tingkatkan produktivitas untuk proyek machine learning Anda.
Buat model AI dan machine learning khusus dalam hitungan menit atau bahkan detik. Buat eksperimen, latih, dan terapkan model dengan lebih cepat dalam skala besar. Tingkatkan kemungkinan pengulangan dan tata kelola machine learning dan siklus hidup model AI sekaligus mengurangi tugas-tugas biasa yang memakan waktu.
Tangani keterjelasan, keadilan, ketahanan, transparansi, dan privasi sebagai bagian dari siklus hidup AI. Kurangi penyimpangan model, bias, dan risiko dalam AI dan machine learning. Validasi dan pantau model untuk memverifikasi bahwa kinerja AI dan machine learning memenuhi tujuan bisnis. Bantu pemenuhan tanggung jawab sosial perusahaan (CSR) dan tata kelola sosial lingkungan (ESG).
Pangkas biaya operasi model AI dan machine learning (ModelOps) dengan menyatukan alat, proses, dan orang. Kurangi pengeluaran untuk mengelola alat dan infrastruktur lama atau titik. Hemat waktu dan sumber daya untuk menghasilkan model yang siap produksi dengan siklus hidup AI dan ML otomatis.
Ketahui mengapa IBM diakui sebagai Pemimpin dalam 2021 Magic Quadrant for Data Science and Machine Learning
Memfasilitasi kolaborasi antara ilmuwan data dan DevOps untuk mengoptimalkan integrasi model AI ke dalam aplikasi.
Jelajahi pentingnya membangun kepercayaan pada AI produksi sekaligus mendapatkan hasil lebih cepat dan mengelola risiko dan kepatuhan.
Pelajari bagaimana model dapat memprediksi nilai masa depan dari suatu deret waktu dengan menggabungkan model berkinerja terbaik dari semua kelas model yang memungkinkan, bukan hanya satu kelas saja.
Terapkan berbagai algoritma, atau estimator, untuk menganalisis, membersihkan, dan menyiapkan data mentah untuk machine learning. Deteksi dan kategorikan fitur berdasarkan tipe data, seperti kategorikal atau numerik. Gunakan optimasi hiperparameter untuk menentukan strategi terbaik untuk imputasi nilai yang hilang, pengkodean fitur, dan penskalaan fitur.
Pilih model melalui pengujian algoritma kandidat dan pemeringkatan terhadap himpunan bagian kecil dari data. Secara bertahap tingkatkan ukuran subset untuk algoritma yang paling menjanjikan. Aktifkan peringkat sejumlah besar algoritma kandidat untuk pemilihan model dengan kecocokan terbaik untuk data.
Ubah data mentah menjadi kombinasi fitur yang paling mewakili masalah untuk mencapai prediksi yang paling akurat. Jelajahi berbagai pilihan konstruksi fitur secara terstruktur dan tidak lengkap, sambil secara progresif memaksimalkan akurasi model menggunakan pembelajaran penguatan.
Sempurnakan dan optimalkan pipeline model menggunakan pelatihan model dan penilaian yang khas dalam machine learning. Pilih model terbaik untuk dimasukkan ke dalam produksi berdasarkan kinerja.
Integrasikan pemantauan pada penyimpangan model, keadilan dan kualitas melalui detail input dan output model, data pelatihan dan pencatatan muatan. Terapkan mitigasi bias pasif atau aktif, sambil menganalisis bias langsung dan tidak langsung.
Lakukan pengembangan menggunakan insight model dan data dan validasi apakah model Anda memenuhi kinerja yang Anda harapkan. Tingkatkan model Anda secara terus-menerus dengan mengukur kualitas model dan membandingkan kinerja model.
Sebagai bagian dari platform data dan AI menyeluruh IBM Cloud Pak for Data, IBM Watson Studio dilengkapi dengan toolkit AutoAI yang secara otomatis menyiapkan data, menerapkan algoritma machine learning, dan membangun pipeline model yang paling sesuai untuk kumpulan data dan contoh penggunaan pemodelan prediktif Anda.
Seret file .csv dan pilih kolom yang akan diprediksi.
Memberi peringkat akurasi model dan tampilkan informasi saluran.
Tinjau akurasi, presisi, dan perolehan kembali untuk menilai model.
Promosikan model ke ruang penerapan.
Lihat manfaat yang didapatkan oleh bank ini setelah menggunakan IBM Cloud Pak for Data untuk menganalisis data, menilai pergeseran data, dan mengukur kinerja model.
Pelajari bagaimana jaringan layanan kesehatan ini membangun model prediktif yang menggunakan data klaim asuransi untuk mengidentifikasi pasien yang mungkin mengalami sepsis.
Pelajari cara agensi komunikasi pemasaran ini menggunakan AutoAI untuk mendorong prediksi volume tinggi dan mengidentifikasi pelanggan baru.
Tim IBM Research berkomitmen untuk menerapkan teknik-teknik mutakhir dari AI, ML, dan manajemen data untuk mempercepat dan mengoptimalkan pembuatan alur kerja machine learning dan ilmu data. Upaya pertama tim seputar AutoML berfokus pada penggunaan pengoptimalan hyperband/Bayesian untuk pencarian hyperparameter dan hyperband/ENAS/DARTS untuk Pencarian Arsitektur Neural.
Mereka terus berfokus pada pengembangan AutoAI, termasuk otomatisasi konfigurasi pipeline dan optimalisasi hyperparameter. Peningkatan yang signifikan adalah algoritma optimasi hyperparameter, yang dioptimalkan untuk evaluasi fungsi biaya seperti pelatihan model dan penilaian. Langkah ini membantu mempercepat konvergensi ke solusi terbaik.
IBM Research juga menerapkan kecerdasan buatan otomatis untuk membantu memastikan kepercayaan dan keterjelasan dalam model AI. Dengan AutoAI di IBM Watson Studio, pengguna dapat melihat visualisasi dari setiap tahap proses, mulai dari persiapan data, pemilihan algoritme, hingga pembuatan model. Selain itu, IBM AutoAI mengotomatiskan tugas-tugas untuk peningkatan model yang berkelanjutan dan memudahkan pengintegrasian API model AI ke dalam aplikasi melalui kemampuan ModelOps. Evolusi AutoAI dalam produk IBM Watson Studio telah membuat IBM dinobatkan sebagai Pemimpin dalam 2021 Gartner Magic Quadrant for Data Science and Machine Learning Platforms.
Pembelajaran mendalam adalah subbidang machine learning dan dikenal karena memberdayakan aplikasi dan layanan AI yang melakukan tugas analitis dan fisik tanpa campur tangan manusia. Contoh penggunaan untuk pembelajaran mendalam meliputi chatbot, teknologi pengenalan gambar medis, dan deteksi penipuan. Namun, seperti halnya machine learning, merancang dan menjalankan algoritma pembelajaran mendalam membutuhkan sejumlah besar upaya manusia serta daya komputasi.
Tim IBM Research telah mengeksplorasi salah satu proses paling rumit dan memakan waktu dalam pembelajaran mendalam: penciptaan arsitektur neural melalui teknik yang disebut pencarian arsitektur neural (NAS). Tim ini mengulas metode NAS yang dikembangkan dan mempresentasikan manfaat dari masing-masing metode dengan tujuan untuk membantu para praktisi memilih metode yang sesuai. Mengotomatiskan pendekatan untuk menemukan arsitektur berkinerja terbaik untuk model machine learning dapat mengarah pada demokratisasi AI yang lebih besar, tetapi masalah ini cukup rumit dan sulit dipecahkan.
Dengan layanan Deep Learning di dalam IBM Watson Studio, Anda masih dapat memulai pembelajaran mendalam dengan cepat. Layanan ini membantu Anda mendesain jaringan neural yang kompleks, kemudian bereksperimen dalam skala besar untuk menerapkan model machine learning yang dioptimalkan. Didesain untuk menyederhanakan proses pelatihan model, layanan ini juga menyediakan kluster komputasi GPU sesuai permintaan untuk mengatasi kebutuhan daya komputasi. Anda juga dapat mengintegrasikan kerangka kerja ML sumber terbuka yang populer seperti TensorFlow, Caffe, Torch, dan Chainer untuk melatih model pada beberapa GPU dan mempercepat hasil. Di IBM Watson Studio, Anda dapat menggabungkan AutoML, IBM AutoAI, dan layanan Deep Learning untuk mempercepat eksperimen, menganalisis data terstruktur dan tidak terstruktur, dan menerapkan model yang lebih baik dengan lebih cepat.
Permintaan akan AutoML telah mengarah pada pengembangan perangkat lunak sumber terbuka yang dapat digunakan oleh pakar maupun non-pakar ilmu data. Alat sumber terbuka terkemuka yang tersedia antara lain adalah auto-sklearn, auto-keras dan auto-weka. IBM Research berkontribusi pada Lale, perpustakaan Python yang memperluas kemampuan scikit-learn untuk mendukung spektrum otomatisasi yang luas, termasuk pemilihan algoritma, penyetelan hyperparameter, dan pencarian topologi. Seperti yang dijelaskan dalam makalah dari IBM Research, Lale bekerja dengan secara otomatis menghasilkan ruang pencarian untuk alat AutoML yang sudah mapan. Eksperimen menunjukkan ruang pencarian ini mencapai hasil yang kompetitif dengan alat canggih sekaligus menawarkan lebih banyak keserbagunaan.