Apa itu auto-scaling?
Jelajahi optimalisasi biaya cloud
Ilustrasi mewakili infrastruktur cloud hybrid

Diterbitkan: 12 Desember 2023
Kontributor: Gita Jackson, Michael Goodwin

Apa itu auto-scaling?

Auto-scaling, kadang-kadang disebut sebagai “automatic scaling”, adalah fitur komputasi cloud yang secara otomatis mengalokasikan sumber daya komputasi berdasarkan permintaan sistem. 

Auto-scaling digunakan untuk memastikan bahwa aplikasi memiliki sumber daya yang mereka butuhkan untuk mempertahankan ketersediaan yang konsisten dan mencapai tujuan kinerja, serta untuk mempromosikan penggunaan sumber daya cloud yang efisien dan meminimalkan biaya cloud. Menurut white paper tahun 2023 dari Infosys, organisasi yang bermigrasi ke cloud menghemat sekitar 32% dari biaya cloud mereka.1 Karena fokusnya pada pemanfaatan sumber daya yang efisien, penskalaan otomatis adalah komponen yang berguna dalam praktik FinOps yang sukses .

Ketika organisasi mengonfigurasi infrastruktur cloud, mereka menyediakan sumber daya sesuai dengan “dasar” kebutuhan sumber daya komputasi, penyimpanan, dan jaringan. Tetapi permintaan berfluktuasi, misalnya, dengan lonjakan atau penurunan lalu lintas jaringan atau penggunaan aplikasi. Fitur auto-scaling memungkinkan sumber daya ditingkatkan agar sesuai dengan permintaan waktu nyata sesuai dengan metrik tertentu seperti pemanfaatan CPU atau ketersediaan bandwidth, tanpa campur tangan manusia.

Auto-scaling dapat digunakan untuk mengoptimalkan alokasi sumber daya melalui berbagai cara, seperti penskalaan prediktif, yang menggunakan data historis untuk memprediksi permintaan di masa mendatang, atau penskalaan dinamis yang bereaksi terhadap kebutuhan sumber daya secara real time, sebagaimana ditentukan oleh kebijakan auto-scaling organisasi. Kebijakan auto-scaling mengotomatiskan siklus hidup instance komputasi cloud, meluncurkan dan menghentikan virtual machines sesuai kebutuhan untuk membantu permintaan sumber daya. Auto-scaling sering digunakan bersamaan dengan penyeimbangan beban elastis untuk memanfaatkan sepenuhnya sumber daya cloud yang tersedia.

Jelajahi demo interaktif IBM Turbonomic

Mengatur pengeluaran cloud sekaligus menjaga kinerja aplikasi dengan alat optimalisasi biaya cloud yang dapat diotomatisasi.

Konten terkait

Berlangganan buletin IBM

Penyeimbangan beban vs. auto-scaling

Meskipun auto-scaling terkait dengan penyeimbangan beban, namun keduanya tidak sama. Kedua proses ini memengaruhi alokasi sumber daya back-end dan digunakan untuk mengoptimalkan kinerja dan menghindari penyediaan yang berlebihan. Mereka sering digunakan bersama-sama.

Penyeimbang beban mendistribusikan lalu lintas yang masuk ke beberapa server untuk mengurangi beban pada server tertentu. Penyeimbang beban sering menyediakan fitur seperti pemeriksaan kesehatan, yang membantu mengarahkan lalu lintas dari instance yang tidak sehat ke yang sehat. Menyeimbangkan beban lalu lintas membantu meningkatkan performa aplikasi di lingkungan cloud.

Sebaliknya, auto-scaling menyesuaikan kapasitas sistem berdasarkan permintaan untuk mempertahankan kinerja yang konsisten dan menghindari sumber daya yang berlebihan (yaitu hanya menggunakan apa yang dibutuhkan). Auto-scaling menambahkan server baru atau instance komputasi (atau menghentikannya) sesuai dengan permintaan sumber daya dan kebijakan auto-scaling yang telah dibuat oleh organisasi.

Cara kerja auto-scaling

Sebagian besar vendor cloud, seperti IBM Cloud, Amazon Web Services (terkadang disebut AWS Cloud), Microsoft Azure, dan Oracle Cloud Infrastructure menawarkan layanan auto-scaling pada platform cloud mereka. Layanan ini dapat membantu organisasi mengonfigurasi kebijakan auto-scaling untuk memenuhi kebutuhan dan tujuan komputasi cloud organisasi.

Penyedia dan platform yang berbeda menawarkan fitur, kemampuan, dan harga yang berbeda, dan organisasi akan memiliki sumber daya yang berbeda yang tersedia dan berbagai contoh penggunaan, tetapi umumnya auto-scaling berfungsi sebagai berikut:

Prosesnya dimulai dengan konfigurasi peluncuran, atau penerapan dasar, di mana sebuah jenis instance (atau beberapa jenis) diterapkan dengan kapasitas dan fitur kinerja tertentu. Hal ini sering kali dilakukan dengan menggunakan panggilan API dan infrastructure as code (IaC), sebuah proses yang memanfaatkan kode untuk menyediakan dan mengonfigurasi elemen-elemen infrastruktur IT sesuai dengan spesifikasi yang telah ditentukan.

Organisasi akan menentukan kapasitas yang diinginkan, dan jenis atribut apa yang dibutuhkan instance berdasarkan beban kerja yang diharapkan untuk instance tersebut. Dalam menyiapkan kebijakan auto-scaling, organisasi dapat menetapkan target dan ambang batas untuk komputasi, penyimpanan, atau penggunaan jaringan yang, jika terpenuhi, secara otomatis memicu tindakan tertentu untuk mengakomodasi kebutuhan sumber daya saat ini dengan lebih akurat. Jika diinginkan, kebijakan dapat dikonfigurasikan sehingga pemberitahuan dikirim setiap kali tindakan penskalaan dimulai.

Grup auto-scaling

Organisasi juga dapat mengatur grup instance yang mempertahankan jumlah minimum atau maksimum instance untuk beban kerja tertentu, atau mengelompokkan jenis instance yang berbeda untuk menangani berbagai jenis beban kerja. Jenis instance meliputi:2

Contoh tujuan umum

Jenis instance tujuan umum dirancang untuk berbagai beban kerja, termasuk server web, database kecil, serta lingkungan pengembangan dan pengujian.

Instance komputasi optimal

Instance ini dioptimalkan untuk beban kerja intensif komputasi seperti komputasi berkinerja tinggi, pemrosesan batch, dan pemodelan ilmiah. Instance ini memaksimalkan daya komputasi menggunakan GPU dan CPU dengan jumlah inti yang tinggi.

Instance memori optimal

Instans bermemori tinggi ini dioptimalkan untuk beban kerja intensif memori seperti database berkinerja tinggi, cache dalam memori terdistribusi, dan pemrosesan data waktu/analitik big data.

Instance penyimpanan optimal

Instance ini dioptimalkan untuk beban kerja yang membutuhkan banyak penyimpanan seperti big data, penyimpanan data, dan pemrosesan log. Mereka memanfaatkan caching berkapasitas tinggi dan solid state drive (SSD) untuk mendukung aktivitas baca dan tulis yang intens dari beban kerja.


Grup auto-scaling yang dilengkapi jenis instance campuran memungkinkan tim CloudOps dan DevOps memenuhi permintaan sumber daya dengan lebih tepat dan efisien. Misalnya, jika kebutuhan bandwidth terpenuhi dengan baik, tetapi penggunaan CPU telah melampaui ambang batas yang ditetapkan dalam kebijakan auto-scaling, instance khusus komputasi dapat dijalankan sementara instance yang didedikasikan untuk menangani lalu lintas jaringan tetap seperti apa adanya.

Setelah tim memahami permintaan beban kerja, mereka bahkan dapat membuat templat konfigurasi peluncuran untuk instans baru. Template ini menentukan jenis instans, parameter konfigurasi, dan kebijakan lain untuk menghidupkan instans baru dan bagaimana mereka berkontribusi pada lingkungan cloud secara keseluruhan. Hal ini memungkinkan organisasi untuk sepenuhnya mengotomatiskan siklus hidup virtual machines.

Jenis auto-scaling

Ada beberapa jenis penskalaan yang berbeda, juga metode auto-scaling yang berbeda:

Penskalaan horizontal

Penskalaan horizontal, atau “scaling out”, memerlukan penambahan lebih banyak mesin atau node ke lingkungan komputasi cloud. Anda juga dapat mengurangi jumlah node di lingkungan.

Penskalaan vertikal

Penskalaan vertikal, atau “peningkatan skala” adalah proses menambahkan lebih banyak daya, RAM, CPU, penyimpanan, misalnya, ke node yang ada di lingkungan komputasi cloud Anda saat ini.

Kebijakan auto-scaling dapat bersifat prediktif, dinamis, atau terjadwal.

Penskalaan prediktif

Kebijakan penskalaan prediktif menggunakan kecerdasan buatan (AI) dan machine learning untuk mengantisipasi kebutuhan sumber daya di masa depan sebelum terjadi berdasarkan pemanfaatan historis.

Misalnya, kebijakan auto-scaling prediktif dapat mengidentifikasi kemungkinan peningkatan lalu lintas web untuk perusahaan e-commerce menjelang musim belanja liburan dan meningkatkan atau menurunkan sesuai dengan kebijakan yang ditetapkan. Ini dapat membantu meminimalkan latensi jaringan dan waktu henti secara proaktif.

Penskalaan dinamis

Kebijakan penskalaan dinamis bereaksi terhadap kebutuhan sumber daya saat kebutuhan itu terjadi, menyesuaikan alokasi sumber daya berdasarkan pemanfaatan waktu nyata. Dengan kebijakan penskalaan dinamis, organisasi dapat mengirimkan lebih banyak sumber daya ke node tertentu atau grup auto-scaling atau menjalankan instance tambahan saat ambang batas tertentu tercapai, seperti persentase penggunaan CPU.

Misalnya, jika sebuah organisasi menjalankan aplikasi web yang mengkonsumsi sumber daya yang signifikan dengan jadwal yang tidak teratur, kebijakan penskalaan dinamis dapat digunakan untuk menyesuaikan ketersediaan sumber daya sesuai kebutuhan. Penskalaan dinamis sering kali disertai dengan periode pendinginan, di mana sumber daya yang ditingkatkan tetap tersedia jika ada lonjakan lalu lintas tambahan.

Penskalaan terjadwal

Kebijakan auto-scaling terjadwal mengalokasikan sumber daya sesuai dengan jadwal yang telah ditentukan. Sebagai contoh, jika sebuah organisasi mengetahui bahwa lalu lintas atau permintaan sumber daya jauh lebih tinggi di malam hari dibandingkan di pagi hari, kebijakan auto-scaling bisa diatur untuk mengakomodasi permintaan tersebut.

Manfaat auto-scaling

Jika diterapkan secara efektif, auto-scaling dapat memainkan peran penting dalam mengoptimalkan lingkungan komputasi cloud organisasi dan mengurangi biaya cloud secara keseluruhan.

Dengan menetapkan kebijakan auto-scaling yang kuat, organisasi dapat mengurangi ketergantungan mereka pada penyediaan manual dan memastikan kinerja sistem yang lebih konsisten.

Minimalkan konfigurasi infrastruktur secara manual

Auto-scaling memungkinkan lingkungan cloud bereaksi secara real time terhadap permintaan sumber daya tanpa perlu campur tangan manusia. Ini lebih efisien daripada penskalaan manual. Membantu mengurangi kelelahan karyawan, meningkatkan konfigurasi dan konsistensi penyediaan, dan membebaskan waktu karyawan untuk tugas yang lebih berharga.

Meningkatkan skalabilitas

Auto-scaling memungkinkan organisasi untuk memperluas lingkungan dan kemampuan komputasi cloud mereka dengan lebih lancar, tanpa harus mendedikasikan personel tambahan untuk pemantauan dan penyediaan sumber daya.

Memberikan kinerja yang konsisten

Dengan memastikan bahwa lingkungan cloud memiliki sumber daya komputasi, jaringan, dan penyimpanan yang dibutuhkan, apa pun aktivitas atau permintaannya, auto-scaling membantu menjaga kinerja layanan cloud yang konsisten dan andal.

Tingkatkan pengalaman pengguna

Performa aplikasi web dan jaringan yang lebih konsisten berarti tingkat layanan yang lebih konsisten bagi pengguna.

Mengurangi biaya komputasi cloud

Ketika mengandalkan penyediaan sumber daya secara manual, organisasi sering kali melakukan penyediaan berlebih sebagai tindakan pencegahan, hanya untuk memastikan bahwa sumber daya tersedia untuk saat permintaan memuncak. Dengan menggunakan platform yang dapat secara otomatis menskalakan sumber daya komputasi, jaringan, dan penyimpanan untuk memenuhi permintaan secara real-time, perusahaan dapat menghindari penyediaan berlebih dan hanya menggunakan apa yang mereka butuhkan, sehingga menghasilkan tagihan cloud yang lebih rendah dan ROI yang lebih besar.

Solusi terkait
Optimasi biaya cloud dengan IBM® Turbonomic®

Dengan menggunakan solusi otomatisasi dan optimasi cloud yang didukung AI dari platform IBM Turbonomic, Anda dapat terus membantu memastikan performa aplikasi (baik tradisional maupun cloud native) dan mengoptimalkan biaya. Alat bantu manajemen biaya cloud platform ini dapat digunakan dengan lingkungan cloud publik, privat, multicloud, dan hybrid, dan dengan penyedia cloud utama mana pun. 

Jelajahi optimasi biaya cloud dengan IBM Turbonomic Coba Turbonomic secara gratis

IBM Turbonomic

Platform pengoptimalan biaya cloud hybrid IBM Turbonomic memungkinkan Anda untuk terus mengotomatisasi tindakan penting secara real time yang secara proaktif memberikan penggunaan sumber daya komputasi, penyimpanan, dan jaringan yang paling efisien untuk aplikasi Anda di setiap lapis tumpukan. 

Jelajahi IBM Turbonomic Coba demo interaktif
Sumber daya Carhartt: Merek legendaris yang mencapai rekor penjualan liburan

Pelajari bagaimana Carhartt menggunakan perangkat lunak optimasi biaya cloud hybrid IBM Turbonomic untuk membantu infrastruktur cloud hybrid-nya menangani lonjakan permintaan baru yang dramatis.

Praktik Terbaik dalam Memilih Solusi Optimasi Cloud

Baca Laporan PeerPaper eksklusif ini, dengan praktik terbaik berdasarkan wawasan pakar industri dan ulasan dari pengguna IBM Turbonomic yang telah terverifikasi.

AIOps lebih cerdas

Gunakan otomatisasi yang didukung AI untuk bekerja di bisnis Anda untuk membantu memastikan kinerja aplikasi.

Mengoperasikan otomatisasi FinOps

Baca panduan singkat ini untuk menjelajahi disiplin manajemen keuangan cloud yang berkembang pesat, FinOps.

Ikhtisar IBM Turbonomic

Pelajari cara manajemen sumber daya aplikasi mengubah pengamatan menjadi tindakan dengan otomatisasi berbasis AI.

Dokumentasi IBM Turbonomic

Jelajahi dokumentasi untuk semua versi platform IBM Turbonomic.

Ambil langkah selanjutnya

Dengan IBM Turbonomic, Anda dapat menjalankan aplikasi dengan lancar, berkelanjutan, dan hemat biaya untuk membantu mencapai kinerja aplikasi yang efisien sekaligus menurunkan biaya.

Jelajahi Turbonomic Pesan demo gratis
Catatan kaki

“Pengoptimasi biaya cloud" (tautan berada di luar ibm.com), Sarika Nandwani, Infosys.com, 2023

"Jenis-jenis instance AWS EC2: Tantangan dan praktik terbaik untuk menghosting aplikasi Anda di AWS,” Christopher Graham, 23 Agustus 2023