Apa itu auto-scaling?

Pengusaha muda bekerja di perusahaan startup

Penyusun

Gita Jackson

Staff Writer

Michael Goodwin

Staff Editor, Automation & ITOps

IBM Think

Apa itu auto-scaling?

Auto-scaling, kadang-kadang disebut sebagai “automatic scaling”, adalah fitur komputasi cloud yang secara otomatis mengalokasikan sumber daya komputasi berdasarkan permintaan sistem.

Auto-scaling digunakan untuk memastikan bahwa aplikasi memiliki sumber daya yang mereka butuhkan untuk mempertahankan ketersediaan yang konsisten dan mencapai tujuan kinerja, serta untuk mempromosikan penggunaan sumber daya cloud yang efisien dan meminimalkan biaya cloud.

Menurut white paper 2023 dari Infosys, organisasi yang bermigrasi ke cloud membuang sekitar 32% dari biaya cloud mereka.1 Karena fokusnya pada pemanfaatan sumber daya yang efisien, Auto-Scaling adalah komponen yang berguna dalam praktik FinOps yang sukses.

Ketika organisasi mengonfigurasi infrastruktur cloud, mereka menyediakan sumber daya sesuai dengan “dasar” kebutuhan sumber daya komputasi, penyimpanan, dan jaringan. Tetapi permintaan berfluktuasi, misalnya, dengan lonjakan atau penurunan lalu lintas jaringan atau penggunaan aplikasi. Fitur auto-scaling memungkinkan sumber daya untuk disesuaikan dengan permintaan waktu nyata sesuai dengan metrik tertentu seperti penggunaan CPU atau ketersediaan bandwidth, tanpa campur tangan manusia.

Auto-Scaling dapat digunakan untuk mengoptimalkan alokasi sumber daya melalui berbagai cara. Misalnya, penskalaan prediktif menggunakan data historis untuk memprediksi permintaan di masa depan. Atau, Auto-Scaling dinamis, yang bereaksi terhadap kebutuhan sumber daya secara real-time sebagaimana ditentukan oleh kebijakan Auto-Scaling organisasi.

Kebijakan auto-scaling mengotomatiskan siklus hidup instans komputasi cloud, meluncurkan dan menghentikan mesin virtual sesuai kebutuhan untuk membantu permintaan sumber daya. Auto-scaling sering digunakan bersamaan dengan penyeimbangan beban elastis untuk memanfaatkan sepenuhnya sumber daya cloud yang tersedia.

Pemandangan udara dari jalan raya

Dapatkan ketenangan saat menggunakan cloud 


Dapatkan Buletin Think mingguan untuk mendapatkan panduan pakar dalam mengoptimalkan pengaturan multicloud di era AI.

Penyeimbangan beban terhadap auto-scaling

Meskipun auto-scaling terkait dengan penyeimbangan beban, namun keduanya tidak sama. Kedua proses ini memengaruhi alokasi sumber daya back-end dan digunakan untuk mengoptimalkan kinerja dan menghindari penyediaan yang berlebihan. Mereka sering digunakan bersama-sama.

Penyeimbang beban mendistribusikan lalu lintas yang masuk ke beberapa server untuk mengurangi beban pada server tertentu. Penyeimbang beban sering menyediakan fitur seperti pemeriksaan kesehatan, yang membantu mengarahkan lalu lintas dari instans yang tidak sehat ke yang sehat. Menyeimbangkan beban lalu lintas membantu meningkatkan kinerja aplikasi di lingkungan cloud.

Auto-scaling menyesuaikan kapasitas sistem sesuai dengan permintaan untuk mempertahankan kinerja yang konsisten dan mencegah penyediaan berlebih sumber daya (yaitu hanya menggunakan sumber daya yang dibutuhkan). Auto-scaling menambahkan server baru atau instans komputasi (atau menghentikannya) sesuai dengan permintaan sumber daya dan kebijakan auto-scaling yang telah dibuat oleh organisasi.

Akademi AI

Mencapai kesiapan AI dengan hybrid cloud

Dipandu oleh pemimpin terkemuka IBM, kurikulum dirancang untuk membantu pemimpin bisnis dalam mendapatkan pengetahuan yang diperlukan demi memprioritaskan investasi AI untuk mendorong pertumbuhan.

Cara kerja auto-scaling

Sebagian besar vendor cloud, seperti IBM Cloud, Amazon Web Services (yang seringkali disebut AWS Cloud), Microsoft Azure dan Oracle Cloud Infrastructure menawarkan layanan auto-scaling pada platform cloud mereka. Layanan ini dapat membantu organisasi mengonfigurasi kebijakan auto-scaling untuk memenuhi kebutuhan dan tujuan komputasi cloud organisasi.

Pemasok dan platform yang berbeda menawarkan fitur, kemampuan, dan harga yang berbeda, dan organisasi akan memiliki sumber daya yang berbeda yang tersedia dan berbagai contoh penggunaan, tetapi umumnya auto-scaling bekerja sebagai berikut:

Prosesnya dimulai dengan konfigurasi peluncuran, atau penerapan dasar, di mana sebuah jenis instans (atau beberapa jenis) diterapkan dengan kapasitas dan fitur kinerja tertentu. Penerapan ini sering dilakukan menggunakan panggilan API dan infrastruktur sebagai kode (IaC), sebuah proses yang memanfaatkan kode untuk menyediakan dan mengonfigurasi elemen infrastruktur TI ke spesifikasi yang telah ditentukan.

Organisasi menentukan kapasitas yang diinginkan, dan jenis atribut apa yang dibutuhkan instance berdasarkan beban kerja yang diharapkan untuk instans tersebut. Dalam menyiapkan kebijakan Auto-Scaling, organisasi dapat menetapkan target dan ambang batas untuk penggunaan komputasi, penyimpanan, atau jaringan. Bila ambang batas ini terpenuhi, secara otomatis dapat memicu tindakan tertentu untuk mengakomodasi tuntutan sumber daya saat ini dengan lebih akurat. Jika diinginkan, kebijakan dapat dikonfigurasikan sehingga pemberitahuan dikirim setiap kali tindakan penskalaan dimulai.

Grup auto-scaling

Organisasi juga dapat mengatur grup instance yang mempertahankan jumlah minimum atau maksimum instance untuk beban kerja tertentu, atau mengelompokkan jenis instance yang berbeda untuk menangani berbagai jenis beban kerja. Jenis instance meliputi:2

Contoh tujuan umum

Jenis instance tujuan umum dirancang untuk berbagai beban kerja, seperti server web, basis data kecil, dan lingkungan pengembangan dan pengujian.

Instance komputasi optimal

Instans ini dioptimalkan untuk beban kerja intensif komputasi seperti komputasi berkinerja tinggi, pemrosesan batch, dan pemodelan ilmiah. Instans ini memaksimalkan daya komputasi menggunakan GPU dan CPU dengan jumlah inti yang tinggi.

Instance memori optimal

Instans bermemori tinggi ini dioptimalkan untuk beban kerja intensif memori seperti basis data berkinerja tinggi, cache dalam memori terdistribusi, pemrosesan data real-time, dan analitik big data.

Instance penyimpanan optimal

Instans ini dioptimalkan untuk beban kerja yang membutuhkan banyak penyimpanan seperti big data, penyimpanan data, dan pemrosesan log. Mereka memanfaatkan caching berkapasitas tinggi dan solid-state drives (SSD) untuk mendukung aktivitas baca dan tulis yang intens dari beban kerja.

Grup auto-scaling yang dilengkapi jenis instance campuran memungkinkan tim CloudOps dan DevOps memenuhi permintaan sumber daya dengan lebih tepat dan efisien. Misalnya, jika kebutuhan bandwidth terpenuhi dengan baik, tetapi penggunaan CPU melebihi ambang batas yang ditetapkan dalam kebijakan auto-scaling, sistem dapat mengaktifkan lebih banyak instans khusus komputasi. Sementara itu instance yang khusus untuk menangani lalu lintas jaringan tetap seperti apa adanya.

Setelah tim memahami permintaan beban kerja, mereka bahkan dapat membuat templat konfigurasi peluncuran untuk instans baru. Template ini menentukan jenis instans, parameter konfigurasi, dan kebijakan lain untuk menghidupkan instans baru dan bagaimana mereka berkontribusi pada lingkungan cloud secara keseluruhan. Hal ini memungkinkan organisasi untuk sepenuhnya mengotomatiskan siklus hidup virtual machines.

Jenis auto-scaling

Ada beberapa jenis penskalaan, serta beberapa metode auto-scaling:

Penskalaan horizontal

Penskalaan horizontal, atau “scaling out”, memerlukan penambahan lebih banyak mesin atau node ke lingkungan komputasi cloud. Anda juga dapat mengurangi jumlah node di lingkungan.

Penskalaan vertikal

Penskalaan vertikal, atau “peningkatan skala” adalah proses menambahkan lebih banyak daya, RAM, CPU, penyimpanan, misalnya, ke node yang ada di lingkungan komputasi cloud Anda saat ini.

Kebijakan auto-scaling dapat bersifat prediktif, dinamis, atau terjadwal.

Penskalaan prediktif

Kebijakan penskalaan prediktif menggunakan kecerdasan buatan (AI) dan machine learning untuk mengantisipasi kebutuhan sumber daya di masa depan sebelum terjadi berdasarkan pemanfaatan historis.

Misalnya, kebijakan auto-scaling prediktif dapat mengidentifikasi kemungkinan peningkatan lalu lintas web untuk perusahaan e-niaga menjelang musim pembelian liburan. Ini mungkin diperbesar atau ditingkatkan sesuai dengan kebijakan yang ditetapkan. Pendekatan ini dapat membantu meminimalkan latensi jaringan dan waktu henti secara proaktif.

Penskalaan dinamis

Kebijakan penskalaan dinamis bereaksi terhadap kebutuhan sumber daya saat kebutuhan itu terjadi, menyesuaikan alokasi sumber daya berdasarkan pemanfaatan real-time. Dengan kebijakan penskalaan dinamis, organisasi dapat mengirim lebih banyak Sumber daya ke node tertentu atau grup auto-scaling. Mereka juga dapat memutar contoh tambahan ketika ambang batas tertentu, seperti persentase penggunaan CPU, tercapai.

Misalnya, jika sebuah organisasi menjalankan aplikasi web yang mengkonsumsi sumber daya yang signifikan dengan jadwal yang tidak teratur, kebijakan penskalaan dinamis dapat digunakan untuk menyesuaikan ketersediaan sumber daya sesuai kebutuhan. Penskalaan dinamis sering kali disertai dengan periode pendinginan, di mana sumber daya yang ditingkatkan tetap tersedia jika ada lonjakan lalu lintas tambahan.

Penskalaan terjadwal

Kebijakan auto-scaling terjadwal mengalokasikan sumber daya sesuai dengan jadwal yang telah ditentukan. Sebagai contoh, jika sebuah organisasi mengetahui bahwa lalu lintas atau permintaan sumber daya jauh lebih tinggi di malam hari dibandingkan di pagi hari, kebijakan auto-scaling bisa diatur untuk mengakomodasi permintaan tersebut.

Manfaat auto-scaling

Jika diterapkan secara efektif, auto-scaling dapat memainkan peran penting dalam mengoptimalkan lingkungan komputasi cloud organisasi dan mengurangi biaya cloud secara keseluruhan.

Dengan menetapkan kebijakan auto-scaling yang kuat, organisasi dapat mengurangi ketergantungan mereka pada penyediaan manual dan memastikan kinerja sistem yang lebih konsisten.

Minimalkan konfigurasi infrastruktur secara manual

Auto-scaling memungkinkan lingkungan cloud bereaksi secara real-time terhadap permintaan sumber daya tanpa perlu diintervensi oleh manusia. Ini lebih efisien daripada penskalaan manual. Membantu mengurangi kelelahan karyawan, meningkatkan konfigurasi dan konsistensi penyediaan, dan membebaskan waktu karyawan untuk tugas yang lebih berharga.

Meningkatkan skalabilitas

Auto-scaling memungkinkan organisasi untuk memperluas lingkungan dan kemampuan komputasi cloud mereka dengan lebih lancar, tanpa harus mendedikasikan personel tambahan untuk pemantauan dan penyediaan sumber daya.

Memberikan kinerja yang konsisten

Dengan memastikan bahwa lingkungan cloud memiliki sumber daya komputasi, jaringan, dan penyimpanan yang dibutuhkan, apa pun aktivitas atau permintaannya, auto-scaling membantu menjaga kinerja layanan cloud yang konsisten dan andal.

Tingkatkan pengalaman pengguna

Kinerja aplikasi web dan jaringan yang lebih konsisten berarti tingkat layanan yang lebih konsisten bagi pengguna.

Mengurangi biaya komputasi cloud

Ketika mengandalkan penyediaan sumber daya secara manual, organisasi sering kali melakukan penyediaan berlebih sebagai tindakan pencegahan, hanya untuk memastikan bahwa sumber daya tersedia untuk saat permintaan memuncak. Dengan menggunakan platform yang dapat secara otomatis menskalakan sumber daya komputasi, jaringan, dan penyimpanan untuk memenuhi permintaan secara real-time, organisasi dapat menghindari kelebihan penyediaan. Pendekatan ini memastikan bahwa mereka hanya menggunakan apa yang mereka butuhkan, menghasilkan tagihan cloud yang lebih rendah dan ROI yang lebih besar.

Solusi terkait

Paket gratis IBM Cloud 

Buat akun IBM Cloud gratis Anda dan akses lebih dari 40 produk yang selalu gratis, termasuk API IBM Watson.

Membuat akun
IBM Cloud  

IBM Cloud adalah platform cloud perusahaan yang dirancang untuk industri teregulasi, serta menyediakan solusi hybrid, aman, dan kompatibel dengan AI.

Jelajahi solusi cloud
Layanan Konsultasi Cloud 

Dapatkan kemampuan baru dan dorong ketangkasan bisnis dengan layanan konsultasi cloud IBM. Temukan cara menciptakan solusi dengan berkreasi bersama, mempercepat transformasi digital, dan mengoptimalkan kinerja melalui strategi hybrid cloud dan kemitraan pakar.

Layanan cloud
Ambil langkah selanjutnya

Dapatkan potensi penuh AI dan hybrid cloud dengan platform IBM yang aman dan dapat diskalakan. Mulai dengan menjelajahi solusi siap AI kami atau buat akun gratis untuk mengakses produk dan layanan yang selalu gratis.

Jelajahi solusi AI IBM Cloud Buat akun IBM Cloud gratis
Catatan kaki

Optimalisasi biaya cloud" , Sarika Nandwani, Infosys.com, 2023.

Jenis-jenis instance AWS EC2: Tantangan dan praktik terbaik untuk menghosting aplikasi Anda di AWS”, Christopher Graham, 23 Agustus 2023.