Apa yang dimaksud model deret waktu?

Penyusun

Ivan Belcic

Staff writer

Cole Stryker

Staff Editor, AI Models

IBM Think

Apa itu model deret waktu?

Model deret waktu adalah model machine learning yang dapat menganalisis data deret waktu berurutan dan memprediksi nilai masa depan. Kumpulan data deret waktu terdiri dari nilai data yang diurutkan dari waktu ke waktu, dengan waktu sebagai variabel independen. Analisis deret waktu memungkinkan perkiraan nilai data masa depan berdasarkan nilai sebelumnya dalam urutan. 

Apa itu pemodelan deret waktu?

Pemodelan deret waktu adalah penggunaan algoritma machine learning dan metode statistik untuk menganalisis titik-titik data yang berubah selama periode waktu tertentu. 

Kumpulan data deret waktu berbeda dari kumpulan data lain karena tidak terdiri dari titik data independen yang tidak terkait. Sementara banyak kumpulan data didasarkan pada pengamatan individu, kumpulan data deret waktu diberi label dengan stempel waktu dan melacak variabel dalam satu periode waktu, sehingga menciptakan ketergantungan antar titik data. Dependensi adalah hubungan antara titik data di mana nilai satu data memengaruhi nilai yang lain. 

Dengan pemodelan deret waktu univariat, waktu adalah satu-satunya variabel independen. Semua variabel lain tergantung pada nilai sebelumnya. Pemodelan deret waktu multivariat memiliki lebih banyak variabel independen, seperti kondisi cuaca atau informasi demografis.

Berita teknologi terbaru, didukung oleh insight dari pakar

Tetap terinformasi tentang tren industri yang paling penting—dan menarik—tentang AI, otomatisasi, data, dan di luarnya dengan buletin Think. Lihat Pernyataan Privasi IBM®.

Terima kasih! Anda telah berlangganan.

Langganan Anda akan disediakan dalam bahasa Inggris. Anda akan menemukan tautan berhenti berlangganan di setiap buletin. Anda dapat mengelola langganan atau berhenti berlangganan di sini. Lihat Pernyataan Privasi IBM® kami untuk informasi lebih lanjut.

Konsep kunci untuk pemodelan deret waktu

Banyak konsep inti dari pemodelan deret waktu adalah fitur temporal: aspek data yang terkait dengan atau berasal dari waktu. Konsep ini meliputi: 

  • Autokorelasi

  • Musiman

  • Stasioneritas

Autokorelasi

Autokorelasi mengukur sejauh mana nilai saat ini sesuai dengan nilai masa lalu dari data historis dalam deret waktu. Autokorelasi tinggi berarti bahwa iterasi deret waktu saat ini memetakan secara dekat ke versi tertinggal. Autokorelasi mengidentifikasi apakah deret waktu berulang dan dapat menunjukkan musiman. 

Autokorelasi bisa positif atau negatif. Autokorelasi positif berarti bahwa nilai tinggi mengarah ke nilai yang lebih tinggi dan nilai rendah mengarah ke nilai yang lebih rendah. Autokorelasi negatif adalah sebaliknya: nilai tinggi mengikuti nilai rendah dan sebaliknya.

Musiman

Musiman adalah karakteristik data deret waktu yang memiliki pola berulang berdasarkan interval waktu yang teratur, seperti pergantian musim. Sebagai contoh, platform e-commerce mungkin menjual lebih banyak kacamata hitam pada musim semi dan musim panas, dan lebih banyak syal pada musim gugur dan musim dingin. Rumah tangga biasanya menggunakan lebih banyak listrik pada siang hari daripada malam hari. 

Variasi musiman yang bergantung pada waktu berguna saat memprediksi nilai masa depan dengan model forecasting. Alat visualisasi data seperti bagan dan grafik menggambarkan musim sebagai fluktuasi berulang, sering kali dalam bentuk gelombang sinusoidal. 

Selama analisis data deret waktu, proses dekomposisi mengungkapkan setiap musiman yang ada dalam data, serta tren dan ketidakakuratan. Tren adalah kenaikan atau penurunan jangka panjang dalam nilai data, sedangkan ketidakakuratan mengacu pada variasi acak yang tidak mengikuti pola yang dapat diprediksi. Ketidakakuratan sering berasal dari kesalahan dan outlier.

Stasioneritas

Deret waktu stasioner memiliki sifat statistik statis, seperti rata-rata dan varians. Dengan stasioneritas, titik data dapat berfluktuasi sesuai musim, tetapi tidak ada tren yang lebih besar. Rangkaian waktu suhu global rata-rata tahunan modern akan menjadi tidak stasioner karena efek perubahan iklim yang mendorong kenaikan suhu. 

Stasioneritas diperlukan agar sebagian besar model deret waktu berfungsi secara efektif. Uji Dickey-Fuller mengungkapkan apakah kumpulan data bersifat stasioner. Kumpulan data deret waktu tanpa stasioneritas dapat ditransformasikan dengan teknik seperti pembedaan untuk menghilangkan tren dan mengisolasi pola lain, seperti musiman dan autokorelasi.

Mixture of Experts | 12 Desember, episode 85

Decoding AI: Rangkuman Berita Mingguan

Bergabunglah dengan panel insinyur, peneliti, pemimpin produk, dan sosok kelas dunia lainnya selagi mereka mengupas tuntas tentang AI untuk menghadirkan berita dan insight terbaru seputar AI.

Model deret waktu

Saat menghadapi tantangan forecasting deret waktu, ilmuwan data dapat memilih dari berbagai algoritma machine learning. Tergantung pada sifat kumpulan data, beberapa algoritma lebih tepat daripada yang lain. Model satu langkah memprediksi titik berikutnya dalam deret waktu, sementara model dengan banyak langkah menghasilkan beberapa prediksi deret waktu. 

Jenis model deret waktu meliputi: 

  • Rata-rata pergerakan terintegrasi autoregresif (ARIMA) 

  • Perataan eksponensial

  • Generalized autoregressive conditional heteroscedasticity (GARCH) 

  • Long short-term memory (LSTM) 

Model sumber terbuka Prophet dari Meta dan DeepAR dari Amazon adalah dua model AI lain yang dibangun untuk pemodelan deret waktu. Mengadaptasi model regresi linier untuk tugas perkiraan deret waktu juga dapat dilakukan. Model pembelajaran diawasi lainnya seperti XGBoost dan random forest dapat diterapkan untuk data deret waktu nonlinier.

Rata-rata pergerakan terintegrasi autoregresif (ARIMA)

Keluarga model ARIMA terdiri dari banyak model fondasi modular yang dapat dijalankan sendiri atau digabungkan dalam berbagai pengelompokan. ARIMA adalah model statistik yang memprediksi nilai masa depan berdasarkan peristiwa masa lalu dan bekerja paling baik dengan deret waktu stasioner yang menunjukkan musiman. Model ini unggul untuk kumpulan data univariat dan juga dapat disesuaikan untuk contoh penggunaan multivariat. 

Konfigurasi ARIMA meliputi: 

  • Autoregresi (AR): Model autoregresif, dilambangkan sebagai AR(p), memprediksi nilai masa depan dari suatu variabel berdasarkan nilai masa lalu dalam jangka waktu stokastik: variabel yang tidak dapat diprediksi secara sempurna. Parameter p menunjukkan tingkat kelambatan atau jumlah titik data yang digunakan untuk membuat prediksi. Nilai p sebesar 1 akan kembali ke pengamatan sebelumnya dalam deret tersebut. 

  • Rata-rata bergerak (MA): Model rata-rata bergerak dilambangkan sebagai MA(q), memprediksi nilai masa depan berdasarkan kesalahan prediksi pada masa lalu. Parameter q adalah jumlah kesalahan yang disertakan dalam prediksi. Model MA(1) akan menggabungkan satu kesalahan masa lalu. 

  • Integrasi (I): Model terintegrasi menambahkan pembedaan (d) untuk membuat deret waktu stasioner. Pembedaan mengganti nilai data dengan perbedaan antara nilai saat ini dan nilai sebelumnya, menciptakan deret baru untuk menunjukkan perubahan nilai. Parameter d mengindikasikan berapa kali titik data dibedakan. 

  • Rata-rata bergerak autoregresif (ARMA): Model ARMA menggabungkan autoregresi dengan rata-rata bergerak. Model ARMA dapat memproses deret waktu stasioner dan dilambangkan sebagai ARMA(p, q). 

  • Rata-rata bergerak terintegrasi autoregresif (ARIMA): Model ARIMA, dilambangkan sebagai ARIMA(p, d, q) menambahkan pembedaan untuk memodelkan deret waktu yang tidak stasioner. 

  • Rata-rata bergerak terintegrasi autoregresif musiman (SARIMA): Model SARIMA menambahkan musiman. Parameter untuk musim ditunjukkan dengan huruf kapital dan parameter m menunjukkan durasi musim. Model SARIMA dilambangkan sebagai SARIMA(p, d, q)(P, D, Q)m dan membutuhkan sejumlah besar data historis. 

  • SARIMA dengan variabel eksogen (SARIMAX): Data deret waktu lebih kompleks yang mencakup variabel selain waktu. Model SARIMAX menggabungkan variabel eksternal untuk menghasilkan perkiraan yang lebih mendalam. 

  • Autoregresi vektor (VAR): Meskipun ARIMA bekerja paling baik untuk tugas-tugas univariat, autoregresi vektor (VAR) dapat menangani kumpulan data multivariat. Model VAR, termasuk VARMA dan VARMAX, dapat membuat prediksi untuk beberapa model deret waktu secara bersamaan.

Penghalusan eksponensial

Model penghalusan eksponensial mengurangi ketidakakuratan dengan memberikan bobot atau kepentingan yang semakin kecil pada observasi yang lebih tua dalam deret waktu. Pengamatan yang lebih baru dianggap lebih relevan dalam membuat prediksi masa depan. Model penghalusan eksponensial meliputi: 

  • Penghalusan eksponensial sederhana (SES): Bentuk paling dasar dari penghalusan eksponensial yang memodifikasi MA untuk memberikan lebih banyak bobot pada pengamatan terbaru. Dibandingkan dengan model rata-rata bergerak langsung, SES mengurangi ketidakakuratan sekaligus mempertahankan lebih banyak detail. 

  • Penghalusan eksponensial ganda (DES): Menerapkan penghalusan eksponensial dua kali secara rekursif dapat membantu melawan tren. DES menggunakan parameter α sebagai faktor penghalusan data dan β sebagai faktor penghalusan tren. 

  • Penghalusan eksponensial tiga kali lipat (TES): Untuk kumpulan data dengan tren dan musiman, TES—dikenal juga sebagai penghalusan eksponensial Holt-Winters (HWES)—menerapkan penghalusan untuk ketiga kalinya. Parameter γ adalah faktor penghalusan musiman. 

  • TBATS: TBATS (trigonometri, Box-Cox, ARMA, tren, dan komponen musiman) adalah model penghalusan eksponensial khusus untuk kumpulan data deret waktu dengan musiman yang kompleks.

Generalized autoregressive conditional heteroscedasticity (GARCH)

GARCH adalah model khusus yang melacak volatilitas di sektor keuangan. Misalnya, di pasar saham, volatilitas adalah tingkat dan kecepatan fluktuasi harga saham. Heteroskedastisitas berarti bahwa kesalahan dalam model regresi tidak berbagi varians yang sama dari waktu ke waktu. 

Dalam ilmu data, variabel dianggap homoskedastik jika variansinya sama dan heteroskedastik jika tidak.

Memori jangka pendek yang panjang (LSTM)

LSTM membawa kekuatan neural networks pembelajaran mendalam ke pemodelan deret waktu. Model LSTM adalah recurrent neural network (RNN) yang mengkhususkan diri dalam data berurutan—seperti deret waktu. LSTM unggul dalam menangkap dependensi jarak jauh: hubungan antara titik data yang jauh dalam satu urutan. 

Karena mereka dapat mempertahankan lebih banyak konteks daripada jenis model lainnya, model LSTM bekerja dengan baik dalam aplikasi yang kompleks, seperti pemrosesan bahasa alami (NLP) dan mengenali ucapan dan gambar dunia nyata. Mereka membutuhkan sejumlah besar data pelatihan dan dapat dibangun di Python.

Metrik pemodelan deret waktu

Metrik pembandingan, pengujian, dan validasi membantu mengoptimalkan kinerja model, seperti yang dilakukan di banyak aplikasi machine learning lainnya. 

Metrik pemodelan deret waktu meliputi: 

  • Rata-rata kuadrat kesalahan (MSE): Rata-rata kuadrat kesalahan pada setiap stempel waktu. 

  • Akar rata-rata kuadrat kesalahan (RMSE): Akar kuadrat dari MSE. 

  • Rata-rata kesalahan absolut (MAE): Rata-rata nilai kesalahan untuk setiap pengamatan. 

  • Rata-rata kesalahan persentase absolut (MAPE): Mengekspresikan MAE sebagai persentase, yang menunjukkan besarnya kesalahan. MAPE juga dikenal sebagai Rata-rata Deviasi Persentase Mutlak (MAPD). MAPE adalah fungsi kesalahan umum untuk masalah regresi.

Contoh penggunaan pemodelan deret waktu

Model deret waktu memainkan peran yang kuat dalam analisis data, membantu ilmuwan data dan pemimpin bisnis dengan: 

  • Pengenalan pola: Model deret waktu mengidentifikasi fluktuasi berulang dalam data dari waktu ke waktu, seperti perubahan musiman, siklus jangka panjang, dan tren umum. Misalnya, dalam mode, penjualan T-shirt secara musiman melonjak setiap musim semi dan musim panas. Tren mode muncul kembali dan memudar dalam siklus beberapa dekade—baju bergaya oversized sekarang populer seperti pada 1990-an. 

  • Deteksi anomali: Anomali adalah titik data yang menyimpang dari titik data lainnya dalam kumpulan data. Meskipun anomali sesekali dapat dikaitkan dengan ketidakakuratan, jumlah data anomali yang lebih besar dapat mengindikasikan pergeseran yang tidak terduga, masalah dalam saluran data, dan peluang untuk perbaikan. 

  • Perkiraan: Berdasarkan data historis, model deret waktu dapat memprediksi titik data masa depan dalam deret tersebut. Organisasi dapat menggunakan prediksi ini untuk membuat keputusan berbasis data yang lebih baik.

Solusi terkait
Alat dan solusi analitik

Untuk berkembang, perusahaan harus menggunakan data untuk membangun loyalitas pelanggan, mengotomatiskan proses bisnis, dan berinovasi dengan solusi yang didorong oleh AI.

Jelajahi solusi analitik
Layanan konsultasi data dan analitik

Buka nilai data perusahaan dengan IBM Consulting, membangun organisasi berbasis insight yang memberikan keuntungan bisnis.

Temukan layanan analitik
IBM Cognos Analytics

Memperkenalkan Cognos Analytics 12.0, wawasan yang didukung AI untuk pengambilan keputusan yang lebih baik.

Jelajahi Cognos Analytics
Ambil langkah selanjutnya

Untuk berkembang, perusahaan harus menggunakan data untuk membangun loyalitas pelanggan, mengotomatiskan proses bisnis, dan berinovasi dengan solusi yang didorong oleh AI.

Jelajahi solusi analitik Temukan layanan analitik