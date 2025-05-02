Semua machine learning dimulai dengan kumpulan data atau gabungan data. Kumpulan data dapat terdiri dari spreadsheet, rekaman video, halaman web, PDF, atau jenis data lainnya. Secara umum, semakin banyak data pelatihan yang dimasukkan ke dalam model, semakin baik kinerja model. Tapi bukan hanya kuantitas data — kualitas data juga sangat penting.

Data pelatihan AI terdiri dari fitur, disebut juga atribut, yang menggambarkan data. Sebagai contoh, satu kumpulan data tentang peralatan pabrik dapat mencakup suhu, kecepatan osilasi, dan waktu perbaikan terakhir. Data ini “dimasukkan” ke algoritma machine learning, sekumpulan instruksi yang diekspresikan melalui sepotong kode yang memproses input data untuk membuat output. Memasukkan data ke algoritma berarti memberikannya data input yang kemudian diproses dan dianalisis untuk menghasilkan output. Model matematika yang terlatih adalah hasil dari proses ini. Semua model ini adalah dasar untuk hampir semua inovasi terbaru dalam kecerdasan buatan.

Beberapa model digunakan untuk pemrosesan bahasa alami (NLP) yang dapat digunakan untuk mengajarkan mesin membaca dan berbicara dalam bahasa manusia. Visi komputer memungkinkan model lain untuk menafsirkan informasi visual. Tapi semuanya dimulai dengan data pelatihan.