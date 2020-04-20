Mungkin organisasi Anda baru-baru ini memutuskan untuk membeli node dan memulai penggunaan AI. Ada banyak aspek infrastruktur TI dan lingkungan teknologi Anda yang harus diperhatikan saat Anda mempersiapkan beban kerja AI, termasuk, dan mungkin juga yang terpenting, sistem penyimpanan Anda. AI didorong oleh data, dan bagaimana data Anda disimpan dapat secara signifikan memengaruhi hasil proyek AI Anda. Tidak hanya itu, tetapi empat tahap AI yang berbeda (penyerapan, persiapan, pelatihan, dan inferensi), yang masing-masing memiliki kebutuhan penyimpanan dan persyaratan yang berbeda.
Sayangnya, beberapa organisasi fokus pada sisi komputasi AI dan mengabaikan sisi penyimpanan. Fokus tunggal ini dapat, dan kadang-kadang terjadi, menyebabkan gangguan atau kegagalan total proyek AI. Sejumlah besar data diperlukan untuk memfasilitasi tahap pelatihan AI. Data ini perlu dicerna, disimpan, dan disiapkan sehingga dapat “diumpankan” ke tahap pelatihan. Tanpa kemampuan untuk menyerap, toko dan mengkonsumsi data yang diperlukan untuk pelatihan, proyek akan berisiko gagal.
Proyek AI menuntut infrastruktur penyimpanan dengan kinerja, skalabilitas, dan fleksibilitas yang sangat baik. Kabar baiknya adalah bahwa sistem penyimpanan saat ini dapat dibangun khusus untuk memenuhi kebutuhan proyek AI. Dua contoh hebat dari ini adalah beberapa superkomputer paling kuat di dunia, Sierra dan Summit.
Sekarang, mari kita lihat beberapa persyaratan.
Persyaratan untuk setiap tahap pipeline AI perlu diulas untuk beban kerja yang diharapkan dari aplikasi AI Anda. Beban kerja bervariasi, tetapi beberapa perusahaan yang menggunakan kumpulan data besar dapat melatih untuk jangka waktu yang lama. Setelah pelatihan selesai, data tersebut sering dipindahkan dari platform penyimpanan penting untuk mempersiapkan beban kerja baru. Mengelola data secara manual bisa menjadi tantangan, jadi bijaksana untuk Think ke depan ketika mempertimbangkan bagaimana data ditempatkan pada penyimpanan dan ke mana perginya setelah pelatihan selesai. Menemukan platform yang dapat memindah data secara otomatis untuk Anda menempatkan Anda selangkah lebih dekat ke penyimpanan yang efisien dan cakap untuk AI.
Setelah meninjau implikasi dari kebutuhan beban kerja Anda sendiri, Anda dapat memutuskan teknologi penyimpanan yang paling sesuai untuk infrastruktur dan proyek komputasi AI Anda.
Penyerapan data.Data mentah untuk beban kerja AI dapat berasal dari berbagai sumber data terstruktur dan tidak terstruktur, dan Anda memerlukan tempat yang sangat andal untuk menyimpan data mentah. Media penyimpanan bisa berupa danau data berkapasitas tinggi atau tingkat cepat, seperti penyimpanan flash, terutama untuk analitik real-time.
Persiapan data.Setelah disimpan, data harus disiapkan karena dalam format “mentah”. Data perlu diproses dan diformat untuk dikonsumsi oleh fase yang tersisa. Kinerja I/O file adalah pertimbangan yang sangat penting pada tahap ini karena Anda sekarang memiliki campuran pembacaan dan penulisan acak. Luangkan waktu untuk mencari tahu apa kebutuhan kinerja untuk pipeline AI Anda. Setelah data diformat, itu akan dimasukkan ke dalam neural networks untuk pelatihan.
Pelatihan dan inferensi. Tahap ini butuh banyak daya komputasi dan umumnya memerlukan streaming data ke dalam model pelatihan. Pelatihan adalah proses berulang, membutuhkan pengaturan dan pengaturan ulang, yang digunakan untuk membuat model. Inferensi dapat dianggap sebagai hasil akhir dari data dan pelatihan. GPU di server, dan infrastruktur penyimpanan Anda menjadi sangat penting di sini karena kebutuhan akan latensi rendah, throughput tinggi, dan waktu respons yang cepat. Jaringan penyimpanan Anda perlu dirancang untuk menangani persyaratan ini serta penyerapan dan persiapan data. Dalam skala besar, ini memberi tekanan pada sistem penyimpanan, terutama yang tidak siap untuk beban kerja AI, jadi penting untuk mempertimbangkan secara khusus apakah platform penyimpanan Anda dapat menangani kebutuhan beban kerja sesuai dengan tujuan bisnis Anda.
Pertimbangkan juga: Apakah infrastruktur penyimpanan Anda mudah terukur? Bisakah Anda memperluas sistem penyimpanan saat kebutuhan data Anda tumbuh? Ini adalah pertanyaan yang sangat penting yang memiliki efek langsung pada persyaratan infrastruktur AI Anda.
Pastikan Anda dapat meningkatkan dan meningkatkan infrastruktur penyimpanan Anda dengan gangguan minimal atau tanpa gangguan pada operasi produksi Anda, mengikuti pertumbuhan data dalam bisnis Anda. Cukup fleksibel untuk mempertimbangkan konfigurasi penyimpanan yang berbeda untuk kebutuhan infrastruktur AI yang berbeda.
Perencanaan yang cermat, mencocokkan server AI Anda dan persyaratan pemodelan dengan infrastruktur penyimpanan, akan membantu Anda mendapatkan hasil maksimal dari investasi Anda dan mengarah pada kesuksesan dalam proyek AI Anda.
Rekomendasi ini hanyalah titik awal. Selalu ingat bahwa jika Anda tidak memiliki keahlian di organisasi Anda untuk merancang dan menerapkan infrastruktur penyimpanan AI yang benar, Anda harus bekerja dengan vendor Anda untuk membantu dan membantu mempersiapkan sistem penyimpanan Anda untuk AI.
