Trenowanie modeli

Gdy zestaw danych jest etykietowany i przygotowany, można trenować model, a następnie wdrażać go do użycia.

Przegląd

Więcej informacji na temat typów szkoleń zawiera sekcja Ustawienia szkolenia modelu. Więcej informacji na temat uczenia modelu znajduje się w sekcji Pierwsze kroki.

Precyzowanie dokładności modelu

Aby zwiększyć dokładność i niezawodność modelu, należy w dalszym ciągu dodawać nowe dane i wykorzystywać je do przekwalifikowania modelu. Tworzenie nowych danych przy użyciu funkcji, takich jak rozszerzanie danych i automatyczne etykietowanie. Można również użyć danych, które są gromadzone podczas kontroli. Więcej informacji na temat modeli rafinacji można znaleźć w sekcji Refining models(Modele rafinacji).

GPUR

Należy upewnić się, że co najmniej jedna jednostka przetwarzania grafiki (GPU) jest dostępna do uczenia lub wdrażania modelu. Jeśli jednostka GPU nie jest dostępna, model jest dodawany do kolejki treningowej i zaczyna trenować, gdy jednostka GPU jest dostępna.

Na pasku statusu Użycie układu GPU na pasku menu wyświetlana jest liczba dostępnych procesorów GPU, modele w szkoleniach, wdrożone modele i modele w kolejce.

Status Nieznany wskazuje na problem ze szkoleniem lub wdrażaniem. Usługi GPUs, które są używane, nie są używane przez produkt IBM Maximo Visual Inspection. Jeśli inne aplikacje korzystają z usług GPUS, mogą wystąpić nieoczekiwane problemy z rywalizacją zasobów i aplikacjami.

Wykorzystanie GPU

W przypadku wdrażania modeli używają one jednego modelu GPU dla każdego typu modelu lub jednego GPU dla wielu modeli. W związku z tym liczba wymaganych GPU-ów zależy od rodzaju wyszkolonego modelu.

Tabela 1. Liczba obsługiwanych modeli na jednostkę GPU w oparciu o numer wersji
Model 1.3.0 – 8.3.0 8.4.0 8.5.0 8.6.0 8.7.0 8.8.0
GoogleNet Wielokrotne Wielokrotne Wielokrotne Wielokrotne Wielokrotne Wielokrotne
Faster R-CNN Wielokrotne Wielokrotne Wielokrotne Wielokrotne Wielokrotne Wielokrotne
pamięć SSD Pojedyncze Pojedyncze Wielokrotne Wielokrotne Wielokrotne Wielokrotne
YOLOv3 Pojedyncze Wielokrotne Wielokrotne Wielokrotne Wielokrotne Wielokrotne
Mały YOLOv2 Pojedyncze Pojedyncze Nieobsługiwane Nieobsługiwane Nieobsługiwane Nieobsługiwane
Mały YOLOv3 Nieobsługiwane Nieobsługiwane Wielokrotne Wielokrotne Wielokrotne Wielokrotne
Detectron Pojedyncze Pojedyncze Pojedyncze Nieobsługiwane Nieobsługiwane Nieobsługiwane
Detectron2 Nieobsługiwane Nieobsługiwane Nieobsługiwane Wielokrotne Wielokrotne Wielokrotne
Wysoka rozdzielczość Pojedyncze Pojedyncze Pojedyncze Pojedyncze Wielokrotne Wielokrotne
Optymalizacja anomalii Nieobsługiwane Pojedyncze Pojedyncze Pojedyncze Wielokrotne Wielokrotne
Odmowa działania Pojedyncze Pojedyncze Pojedyncze Pojedyncze Pojedyncze Pojedyncze

Więcej informacji na temat wykorzystania jednostki GPU zawiera sekcja Modele i obsługiwane funkcje.

Obszar GPU

Aby utworzyć obszar GPU, usuń lub anuluj wdrożenie wszystkich wdrożonych modeli w grupie GPU.

Uwaga: IBM Maximo Visual Inspection pozostawia bufor zmiennych na GPU, w zależności od kombinacji modeli, które są obecnie wdrożone.

Wykres trenowania

Ponieważ program IBM Maximo Visual Inspection pociągi modelu, wykres przedstawia względną wydajność modelu w czasie.

Rysunek 1. Model wykresu ucznia
Obraz przedstawia stratę na osi pionowej i iteracje na osi poziomej. Więcej iteracji, które zachodzą w linii do utraty zbieżności do płaskiej linii.

Więcej informacji na temat interpretowania tego wykresu zawiera sekcja Wykres trenowania modelu.

Czas trenowania

Łączny czas treningu zależy od wielkości zestawu danych i liczby iteracji.

Przygotowanie zestawu danych obejmuje kilka działań:

  • Konfigurowanie wykorzystania kontenera DNN.
  • Podział zestawu danych na część treningową i testową.
  • Zmiana rozmiaru szkolenia.

Generowanie statystyk treningu modelu również obejmuje kilka działań:

  • Obliczanie dokładności każdego obiektu z osobna.
  • Obliczanie macierzy zmieszania (pomyłek).

Czas wymagany na przygotowanie zestawu danych i wygenerowanie statystyk treningu modelu jest bezpośrednio związany z wielkością zestawu danych. W przypadku dużego zestawu danych kroki przetwarzania wstępnego i przetwarzania końcowego mogą potrwać wiele minut.

Iteracja odnosi się do liczby uruchomień zadania wsadowego obrazów za pomocą przekazania do i z modelu. Czas treningu modelu jest również bezpośrednio powiązany z liczbą iteracji. Czas wykonywania iteracji różni się znacznie w zależności od modelu. Czas wykonania zwiększa się jednak proporcjonalnie do liczby iteracji w treningu. Więcej iteracji zwykle prowadzi do bardziej dokładnego modelu.