Trenowanie modeli

Gdy zestaw danych jest etykietowany i przygotowany, można trenować model, a następnie wdrażać go do użycia.

Przegląd

Więcej informacji na temat typów szkoleń zawiera sekcja Ustawienia szkolenia modelu. Więcej informacji na temat uczenia modelu znajduje się w sekcji Pierwsze kroki.

Precyzowanie dokładności modelu

Aby zwiększyć dokładność i niezawodność modelu, należy w dalszym ciągu dodawać nowe dane i wykorzystywać je do przekwalifikowania modelu. Tworzenie nowych danych przy użyciu funkcji, takich jak rozszerzanie danych i automatyczne etykietowanie. Można również użyć danych, które są gromadzone podczas kontroli. Więcej informacji na temat modeli rafinacji można znaleźć w sekcji Refining models(Modele rafinacji).

GPUR

Należy upewnić się, że co najmniej jedna jednostka przetwarzania grafiki (GPU) jest dostępna do uczenia lub wdrażania modelu. Jeśli jednostka GPU nie jest dostępna, model jest dodawany do kolejki treningowej i zaczyna trenować, gdy jednostka GPU jest dostępna.

Na pasku statusu Użycie układu GPU na pasku menu wyświetlana jest liczba dostępnych procesorów GPU, modele w szkoleniach, wdrożone modele i modele w kolejce.

Status Nieznany wskazuje na problem ze szkoleniem lub wdrażaniem. Usługi GPUs, które są używane, nie są używane przez produkt IBM Maximo Visual Inspection. Jeśli inne aplikacje korzystają z usług GPUS, mogą wystąpić nieoczekiwane problemy z rywalizacją zasobów i aplikacjami.

Wykorzystanie GPU

W przypadku wdrażania modeli używają one jednego modelu GPU dla każdego typu modelu lub jednego GPU dla wielu modeli. W związku z tym liczba wymaganych GPU-ów zależy od rodzaju wyszkolonego modelu.

Tabela 1. Liczba obsługiwanych modeli na jednostkę GPU w oparciu o numer wersji
Model	1.3.0 – 8.3.0	8.4.0	8.5.0	8.6.0	8.7.0	8.8.0
GoogleNet	Wielokrotne	Wielokrotne	Wielokrotne	Wielokrotne	Wielokrotne	Wielokrotne
Faster R-CNN	Wielokrotne	Wielokrotne	Wielokrotne	Wielokrotne	Wielokrotne	Wielokrotne
pamięć SSD	Pojedyncze	Pojedyncze	Wielokrotne	Wielokrotne	Wielokrotne	Wielokrotne
YOLOv3	Pojedyncze	Wielokrotne	Wielokrotne	Wielokrotne	Wielokrotne	Wielokrotne
Mały YOLOv2	Pojedyncze	Pojedyncze	Nieobsługiwane	Nieobsługiwane	Nieobsługiwane	Nieobsługiwane
Mały YOLOv3	Nieobsługiwane	Nieobsługiwane	Wielokrotne	Wielokrotne	Wielokrotne	Wielokrotne
Detectron	Pojedyncze	Pojedyncze	Pojedyncze	Nieobsługiwane	Nieobsługiwane	Nieobsługiwane
Detectron2	Nieobsługiwane	Nieobsługiwane	Nieobsługiwane	Wielokrotne	Wielokrotne	Wielokrotne
Wysoka rozdzielczość	Pojedyncze	Pojedyncze	Pojedyncze	Pojedyncze	Wielokrotne	Wielokrotne
Optymalizacja anomalii	Nieobsługiwane	Pojedyncze	Pojedyncze	Pojedyncze	Wielokrotne	Wielokrotne
Odmowa działania	Pojedyncze	Pojedyncze	Pojedyncze	Pojedyncze	Pojedyncze	Pojedyncze

Więcej informacji na temat wykorzystania jednostki GPU zawiera sekcja Modele i obsługiwane funkcje.

Obszar GPU

Aby utworzyć obszar GPU, usuń lub anuluj wdrożenie wszystkich wdrożonych modeli w grupie GPU.

Uwaga: IBM Maximo Visual Inspection pozostawia bufor zmiennych na GPU, w zależności od kombinacji modeli, które są obecnie wdrożone.

Wykres trenowania

Ponieważ program IBM Maximo Visual Inspection pociągi modelu, wykres przedstawia względną wydajność modelu w czasie.

Obraz przedstawia stratę na osi pionowej i iteracje na osi poziomej. Więcej iteracji, które zachodzą w linii do utraty zbieżności do płaskiej linii. — Rysunek 1. Model wykresu ucznia

Więcej informacji na temat interpretowania tego wykresu zawiera sekcja Wykres trenowania modelu.

Czas trenowania

Łączny czas treningu zależy od wielkości zestawu danych i liczby iteracji.

Przygotowanie zestawu danych obejmuje kilka działań:

Konfigurowanie wykorzystania kontenera DNN.
Podział zestawu danych na część treningową i testową.
Zmiana rozmiaru szkolenia.

Generowanie statystyk treningu modelu również obejmuje kilka działań:

Obliczanie dokładności każdego obiektu z osobna.
Obliczanie macierzy zmieszania (pomyłek).

Czas wymagany na przygotowanie zestawu danych i wygenerowanie statystyk treningu modelu jest bezpośrednio związany z wielkością zestawu danych. W przypadku dużego zestawu danych kroki przetwarzania wstępnego i przetwarzania końcowego mogą potrwać wiele minut.

Iteracja odnosi się do liczby uruchomień zadania wsadowego obrazów za pomocą przekazania do i z modelu. Czas treningu modelu jest również bezpośrednio powiązany z liczbą iteracji. Czas wykonywania iteracji różni się znacznie w zależności od modelu. Czas wykonania zwiększa się jednak proporcjonalnie do liczby iteracji w treningu. Więcej iteracji zwykle prowadzi do bardziej dokładnego modelu.