Wykrywanie obiektów
Model wykrywania obiektów oznacza obiekt w obrazie za pomocą tego, co jest zdefiniowane w zestawie danych.
Informacje na temat przygotowywania zestawu danych do wykrywania obiektów zawiera sekcja Etykietowanie obiektów.
Dla modeli wykrywania obiektów dostępne są następujące typy optymalizacji modelu:
- Faster R-CNN
- Bardzo dokładne lokalizowanie obiektów w obrazach i filmach.
- YOLOv3
- Modele są zoptymalizowane pod kątem szybkości i mogą być uruchamiane w dowolnym miejscu.
- Generuje małe modele, które działają dobrze w przypadku urządzeń wbudowanych.
- Modele używają funkcji You Only Look Once (YOLO) v3 i mogą trenować dłużej w celu uzyskania lepszej dokładności.
- Wykrywa małe obiekty dokładniej niż małe YOLOv3.
- Podstawowa wersja ML modelu jest generowana pod koniec uczenia modelu. Model ten można wdrożyć w produkcie IBM® Maximo® Visual Inspection Mobile lub można go pobrać ze strony Modele w produkcie Maximo Visual Inspection.
- Mała YOLOv3
- Modele są zoptymalizowane pod kątem szybkości i używają tej samej techniki, co YOLO v3.
- Modele są szybsze, mniej dokładne i wykorzystują mniej pamięci GPU.
- Generuje małe modele, które działają dobrze w przypadku urządzeń wbudowanych.
- Alternatywnie można wdrożyć model na procesorze CPU.
- Podstawowa wersja ML modelu jest generowana pod koniec uczenia modelu. Model ten można wdrożyć w produkcie IBM Maximo Visual Inspection Mobile lub można go pobrać ze strony Modele w produkcie Maximo Visual Inspection.
- Detectron2
- Modele są zoptymalizowane pod kątem wykrywania obiektów i segmentacji małych obiektów.
- Generuje dokładne, ale duże modele.
- W modelach używane są obiekty oznaczone wielokątnymi prostokątami ograniczającymi w celu zwiększenia dokładności treningu. Etykiety te są przydatne dla małych, przekątnych i nieregularnych obiektów.
Uwaga:Segmentację można wyłączyć, gdy wykrywane obiekty mogą być dokładnie oznaczone za pomocą prostokątów ograniczających lub gdy zestaw danych zawiera tylko prostokąty ograniczające.
Po wyłączeniu segmentacji model trenuje szybciej i działa szybciej w czasie wdrażania. Jednak wykryte obiekty mają prosty prostokąt ograniczający. Należy rozważyć uczenie z innym typem modelu, który nie wykrywa konturów obiektów, na przykład szkolenie Faster R-CNN.
Detectron2 w wersji 8.8+
W produkcie Maximo Visual Inspectionw wersji 8.8optymalizacja modelu Detectron2 ma następujące opcje treningu:- Włącz segmentację
- Włącz automatyczne wcześniejsze zatrzymanie
- Włącz rozszerzenie online
Uwaga: Te same opcje treningu są dostępne dla optymalizacji modelu o wysokiej rozdzielczości, ale obrazy wysyłane do modelu podczas wdrażania są różne. Więcej informacji na temat obrazów, które są wysyłane do modeli podczas wdrażania modelu o wysokiej rozdzielczości, zawiera sekcja Wysoka rozdzielczość.Uwaga: Jako model podstawowy można używać tylko modeli Detectron2 wytrenowanych w programie Maximo Visual Inspection w wersji 8.8.0 lub nowszej. Modele Detectron2 wytrenowane we wcześniejszych wersjach nie są dostępne do użycia.- Wysoka rozdzielczość
- Obsługuje trenowanie modeli i wnioskowanie przy obrazach o wysokiej rozdzielczości.
- Modele są zoptymalizowane pod kątem sprawdzania dużych obrazów i wykrywania unikalnych cech mniejszych obiektów.
- Włącz segmentację, aby wskazać, czy model jest wytrenowany do wykrywania konturów obiektów.
- Włącz automatyczne wczesne zatrzymanie, aby zasygnalizować procesowi treningu automatyczne zatrzymanie, gdy zostanie znaleziony najdokładniejszy model lub gdy proces uczenia osiągnie maksymalną liczbę iteracji.
Modele o wysokiej rozdzielczości stosują schemat ukladania piramidy do obrazu. Każdy z płytek jest wysyłany do modelu niezależnie i zawiera około 50-100 obrazów. Wyniki wykrywania z każdego kafli obrazu są scalane i rzutowane z powrotem do oryginalnej skali obrazu. Wybierz tę opcję, jeśli zestaw danych składa się z obrazów o wysokiej rozdzielczości, małych obiektów lub obu tych elementów.
Wysoka rozdzielczość w wersji 8.7+
W produkcie Maximo Visual Inspection w wersji 8.7modele o wysokiej rozdzielczości można trenować i wdrażać na procesorach GPU NVIDIA Ampere. Można również połączyć ten typ modelu z innymi modelami w tym samym kontenerze i wdrożyć modele lokalnie w programie Maximo Visual Inspection Edge.
Włączenie rozszerzania w trybie z połączeniem powoduje zastosowanie sekwencji czterech probabilistycznych typów transformacji do każdego obrazu w zestawie danych podczas treningu modelu. Typy transformacji zwiększają zdolność modelu do uogólniania, dzięki czemu nie ma potrzeby stosowania rozszerzenia w trybie bez połączenia do zestawu danych przed treningiem.
- Single Shot Detector (SSD)
- Nadaje się do wnioskowania w czasie rzeczywistym i wbudowanych urządzeń.
- Prawie tak szybka jak YOLO, ale nie tak dokładna jak Faster R-CNN.
- Optymalizacja anomalii
- Modele są trenowane z zestawami danych zawierającymi obrazy z obiektami, które nie zawierają żadnych anomalii. W środowisku wykonawczym po wykryciu tego samego typu obiektów model lokalizuje anomalie w obiektach. Wykryte anomalie mogą wskazywać na wady, takie jak zarysowania, wgniecenia lub układy scalone.
- Udostępnia wyniki ufności dla wykrytych obiektów i wykrytych anomalii.
Uczenie modelu anomalii odbywa się w dwóch etapach. Pierwszy etap jest odzwierciedlany na pasku postępu na stronie szczegółów modelu. Więcej informacji na temat przygotowywania zestawu danych do optymalizacji anomalii zawiera sekcja Etykietowanie obiektów.
Dokładność może się zmniejszyć, gdy zwiększa się liczba klas obiektów w zbiorze danych uczących. Ponieważ wydajność modelu zmniejsza się wraz z wykryciem większej liczby obiektów i w zależności od wymagań dotyczących opóźnienia, modele anomalii nie są odpowiednie w sytuacjach, w których wiele interesujących obiektów pojawia się na obrazie w tym samym czasie.
Optymalizacja anomalii w produkcie 8.7+
Modele zoptymalizowane pod kątem anomalii można trenować i wdrażać w oparciu o procesory graficzne NVIDIA Ampere. Można również połączyć ten typ modelu z innymi modelami w tym samym kontenerze i wdrożyć modele lokalnie w programie Maximo Visual Inspection.
Uwaga: Modele anomalii, które zostały wytrenowane we wcześniejszych wersjach produktu Maximo Visual Inspection , mogą nie mieć pamięci, gdy modele są wdrażane w produkcie Maximo Visual Inspection 8.7. Ten problem może również wystąpić w starszych wersjach programu Maximo Visual Inspection i ma na niego wpływ liczba obrazów, które wyszkoliły model, oraz ilość dostępnej pamięci na odpowiednim procesorze GPU. Modele anomalii wytrenowane w programie Maximo Visual Inspection 8.7 wymagają do 8 GB pamięci na odpowiednim procesorze GPU.