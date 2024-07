Semantische Segmentierungsaufgaben helfen Maschinen, die verschiedenen Objektklassen und Hintergrundbereiche in einem Bild zu unterscheiden. Mit dem Aufstieg von Künstlicher Intelligenz (KI) und Maschinellem Lernen (ML) spielen Bildsegmentierung und die Erstellung von Segmentierungskarten eine wichtige Rolle beim Training von Computern, um wichtigen Kontext in digitalen Bildern wie Landschaften, Fotos von Menschen, medizinische Bilder und vieles mehr zu erkennen.

Lernmodelle zur Bildsegmentierung ermöglichen es Maschinen, visuelle Informationen ähnlich wie das menschliche Gehirn zu interpretieren. Bildsegmentierungsmodelle haben zwar gewisse Gemeinsamkeiten mit Objekterkennungsmodellen, unterscheiden sich aber in einem entscheidenden Punkt: Sie identifizieren verschiedene in einem Bild enthaltene Objekte auf Pixelebene, anstatt diese Informationen durch einen Begrenzungsrahmen anzunähern. Während ein Bildklassifizierungsmodell zwar bestimmen kann, was in einem Bild enthalten ist (aber keine Lokalisierung vornehmen kann), und ein Objekterkennungsmodell bestimmen kann, wo sich das Objekt in einem Bild befindet, ist zur Bestimmung der spezifischen Formen und Grenzen von Entitäten im Bild ein Bildsegmentierungsmodell erforderlich.1

Mit dem zunehmenden Erfolg von Deep Learning-Algorithmen, die Maschinen bei der Interpretation von Bildern als Daten helfen, werden Maschinen immer besser darin, Objekte zu identifizieren. Während die Bildklassifizierung der Maschine hilft zu verstehen, welche Informationen in einem Bild enthalten sind, ermöglicht die semantische Segmentierung der Maschine, die genaue Position der verschiedenen Arten von visuellen Informationen zu identifizieren sowie den Anfang und das Ende jeder Information.