Was ist Datenerweiterung?

Autoren

Jacob Murel Ph.D.

Senior Technical Content Creator

Business Development + Partnerships

IBM Research

Was ist Datenerweiterung?

Bei der Datenerweiterung werden bereits vorhandene Daten verwendet, um neue Datenmuster zu erstellen, die die Modelloptimierung und Verallgemeinerbarkeit verbessern können.

Im Allgemeinen bezeichnet die Datenerweiterung Methoden zur Ergänzung sogenannter unvollständiger Datensätze durch fehlende Datenpunkte, um die Analysierbarkeit des Datensatzes zu erhöhen.¹ Dies zeigt sich beim maschinellen Lernen durch die Erstellung modifizierter Kopien bereits vorhandener Daten, um die Größe und Vielfalt eines Datensatzes zu erhöhen. In Bezug auf das maschinelle Lernen können erweiterte Daten also als künstliche Bereitstellung potenziell fehlender Daten aus der realen Welt verstanden werden.

Die Datenerweiterung verbessert die Optimierung und Verallgemeinerung von Modellen des maschinellen Lernens. Mit anderen Worten: Durch Datenerweiterung kann Überanpassung reduziert und die Modellrobustheit verbessert werden.² Es ist ein Grundsatz des maschinellen Lernens, dass große, vielfältige Datensätze eine bessere Modellleistung bedeuten. Aus einer Reihe von Gründen, z. B. der Ethik, des Datenschutz und weil das manuelle Zusammentragen der Daten zeitaufwendig ist, kann es jedoch schwierig sein, genügend Daten zu beschaffen. Die Datenerweiterung ist effektiv, wenn man den Umfang und die Variabilität des Datensatzes erhöhen möchte. In der Tat verwenden Forscher häufig Datenerweiterungen, um unausgewogene Datensätze zu korrigieren.³

Viele Deep-Learning-Frameworks wie PyTorch, Keras und Tensorflow bieten Funktionen zur Anreicherung von Daten, vor allem von Bilddatensätzen. Das Python-Paket Albumentations (verfügbar auf Github) wird auch in vielen Open-Source-Projekten eingesetzt. Bei Albumentations werden Bild- und Textdaten angereichert.

Erweiterte Daten vs. synthetische Daten

Beachten Sie, dass sich die Datenerweiterung von synthetischen Daten unterscheidet. Zugegeben, beides sind generative Algorithmen, die neue Daten zu einer Datensammlung hinzufügen, um die Leistung von Modellen für maschinelles Lernen zu verbessern. Synthetische Daten hingegen beziehen sich auf die automatische Generierung von völlig künstlichen Daten. Ein Beispiel ist die Verwendung von computergenerierten Bildern – im Gegensatz zu realen Daten – zum Trainieren eines Objekterkennungsmodells. Im Gegensatz dazu werden bei der Datenerweiterung vorhandene Daten kopiert und diese Kopien umgewandelt, um die Vielfalt und Menge der Daten in einem bestimmten Satz zu erhöhen.

Die neuesten KI-Trends, präsentiert von Experten

Erhalten Sie kuratierte Einblicke in die wichtigsten – und faszinierendsten – KI-Neuheiten. Abonnieren Sie unseren wöchentlichen Think-Newsletter. Weitere Informationen in der IBM Datenschutzerklärung.

Techniken zur Datenerweiterung

Es gibt eine Vielzahl von Methoden zur Datenerweiterung. Welche Techniken zur Datenanreicherung verwendet werden, hängt von der Art der Daten ab, mit denen ein Benutzer arbeitet. Beachten Sie, dass die Datenerweiterung normalerweise während der Vorverarbeitung des Trainingsdatensatzes durchgeführt wird. Bei Studien zur Datenerweiterung wird häufig ihr Einfluss auf die Validierungs- oder Testmenge untersucht, während Anwendungen außerhalb des Trainingsdatensatzes seltener sind.⁴

Bildverbesserung

Die Datenerweiterung wurde in der Forschung für eine Reihe von Computer Vision Aufgaben eingesetzt, von der Bildklassifizierung bis zur Objekterkennung. Daher gibt es eine Fülle von Forschungsergebnissen darüber, wie erweiterte Bilder die Leistung von modernen Convolutional Neural Networks (CNNs) in der Bildverarbeitung verbessern.

Viele Tutorials und nicht-akademische Ressourcen teilen die Bilddatenerweiterung in zwei Kategorien ein: geometrische Transformationen und photometrische (oder Farbraum-) Transformationen. Beide bestehen aus einer relativ einfachen Bilddateimanipulation. Die erste Kategorie bezeichnet Techniken, die den Raum und das Layout des Originalbildes verändern, wie z. B. Größenänderung, Zoomen oder Änderungen der Ausrichtung (z. B. horizontales Spiegeln). Photometrische Transformationen verändern die RGB-Kanäle (rot-grün-blau) eines Bildes. Beispiele für eine photometrische Transformation sind die Anpassung der Sättigung und die Grauskalierung eines Bildes.⁵

Beispiel für eine grundlegende Bilderweiterung für ein Katzenbild

Einige Quellen kategorisieren die Rauschinjektion mit geometrischen Transformationen,⁶ während andere sie mit photometrischen Transformationen in Verbindung bringen.⁷ Die Rauschinjektion fügt zufällige schwarze, weiße oder farbige Pixel in ein Bild gemäß einer Gaußschen Verteilung ein.

Beispiel einer Rauschinjektion zur Bildverbesserung

Wie die Rauschinjektion zeigt, deckt die binäre Klassifizierung von Bildverbesserungstechniken in geometrische und photometrische Techniken nicht die gesamte Bandbreite möglicher Verbessungsstrategien ab. Ausgenommen sind Techniken zur Bildverbesserung wie Kernel-Filterung (Schärfen oder Verwischen eines Bildes) und Bildmischung. Ein Beispiel für Letzteres ist das zufällige Zuschneiden und Patchen. Bei dieser Technik werden nach dem Zufallsprinzip Ausschnitte aus mehreren Bildern ausgewählt, um ein neues Bild zu erstellen. Dieses neue Bild ist ein Kompositum aus den abgetasteten Ausschnitten der Eingabebilder. Eine verwandte Technik ist das zufällige Löschen, bei dem ein zufälliger Teil eines Bildes gelöscht wird.⁸ Solche Aufgaben sind bei der Bilderkennung nützlich, denn in der Praxis kann es vorkommen, dass Maschinen teilweise verdeckte Objekte erkennen müssen.

Visualisierung für zufälliges Zuschneiden des Bildes eines Golden Retrievers

Die Erweiterung auf Instanzebene ist eine weitere Erweiterung. Bei der Augmentation auf Instanzebene werden im Wesentlichen beschriftete Regionen (z. B. Bounding Boxes) aus einem Bild kopiert und in ein anderes Bild eingefügt. Bei einem solchen Ansatz wird das Bild darauf trainiert, Objekte vor verschiedenen Hintergründen sowie durch andere Objekte verdeckte Objekte zu erkennen. Die Augmentation auf Instanzebene ist ein besonders hervorstechender Ansatz für regionsspezifische Erkennungsaufgaben, wie z. B. Objekterkennung und Bildsegmentierungsaufgaben.⁹

Texterweiterung

Wie bei der Bilderweiterung gibt es auch bei der Textdatenerweiterung viele Techniken und Methoden, die bei einer Reihe von Aufgaben der Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) eingesetzt werden. In einigen Ressourcen wird die Textergänzung in regelbasierte (oder „einfache“) und in neuronale Methoden unterteilt. Wie bei der binären Einteilung der Techniken zur Bildverbesserung ist diese Kategorisierung natürlich nicht allumfassend.

Zu den regelbasierten Ansätzen gehören relativ einfache Such- und Ersetzungstechniken, wie z. B. das zufällige Löschen oder Einfügen. Regelbasierte Ansätze umfassen auch die Ersetzung von Synonymen. Bei dieser Strategie werden ein oder mehrere Wörter in einer Zeichenkette durch ihre jeweiligen Synonyme ersetzt, die in einem vordefinierten Thesaurus wie WordNet oder der Paraphrase Database gespeichert sind. Satzinversion und Passivierung, bei denen Objekt und Subjekt vertauscht werden, sind ebenfalls Beispiele für regelbasierte Ansätze.¹⁰

Diagrammvisualisierung von regelbasierten Textergänzungen

Neuronale Methoden verwenden neuronale Netzwerke, um aus den Eingabedaten neue Textmuster zu erzeugen. Eine bemerkenswerte neuronale Methode ist die Rückübersetzung. Dabei werden Eingabedaten mithilfe der maschinellen Übersetzung in eine Zielsprache und anschließend wieder in die ursprüngliche Eingabesprache übersetzt. Auf diese Weise nutzt die Rückübersetzung sprachliche Abweichungen, die sich aus automatischen Übersetzungen ergeben, um semantische Abweichungen im einsprachigen Datensatz zum Zweck der Erweiterung zu generieren. Laut Forschung verbessert dies die Leistung von maschinellen Übersetzungsmodellen.¹¹

Visualisierung der Übersetzungserweiterung mit dem Satz „Ich tanze im Club“

Das Verwechseln von Texterweiterungen ist eine weitere Strategie. Bei diesem Ansatz werden regelbasierte Lösch- und Einfügemethoden mithilfe von Einbettungen in neuronalen Netzwerken eingesetzt. Konkret erzeugen vorab trainierte Transformatoren (z. B. BERT) Einbettungen von Text auf Wort- oder Satzebene und wandeln den Text in Vektorpunkte um, wie in einem Bag-of-Words -Modell. Die Transformation von Text in Vektorpunkte zielt im Allgemeinen darauf ab, sprachliche Ähnlichkeit zu erfassen, d. h. es wird davon ausgegangen, dass Wörter oder Sätze, die im Vektorraum näher beieinander liegen, ähnliche Bedeutungen oder Häufigkeiten haben. Bei der Mischungserweiterung werden Textstrings innerhalb einer bestimmten Distanz zueinander interpoliert, um neue Daten zu erzeugen, die die Gesamtheit der Eingabedaten sind.¹²

Mixture of Experts | 12. Dezember, Folge 85

KI entschlüsseln: Wöchentlicher Nachrichtenüberblick

Schließen Sie sich unserer erstklassigen Expertenrunde aus Ingenieuren, Forschern, Produktführern und anderen an, die sich durch das KI-Rauschen kämpfen, um Ihnen die neuesten KI-Nachrichten und Erkenntnisse zu liefern.

Alle Episoden von Mixture of Experts ansehen

Aktuelle Forschung

Viele Benutzer tun sich schwer damit, herauszufinden, welche Strategien zur Datenerweiterung eingesetzt werden sollen. Unterscheiden sich die Techniken zur Datenerweiterung in ihrer Wirksamkeit je nach Datensatz und Aufgabe? Vergleichende Untersuchungen zu Datenanreicherungstechniken legen nahe, dass mehrere Formen der Anreicherung eine größere positive Wirkung haben als eine einzige, aber die Bestimmung der optimalen Kombination von Techniken ist abhängig vom Datensatz und von der Aufgabe.¹³ Aber wie wählt man die optimalen Techniken aus?

Automatisierte Augmentation

Um dieses Problem zu lösen, hat sich die Forschung der automatischen Datenerweiterung zugewandt. Ein automatischer Augmentierungsansatz verwendet Verstärkungslernen, um Augmentierungstechniken zu identifizieren, die die höchste Validierungsgenauigkeit für einen gegebenen Datensatz liefern.¹⁴ Dieser Ansatz hat gezeigt, dass Strategien implementiert werden können, die die Leistung sowohl bei Daten innerhalb als auch außerhalb der Stichprobe verbessern.¹⁵ Ein weiterer vielversprechender Ansatz zur automatischen Augmentierung identifiziert und ergänzt falsch-positive Ergebnisse von Klassifikatoren. Auf diese Weise identifiziert die automatische Augmentation die besten Strategien zur Korrektur häufig falsch klassifizierter Elemente.¹⁶

Generative Netzwerke

In jüngerer Zeit hat sich die Forschung generativen Netzwerken und Modellen zugewandt, um aufgaben-¹⁷ und aufgaben- und klassenabhängige ¹⁸ optimale Augmentationsstrategien zu identifizieren. Dazu gehört auch die Arbeit mit generativen adversarischen Netzwerken (GANs). GANs sind Deep-Learning-Netzwerke, die in der Regel zur Generierung synthetischer Daten verwendet werden, und aktuelle Forschungsergebnisse untersuchen ihre Verwendung zur Datenerweiterung. Einige Experimente deuten beispielsweise darauf hin, dass synthetische Datenaugmentationen von medizinischen Bildsätzen die Modellleistung der Klassifikation¹⁹ und Segmentierung²⁰ stärker verbessern als klassische Augmentationen. In diesem Zusammenhang nutzt die Forschung im Bereich der Texterweiterung große Sprachmodelle (LLMs) und Chatbots, um erweiterte Daten zu generieren. In diesen Experimenten werden LLMs verwendet, um mithilfe von Verwechslungs- und Synonymisierungstechniken erweiterte Stichproben von Eingabedaten zu generieren. Dabei zeigt sich ein größerer positiver Einfluss auf Textklassifizierungsmodelle als bei der klassischen Augmentation.²¹

Forscher und Entwickler setzen beim Training von Modellen für verschiedene Aufgaben des maschinellen Lernens häufig Techniken zur Datenerweiterung ein. Im Gegensatz dazu sind synthetische Daten ein vergleichsweise neues Forschungsgebiet. Vergleichende Experimente mit synthetischen und realen Daten zeigen gemischte Ergebnisse, wobei Modelle, die ausschließlich auf synthetischen Daten trainiert wurden, manchmal besser und manchmal schlechter abschneiden als Modelle, die auf realen Daten trainiert wurden. Es überrascht vielleicht nicht, dass diese Forschungsergebnisse darauf hindeuten, dass synthetische Daten am nützlichsten sind, wenn sie die Merkmale realer Daten widerspiegeln.²²

Data Science und MLOps für Data Leader

Schließen Sie sich mit anderen Führungskräften zusammen, um die drei wesentlichen Säulen von MLOps und vertrauenswürdiger KI voranzutreiben: Vertrauen in Daten, Vertrauen in Modelle und Vertrauen in Prozesse.

Ressourcen

Zu mehr ML-Know-how

Erfahren Sie mehr über grundlegende Konzepte und bauen Sie Ihre Fähigkeiten mit praktischen Übungen, Kursen, angeleiteten Projekten, Tests und mehr aus.

Nutzen Sie die Leistungsfähigkeit generativer KI und ML

Erfahren Sie, wie Sie generative KI und maschinelles Lernen sicher in Ihr Unternehmen integrieren können.

Maschinelles Lernen erklärt

„Techsplainers“ von IBM erklärt die Grundlagen des maschinellen Lernens – von Schlüsselkonzepten bis hin zu realen Anwendungsfällen. Klare, kurze Folgen helfen Ihnen, die Grundlagen schnell zu erlernen.

KI zum Einsatz bringen: Mehr ROI dank generativer KI

Möchten Sie eine bessere Rendite für Ihre KI-Investitionen erzielen? Erfahren Sie, wie die Skalierung generativer KI in Schlüsselbereichen Veränderungen vorantreibt, indem Sie Ihre besten Köpfe dabei unterstützen, innovative neue Lösungen zu entwickeln und bereitzustellen.

So entscheiden Sie sich für das richtige Foundation Model

Erfahren Sie, wie Sie das für Ihren Anwendungsfall am besten geeignete KI Foundation Model auswählen.

IBM Granite erkunden

IBM Granite ist unsere Familie offener, leistungsfähiger und vertrauenswürdiger KI-Modelle, die auf Unternehmen zugeschnitten und für die Skalierung Ihrer KI-Anwendungen optimiert sind. Erkunden Sie die Optionen zu Sprache, Code, Zeitreihen und Guardrails.

Wie Sie im neuen KI-Zeitalter vertrauensvoll und zuversichtlich in eine erfolgreiche Zukunft blicken

Erfahren Sie mehr über die drei entscheidenden Elemente einer starken KI-Strategie: die Schaffung eines Wettbewerbsvorteils, die Skalierung von KI im gesamten Unternehmen und die Förderung vertrauenswürdiger KI.

Weitere Lösungen

IBM watsonx.ai

Trainieren, validieren, optimieren und implementieren Sie generative KI, Foundation Models und maschinelle Lernfunktionen mit IBM watsonx.ai, einem Studio der nächsten Generation für AI Builder in Unternehmen. Erstellen Sie KI-Anwendungen mit einem Bruchteil der Zeit und Daten.

Entdecken sie watsonx.ai

Lösungen im Bereich künstlicher Intelligenz

Setzen Sie KI in Ihrem Unternehmen ein – mit branchenführendem Fachwissen im Bereich KI und dem Lösungsportfolio von IBM an Ihrer Seite.

Erkunden Sie KI-Lösungen

KI-Beratung und -Services

Erfinden Sie kritische Workflows und Abläufe neu, indem Sie KI einsetzen, um Erfahrungen, Entscheidungsfindung in Echtzeit und den geschäftlichen Nutzen zu maximieren.

KI-Services entdecken

Machen Sie den nächsten Schritt

Profitieren Sie von einem einheitlichen Zugriff auf Funktionen, die den gesamten Lebenszyklus der KI-Entwicklung abdecken. Erstellen Sie leistungsstarke KI-Lösungen mit benutzerfreundlichen Oberflächen, Workflows und Zugriff auf branchenübliche APIs und SDKs.

Fußnoten

Alle Links befinden sich außerhalb von ibm.com.

^f Martin Tanner und Wing Hung Wong, „The Calculation of Posterior Distributions by Data Augmentation“, Journal of the American Statistical Association, Bd. 82, Nr. 398 (1987), S. 528–540.

² Sylvestre-Alvise Rebuffi, Sven Gowal, Dan Andrei Calian, Florian Stimberg, Olivia Wiles und Timothy A Mann,„Data Augmentation Can Improve Robustness“, Advances in Neural Information Processing Systems, Band 34., 2021.

¹⁹ Manisha Saini und Seba Susan,„Tackling class imbalance in computer vision: a contemporary review“, Artificial Intelligence Review, Band 54, 2023.

⁴ Fabio Perez, Cristina Vasconcelos, Sandra Avila, and Eduardo Valle, “Data Augmentation for Skin Lesion Analysis,” OR 2.0 Context-Aware Operating Theaters, Computer Assisted Robotic Endoscopy, Clinical Image-Based Procedures, and Skin Image Analysis, 2018.

⁵ Connor Shorten und Taghi M. Khoshgoftaa, „A survey on Image Data Augmentation for Deep Learning“, Journal of Big Data, 2019.

⁶ Duc Haba, Data Augmentation with Python, Packt Publishing, 2023.

⁷ Mingle Xu, Sook Yoon, Alvaro Fuentes und Dong Sun Park,„A Comprehensive Survey of Image Augmentation Techniques for Deep Learning“, Patter Recognition, Band 137.

⁸ Connor Shorten and Taghi M. Khoshgoftaa, „A survey on Image Data Augmentation for Deep Learning,“ Journal of Big Data, 2019, . Terrance DeVries and Graham W. Taylor, „Improved Regularization of Convolutional Neural Networks with Cutout,“ 2017.

⁹ Zhiqiang Shen, Mingyang Huang, Jianping Shi, Xiangyang Xue, and Thomas S. Huang, „Towards Instance-Level Image-To-Image Translation,“ Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2019, S. 3683-3692, . Golnaz Ghiasi, Yin Cui, Aravind Srinivas, Rui Qian, Tsung-Yi Lin, Ekin D. Cubuk, Quoc V. Le, and Barret Zoph, „Simple Copy-Paste Is a Strong Data Augmentation Method for Instance Segmentation,“ Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2021, S. 2918-2928.

¹⁰ Connor Shorten, Taghi M. Khoshgoftaar and Borko Furht, „Text Data Augmentation for Deep Learning,“ Journal of Big Data, 2021, . Junghyun Min, R. Thomas McCoy, Dipanjan Das, Emily Pitler, and Tal Linzen, „Syntactic Data Augmentation Increases Robustness to Inference Heuristics,“ Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, 2020, S. 2339-2352.

¹¹ Connor Shorten, Taghi M. Khoshgoftaar, and Borko Furht, „Text Data Augmentation for Deep Learning,“ Journal of Big Data, 2021, . Rico Sennrich, Barry Haddow, and Alexandra Birch, „Improving Neural Machine Translation Models with Monolingual Data,“ Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics, 2016, S. 86-96.

¹² Connor Shorten, Taghi M. Khoshgoftaar, and Borko Furht, „Text Data Augmentation for Deep Learning,“ Journal of Big Data, 2021. Lichao Sun, Congying Xia, Wenpeng Yin, Tingting Liang, Philip Yu, and Lifang He, „Mixup-Transformer: Dynamic Data Augmentation for NLP Tasks,“ Proceedings of the 28th International Conference on Computational Linguistics, 2020. Hongyu Guo, Yongyi Mao, and Richong Zhang, „Augmenting Data with Mixup for Sentence Classification: An Empirical Study,“ 2019.

¹³ Suorong Yang, Weikang Xiao, Mengchen Zhang, Suhan Guo, Jian Zhao, and Furao Shen, „Image Data Augmentation for Deep Learning: A Survey,“ 2023. Alhassan Mumuni and Fuseini Mumuni, „Data augmentation: A comprehensive survey of modern approaches,“ Array, Ausg. 16, 2022. Evgin Goveri, „Medical image data augmentation: techniques, comparisons and interpretations,“ Artificial Intelligence Review, Ausg. 56, 2023, S. 12561-12605.

¹⁴ Ekin D. Cubuk, Barret Zoph, Dandelion Mane, Vijay Vasudevan, and Quoc V. Le, „AutoAugment: Learning Augmentation Strategies From Data,“ Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2019, S. 113-123.

¹⁵ Barret Zoph, Ekin D. Cubuk, Golnaz Ghiasi, Tsung-Yi Lin, Jonathon Shlens, and Quoc V. Le, SLearning Data Augmentation Strategies for Object Detection,S Proceedings of the 16^th European Conference on Computer Vision, 2020.

¹⁶ Sandareka Wickramanayake, Wynne Hsu, and Mong Li Lee, „Explanation-based Data Augmentation for Image Classification,“ Advances in Neural Information Processing Systems, Ausg. 34., 2021.

¹⁷ rishna Chaitanya, Neerav Karani, Christian F. Baumgartner, Anton Becker, Olivio Donati, und Ender Konukoglu, „Semi-supervised and Task-Driven Data Augmentation,“ Proceedings of the 26^th International Conference on Information Processing in Medical Imaging, 2019.

¹⁸ Cédric Rommel, Thomas Moreau, Joseph Paillard, and Alexandre Gramfort, „ADDA: Class-wise Automatic Differentiable Data Augmentation for EEG Signals“, International Conference on Learning Representations, 2022.

¹⁹ Maayan Frid-Adar, Idit Diamant, Eyal Klang, Michal Amitai, Jacob Goldberger, and Hayit Greenspan, „GAN-based synthetic medical image augmentation for increased CNN performance in liver lesion classification,“ Neurocomputing, 2018, S. 321-331.

²⁰ Veit Sandfort, Ke Yan, Perry Pickhardt, and Ronald Summers, „Data augmentation using generative adversarial networks (CycleGAN) to improve generalizability in CT segmentation tasks,“ Scientific Reports, 2019.

²¹ Kang Min Yoo, Dongju Park, Jaewook Kang, Sang-Woo Lee, und Woomyoung Park, „GPT3Mix: Leveraging Large-scale Language Models for Text Augmentation,“ Findings of the Association for Computational Linguistics: EMNLP 2021, S. 2225-2239. Haixing Dai, Zhengliang Liu, Wenxiong Liao, Xiaoke Huang, Yihan Cao, Zihao Wu, Lin Zhao, Shaochen Xu, Wei Liu, Ninghao Liu, Sheng Li, Dajiang Zhu, Hongmin Cai, Lichao Sun, Quanzheng Li, Dinggang Shen, Tianming Liu, und Xiang Li, „AugGPT: Leveraging ChatGPT for Text Data Augmentation,“ 2023.

²² Bram Vanherle, Steven Moonen, Frank Van Reeth, und Nick Michiels, „Analysis of Training Object Detection Models with Synthetic Data,“ 33^rd British Machine Vision Conference, 2022. Martin Georg Ljungqvist, Otto Nordander, Markus Skans, Arvid Mildner, Tony Liu, und Pierre Nugues, „Object Detector Differences When Using Synthetic and Real Training Data,“ SN Computer Science, Ausg. 4, 2023. Lei Kang, Marcal Rusinol, Alicia Fornes, Pau Riba, und Mauricio Villegas, „Unsupervised Writer Adaptation for Synthetic-to-Real Handwritten Word Recognition,“ Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 2020, S. 3502-3511.

Was ist Datenerweiterung?

Autoren

Was ist Datenerweiterung?

Erweiterte Daten vs. synthetische Daten

Die neuesten KI-Trends, präsentiert von Experten

Vielen Dank! Sie haben ein Abonnement abgeschlossen.

Techniken zur Datenerweiterung

Bildverbesserung

Texterweiterung

KI entschlüsseln: Wöchentlicher Nachrichtenüberblick

Aktuelle Forschung

Automatisierte Augmentation

Generative Netzwerke

Ressourcen

Fußnoten