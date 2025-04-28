Unstrukturierte Daten sind Informationen, die kein vordefiniertes Format haben. Unstrukturierte Datensätze sind enorm groß (oft Terabytes oder Petabytes an Daten) und enthalten 90 % aller von Unternehmen generierten Daten.1

Die Verbreitung unstrukturierter Daten wird durch ihre vielfältigen und umfangreichen Datenquellen vorangetrieben – darunter Textdokumente, soziale Medien, Bild- und Audiodateien, Instant Messages und Smart Devices. Fast alle heute generierten neuen Daten sind unstrukturiert: Jede versendete Nachricht, jedes hochgeladene Foto und jeder ausgelöste Sensor trägt zum wachsenden Datenvolumen bei.

Im Gegensatz zu strukturierten Daten (die über ein vordefiniertes Datenmodell verfügen) lassen sich unstrukturierte Daten nicht ohne Weiteres in die festen Schemata herkömmlicher Datenbanken einfügen. Stattdessen werden unstrukturierte Daten häufig in Dateisystemen, nicht-relationalen (oder NoSQL-Datenbanken) oder in Data Lakes gespeichert.

Die Komplexität unstrukturierter Daten und ihre uneinheitliche Datenstruktur erfordern zudem ausgefeiltere Methoden der Datenanalyse. Technologien wie maschinelles Lernen (ML) und Verarbeitung natürlicher Sprache (NLP) werden häufig eingesetzt, um Erkenntnisse aus unstrukturierten Datensätzen zu gewinnen.

In der jüngeren Vergangenheit galten unstrukturierte Daten als Dark Data. Die Herausforderungen unstrukturierter Daten (d. h. das Volumen und die mangelnde Einheitlichkeit) machten sie für viele Anwendungsfälle unbrauchbar.

Heutzutage verfügen Unternehmen mit einer Fülle von unstrukturierten Daten jedoch über ein wichtiges strategisches Asset. In Kombination bieten strukturierte und unstrukturierte Daten einen vollständigen Überblick über die Daten im gesamten Unternehmen. Und was zum aktuellen Zeitpunkt besonders relevant ist: dass unstrukturierte Daten Unternehmen dabei unterstützen können, das volle Potenzial der generativen KI (GenAI) freizuschalten.