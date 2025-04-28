Les données non structurées sont des informations qui ne suivent pas de format prédéfini. Les jeux de données non structurés sont massifs (souvent de l’ordre du téraoctet ou du pétaoctet) et contiennent 90 % de toutes les données générées par l’entreprise.1

Cette explosion des données non structurées s’explique par la diversité et l’abondance de leurs sources : documents texte, réseaux sociaux, fichiers image ou audio, messages instantanés, objets connectés, etc. Aujourd’hui, la quasi-totalité des nouvelles données générées est non structurée : chaque message envoyé, photo mise en ligne ou capteur déclenché contribue à l’augmentation du volume global.

Contrairement aux données structurées, qui obéissent à un modèle de données prédéfini, les données non structurées ne s’adaptent pas facilement aux schémas rigides des bases de données traditionnelles. Elles sont généralement stockées dans des systèmes de fichiers, des bases de données non relationnelles (NoSQL) ou dans des data lakes.

La complexité et la structure de données non uniforme des données non structurées nécessitent également des méthodes d’analyse des données plus sophistiquées. Des technologies comme le machine learning (ML) et le traitement automatique du langage naturel (NLP) sont souvent utilisées pour extraire des informations utiles à partir de ces jeux de données.

Jusqu’à récemment, les données non structurées étaient souvent qualifiées de dark data, en raison de leur volume et de leur hétérogénéité, qui les rendaient difficilement exploitables dans de nombreux cas d’utilisation.

Aujourd’hui, les entreprises disposant d’importants volumes de données non structurées détiennent un atout stratégique majeur. Combinées aux données structurées, elles offrent une vision complète et transversale des activités de l’entreprise. Et surtout, dans le contexte actuel, elles permettent aux entreprises de tirer pleinement parti du potentiel de l’intelligence artificielle générative (IA générative).