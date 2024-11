Les organisations travaillent aujourd’hui avec une grande quantité de données, qui proviennent de différentes sources et se présentent sous différents formats. Ces données sont gérées par différents utilisateurs et se retrouvent dispersées dans des clouds publics et privés, dans des systèmes de stockage sur site et même sur les points de terminaison personnels des employés.

Il peut être difficile de suivre et de gérer de manière centralisée toutes ces données, ce qui soulève deux problèmes.

Tout d’abord, une organisation ne peut pas utiliser un jeu de données si elle ne sait pas qu’il existe.

Ensuite, ces « données fantômes » non découvertes et non gérées présentent des risques de sécurité. Selon le rapport sur le coût d’une violation de données d’IBM, un tiers des violations de données impliquent des données fantômes. Ces violations coûtent en moyenne 5,27 millions de dollars, soit 16 % de plus que le coût moyen global d’une violation.

L’IA et le ML peuvent automatiser de nombreux aspects de la découverte de données, en accordant aux organisations plus de visibilité et de contrôle sur l’ensemble de leurs actifs de données.

Exemples d’IA dans la découverte de données

Les outils de découverte de données alimentés par l’IA peuvent analyser automatiquement les périphériques réseau et les référentiels de stockage de données, en indexant les nouvelles données quasiment en temps réel.

Les outils de classification automatisés des données peuvent étiqueter les nouvelles données en fonction de règles prédéfinies ou de modèles de machine learning. Par exemple, l’outil peut classer tout numéro à neuf chiffres dans le format XXX-XX-XXXX comme un numéro de sécurité sociale américain.