Offre des fonctions enrichies pour la création et la surveillance de la qualité des données

capture d'écran de l'interface InfoSphere QualityStage

IBM® InfoSphere® QualityStage® est conçu pour soutenir vos initiatives en matière de qualité des données et de gouvernance de l'information. Vous pouvez examiner, nettoyer et gérer vos données, afin de conserver des vues cohérentes des entités clés, notamment les clients, les fournisseurs, les emplacements et les produits. Grâce à la solution, vous pouvez fournir des données de qualité pour vos projets de big data, d'aide à la décision, d'entreposage des données, de migration des applications et de gestion des données de référence. Disponible également pour IBM System z®.

« Comment la qualité des données en ligne fournit des données métier pour l'IA »

« Comment la qualité des données en ligne fournit des données métier pour l'IA » Lire l'article de blog (lien externe à IBM)

Avantages d'IBM InfoSphere QualityStage

Des données de qualité

Offre des fonctionnalités telles que le profilage des données, la normalisation, la correspondance probabiliste et l'enrichissement des données

Une plateforme unifiée

Fournit des fonctions de qualité des données dans le cadre d'une plateforme complète d'intégration d'information

Un support pour la gouvernance de l'information

Active des fonctionnalités entre organisations pour prendre en charge vos politiques de gouvernance de l'information

Principales fonctions d'InfoSphere QualityStage

Profilage approfondi des données

Utilisez le profilage et l'analyse approfondis pour comprendre le contenu, la qualité et la structure des tables et fichiers. Ceci inclut l'analyse des colonnes, la classification des données, les scores de qualité des données, l'analyse des relations, l'analyse des clés primaires multicolonnes et l'analyse des chevauchements.

Plus de 200 règles intégrées de qualité des données

Contrôlez l'ingestion des « mauvaises » données en exécutant des règles de qualité lors de la transformation des données et avant de les charger dans l'entrepôt de données, le lac de données ou des applications. Utilisez plus de 200 règles intégrées pour acheminer les données vers la bonne personne pour les réparer, afin de garantir leur fiabilité.

Plus de 250 classes de données intégrées

Identifiez les endroits où sont stockées les informations personnelles identifiables, les données sensibles et autres classes de données. Vous pouvez également identifier le type des données contenues dans une colonne à l'aide de plus de 250 classes de données intégrées, notamment les cartes de crédit, identifiants des contribuables et numéros de téléphone américains. Créez et personnalisez trois types de classe de données : liste de valeurs valides, expression régulière (regex) et classe Java.

Normalisation des données et mise en correspondance des enregistrements

Synthétisez toutes les données provenant de diverses sources dans un format ou une norme commune pour l'environnement cible. Retirez les doublons et fusionnez plusieurs systèmes dans une vue unique, afin de créer des données précises et fiables.

Gouvernance intégrée

Utilisez le rapport Health Summary by Data Rules, qui présente également des règles non liées à la gouvernance de l'information, afin de prendre en charge la mise en œuvre de règles de données pour la gestion des exceptions.

Déploiement sur site ou dans le cloud

Migrez vers un cloud privé ou public grâce avec des options de déploiement et une tarification par abonnement flexible. Vous pouvez étendre votre capacité sur site ou passer directement au cloud. Réduisez le délai de rentabilisation, les coûts d'administration et les risques liés à la tarification par abonnement.

Affectation automatique des termes métier avec apprentissage automatique

Utilisez l'apprentissage automatique pour accélérer le processus de classification des métadonnées (balisage automatique) en utilisant les noms de colonne et la classe de données pour attribuer et suggérer des termes pour une colonne donnée.

Vous pourriez également être intéressé par

IBM InfoSphere Information Server for Data Quality

Nettoyez les données et surveillez leur qualité dans un environnement unifié.

IBM BigQuality

Fournissez un riche ensemble de fonctionnalités de qualité, de profilage, de nettoyage et de surveillance des données pour les cllusters de stockage big data Hadoop.

IBM Watson® Knowledge Catalog

Un catalogue de données d'entreprise optimisé par Watson™ et intégré à une plateforme de gouvernance qui peut aider vos citoyens des données à trouver, conserver, catégoriser, gouverner, analyser et partager rapidement des données prêtes pour l'entreprise.