IBM InfoSphere QualityStage

Étudiez, nettoyez et gérez les données pour tirer le meilleur profit de vos actifs informationnels

Sphères violettes sur fond foncé

Des fonctionnalités puissantes pour créer et surveiller la qualité des données

IBM InfoSphere QualityStage est conçu pour soutenir vos initiatives en matière de qualité et de gouvernance des données. Explorez, nettoyez et gérez vos données afin de maintenir une vue cohérente des entités clés, notamment les clients, les fournisseurs, les emplacements et les produits. La solution vous aide à fournir des données de qualité pour vos projets big data, de business intelligence, d’entreposage de données, de migration d’applications et de gestion des données de référence. Également disponible pour IBM System z.

Lire le rapport Gartner
Des données de qualité

Profitez de fonctionnalités comme le profilage des données, la normalisation, le rapprochement probabiliste et l’enrichissement des données.

Une plateforme unifiée

Accédez à des fonctions de qualité des données dans le cadre d’une plateforme complète d’intégration d’informations.

Prise en charge de la gouvernance de l’information

Bénéficiez de capacités inter-organisationnelles pour soutenir vos politiques de gouvernance de l’information.

Attribution automatique de termes métier à l’aide du machine learning

Utilisez le machine learning pour accélérer le processus de classification des métadonnées (balisage automatique) en utilisant les noms de colonne et la classe de données pour attribuer et suggérer des termes pour une colonne donnée.

Fonctionnalités

Profilage approfondi des données

Utilisez le profilage et l’analyse approfondis des données pour mieux comprendre le contenu, la qualité et la structure des tables et des fichiers. Ces fonctionnalités couvrent l’analyse des colonnes, la classification des données, les scores de qualité des données, l’analyse des relations, l’analyse des clés primaires multicolonnes et l’analyse des chevauchements.

Plus de 200 règles intégrées pour la qualité des données

Contrôlez l’ingestion de « mauvaises » données en exécutant des règles de qualité des données lors de la transformation et avant le chargement dans l’entrepôt de données, le data lake ou dans des applications. Utilisez plus de 200 règles intégrées pour acheminer les données vers la bonne personne afin de les corriger et de garantir leur fiabilité.

Plus de 250 classes de données intégrées

Identifiez l’emplacement de stockage des informations personnelles identifiables (PII), les données sensibles et autres classes de données. Accédez également à plus de 250 classes de données intégrées, y compris cartes de crédit, identifiants de contribuable et numéros de téléphone américains pour identifier le type de données contenues dans une colonne. Créez et personnalisez trois types de classes de données : liste de valeurs valides, expressions régulières (regex) et classes Java.

Normalisation des données et correspondance des enregistrements

Synthétisez toutes les données provenant de diverses sources dans une norme ou un format commun pour l’environnement cible. Supprimez les doublons et fusionnez plusieurs systèmes dans une vue unique pour créer des données précises et fiables.

Gouvernance intégrée

Tirez parti du rapport Health Summary by Data Rules, qui affiche également les règles non liées à la gouvernance de l’information, pour soutenir l’application des règles de données dans la gestion des exceptions.

Déploiement sur site ou dans le cloud

Profitez d’options de déploiement et de tarifs d’abonnement flexibles pour votre transition vers un cloud privé ou public. Étendez votre capacité sur site ou passez directement au cloud. Bénéficiez d’un retour sur investissement plus rapide, de coûts d’administration réduits et de tarifs d’abonnement abordables.

Profilage approfondi des données

Utilisez le profilage et l’analyse approfondis des données pour mieux comprendre le contenu, la qualité et la structure des tables et des fichiers. Ces fonctionnalités couvrent l’analyse des colonnes, la classification des données, les scores de qualité des données, l’analyse des relations, l’analyse des clés primaires multicolonnes et l’analyse des chevauchements.

Plus de 200 règles intégrées pour la qualité des données

Contrôlez l’ingestion de « mauvaises » données en exécutant des règles de qualité des données lors de la transformation et avant le chargement dans l’entrepôt de données, le data lake ou dans des applications. Utilisez plus de 200 règles intégrées pour acheminer les données vers la bonne personne afin de les corriger et de garantir leur fiabilité.

Plus de 250 classes de données intégrées

Identifiez l’emplacement de stockage des informations personnelles identifiables (PII), les données sensibles et autres classes de données. Accédez également à plus de 250 classes de données intégrées, y compris cartes de crédit, identifiants de contribuable et numéros de téléphone américains pour identifier le type de données contenues dans une colonne. Créez et personnalisez trois types de classes de données : liste de valeurs valides, expressions régulières (regex) et classes Java.

Normalisation des données et correspondance des enregistrements

Synthétisez toutes les données provenant de diverses sources dans une norme ou un format commun pour l’environnement cible. Supprimez les doublons et fusionnez plusieurs systèmes dans une vue unique pour créer des données précises et fiables.

Gouvernance intégrée

Tirez parti du rapport Health Summary by Data Rules, qui affiche également les règles non liées à la gouvernance de l’information, pour soutenir l’application des règles de données dans la gestion des exceptions.

Déploiement sur site ou dans le cloud

Profitez d’options de déploiement et de tarifs d’abonnement flexibles pour votre transition vers un cloud privé ou public. Étendez votre capacité sur site ou passez directement au cloud. Bénéficiez d’un retour sur investissement plus rapide, de coûts d’administration réduits et de tarifs d’abonnement abordables.

Cas d’utilisation

Illustration isométrique d’un data lake en teintes violettes

Gouvernance de data lake

Accélérez l’exploration et déverrouillez les informations grâce à l’intégration, la qualité et la disponibilité des données incorporées à votre environnement de data lake.

Illustration isométrique d’un entrepôt de données en teintes violettes

Déchargement de votre entrepôt de données d’entreprise (EDW)

L’une des approches de modernisation les plus efficaces consiste à transférer les données EDW et les charges de travail ETL vers un data lake Apache Hadoop.

Produits associés

Détectez et résolvez rapidement les incidents liés aux données

Alertez, répondez et résolvez tous vos incidents liés aux données en un seul endroit grâce à l'observabilité des données.

IBM BigQuality

Accédez à un ensemble complet de fonctionnalités de qualité, de profilage, de nettoyage et de surveillance des données pour les clusters de stockage big data Hadoop.

IBM Knowledge Catalog

Catalogue de données d’entreprise intégré à une plateforme de gouvernance permettant aux personnes autorisées de rechercher, d’organiser, de catégoriser, de gérer, d’analyser et de partager rapidement des données prêtes à l’emploi.

IBM InfoSphere Information Server for Data Quality

Nettoyez les données et contrôlez leur qualité dans un environnement unifié.

Passez à l’étape suivante

Ressources spécialisées pour vous aider à réussir.

Autres moyens d’information Support Communauté Services de conseil pour les données et les analyses