Qu'est-ce que la visualisation des données ?
Découvrez comment la visualisation de données peut améliorer la compréhension et les analyses pour prendre de meilleures décisions plus rapidement.
Explorer IBM Planning Analytics with Watson
Arrière-plan noir et bleu
Qu'est-ce que la visualisation des données ?

La visualisation de données est la représentation des données à travers l'utilisation de graphiques communs, tels que des diagrammes, des représentations, des infographies et même des animations. Ces affichages visuels d'informations communiquent les relations de données complexes ainsi que des informations basées sur les données d'une manière facile à comprendre.

Les données de visualisation peuvent être utilisées pour une variété d'objectifs, et il est important de noter que leur utilisation n'est pas réservée aux équipes de données. La direction l'utilise également pour transmettre une structure organisationnelle et une hiérarchie, tandis que les analystes et les spécialistes des données s'en servent pour découvrir et expliquer des modèles et des tendances. Harvard Business Review (lien externe à ibm.com) classe la visualisation des données dans quatre grandes catégories : génération d'idées, illustration d'idées, reconnaissance visuelle et visualisation quotidienne de données. Nous les verrons plus en détail ci-dessous :

Génération d'idées

La visualisation de données est couramment utilisée pour stimuler la génération d'idées au sein des équipes. Elles sont fréquemment utilisées lors des sessions de remue-méninges ou Design Thinking comme début d'un projet en aidant à la collecte de différentes perspectives et en mettant en évidence les problèmes communs de la collectivité. Bien que ces visualisations soient généralement brutes et pas affinée, elles permettent de jeter les bases du projet et de s'assurer que l'équipe est en phase avec le problème qu'elle cherche à résoudre pour les principales parties prenantes.

Illustration d'idée

La visualisation de données pour l'illustration des idées aide à transmettre une idée, notamment une tactique ou un processus. Elle est couramment utilisée pour les paramètres d'apprentissage, tels que les tutoriels, les cours de certification, les centres d'excellence, mais elle peut également être utilisée pour représenter les structures et processus de l'organisation, facilitant la communication entre les bonnes personnes pour des tâches spécifiques. Les chefs de projet utilisent fréquemment des diagrammes de Gantt et des diagrammes en cascade pour illustrer le flux de travail. La modélisation des données utilise également l'abstraction pour représenter et mieux comprendre les flux de données au sein du système d'information d'une entreprise. Ainsi, les développeurs, analystes métier, les architectes de données, entre autres, peuvent comprendre plus facilement les relations dans une base de documents ou un entrepôt de données.

Reconnaissance visuelle

La reconnaissance visuelle et la visualisation quotidienne des données sont plus étroitement liées aux équipes de données. Si la reconnaissance visuelle permet aux analystes des données, aux spécialistes des données et aux autres professionnels des données d'identifier des modèles et des tendances au sein d'un fichier, la visualisation quotidienne des données permet d'établir un récit après la découverte de nouvelles informations.

Visualisation des données

La visualisation des données est une étape essentielle du processus de la science des données, car elle permet aux équipes et aux personnes de transmettre des données plus efficacement aux collègues et aux décideurs. Les équipes qui gérer les systèmes production de rapports utilisent généralement des vues de modèles définies pour surveiller les performances. Cependant, la visualisation des données ne se limite pas aux tableaux de bord des performances. Par exemple, pendant une exploration de texte un analyste peut utiliser un nuage de mots pour capturer des concepts clés, des tendances et des relations cachées dans ces données non structurées. Il peut également utiliser une structure graphique pour illustrer les relations entre les entités dans un graphique de connaissances. Il existe plusieurs façons de représenter différents types de données. Il est important de se rappeler qu'il s'agit d'un ensemble de compétences qui doit dépasser le cadre de votre équipe d'analystes de base.

Types de visualisations de données

La première forme de visualisation de données remonte aux égyptiens avant le 17e siècle, largement utilisée pour aider à la navigation. Au fil du temps, les gens ont exploité les visualisations de données pour des applications plus larges, notamment dans les domaines économique, social et de la santé. Pllus particulièrement, Edward Tufte a publié The Visual Display of Quantitative Information (lien externe à IBM) qui montre que les individus pouvaient utiliser la visualisation des données pour présenter les données de façon plus efficace. Son livre continue de résister à l'épreuve du temps, d'autant plus que les entreprises se tournent vers des tableaux de bord pour rendre compte de leurs mesures de performance en temps réel. Les tableaux de bord sont des outils de visualisation de données efficaces pour le suivi et la visualisation des données à partir de plusieurs sources de données, offrant une visibilité sur les effets des comportements caractéristiques d'une équipe ou d'un comportement adjacent sur les performances. Les tableaux de bord incluent des techniques de visualisation communes, telles que :

  • Tableaux : ils se composent des lignes et de colonnes utilisées pour comparer des variables. Les tableaux peuvent afficher une grande quantité d'informations de manière structurée, mais ils peuvent également submerger les utilisateurs qui recherchent simplement des tendances générales.
  • Graphiques circulaires et diagrammes à barres empilées :  ces graphiques sont divisés en sections qui représentent des parties d'un tout. Ils fournissent un moyen simple d'organiser les données et de comparer la taille de chaque composant à celle d'un autre.
  • Graphiques linéaires et graphiques de surface :  ces visuels montrent l'évolution d'une ou plusieurs quantités en traçant une série de points de données dans le temps et sont fréquemment utilisés dans le cadre de l'analyse prédictive. Les graphiques linéaires utilisent des lignes pour montrer ces changements, tandis que les graphiques de surface relient des points de données avec des segments de ligne, empilant les variables les unes sur les autres et utilisant la couleur pour distinguer les variables.
  • Histogrammes : ce graphique représente une distribution de nombres à l'aide d'un diagramme à barres (sans espaces entre les barres), représentant la quantité de données qui se situe dans une plage donnée. Ce visuel permet à un utilisateur final d'identifier facilement les valeurs anormales dans un fichier.
  • Nuages de points : ces visuels sont utiles pour révéler la relation entre deux variables. Ils sont couramment utilisés dans l'analyse de données de régression. Cependant, ils peuvent parfois être confondus avec les graphiques à bulles, qui permettent de visualiser trois variables via l'axe des X, l'axe des Y et la taille de la bulle.
  • Cartes de densité :  ces représentations graphiques sont utiles pour visualiser les données comportementales par emplacement. Il peut s'agir d'un emplacement sur une carte, voire d'une page Web.
  • Cartes d'arbre qui  affichent des données hiérarchiques en tant qu'ensemble de formes imbriquées, généralement des rectangles. Les cartes d'arbre sont parfaites pour comparer les proportions entre les catégories via leur superficie.
Outils de visualisation de code source ouvert

L'accès aux outils de visualisation de données n'a jamais été aussi simple. Les bibliothèques de code source ouvert, telles que D3.js, permettent aux analystes de présenter des données de manière interactive, leur permettant d'engager un public plus large avec de nouvelles données. Certaines des bibliothèques de visualisation de code source ouvert les plus populaires incluent :

  • D3.js : il s'agit d'une bibliothèque JavaScript front-en qui permet de produire des visualisations de données dynamiques et interactives dans les navigateurs Web. D3.js (lien externe à ibm.com) utilise le format HTML, CSS et SVG pour créer des représentations visuelles des données qui peuvent être visualisées dans tous les navigateurs. Il fournit également des fonctions pour les interactions et les animations.
  • ECharts : bibliothèque puissante de graphiques et de visualisation qui permet facilement d'ajouter des graphiques intuitifs, interactifs et très personnalisables aux produits, documents de recherche, présentations, etc. Echarts (lien extern à ibm.com) repose sur JavaScript et ZRender, une bibliothèque de canevas simple.
  • Vega : Vega (lien externe à ibm.com) se définit en tant que « grammaire de visualisation », fournissant de l'aide pour personnaliser les visualisations dans des fichiers volumineux qui sont accessibles sur le Web.
  • deck.gl : il fait partie de la suite d'infrastructure de visualisation de code source ouvert d'Uber. deck.gl (lien externe à ibm.com) est une infrastructure utilisée pour l'analyse de données exploratoire dans les données Big Data. Il permet de générer une visualisation optimisée par une unité de traitement graphique hautes performances sur le Web.
Meilleures pratiques de visualisation des données

Avec autant d'outils de visualisation de données facilement disponibles, la visualisation d'informations inefficace a également augmenté. La communication visuelle doit être simple et réfléchie pour garantir que la visualisation de vos données aide votre public cible à parvenir à l'analyse ou à la conclusion que vous souhaitez. Les bonnes pratiques suivantes peuvent vous aider à garantir que la visualisation de vos données est utile et claire :

Définir le contexte : il est important de fournir des informations de base générales pour indiquer aux personnes la raison pour laquelle ce point de données particulier est important. Par exemple, si les taux d'ouverture d'e-mails ne sont pas suffisants, nous pouvons illustrer comment comparer le taux d'ouverture de l'entreprise par rapport au secteur industriel global, en démontrant que l'entreprise a un problème dans son canal marketing. Pour lancer une action, le public doit comprendre comment comparer la performance actuelle à quelque chose de tangible, comme un objectif, un benchmark ou d'autres indicateurs de performance clés (KPI).

Connaître votre ou vos publics : pensez à qui est destinée votre visualisation, puis assurez-vous que la visualisation de vos données correspond à leurs besoins. Qu'est-ce que cette personne essaie d'accomplir ? De quel genre de questions se soucient-elles ? Votre visualisation répond-elle à leurs préoccupations ? Vous voudrez que les données que vous fournissez aux personnes les motivent à agir dans le périmètre de leur rôle. Si vous n'êtes pas sûr que la visualisation est claire, présentez-la à une ou deux personnes de votre public cible pour obtenir leurs commentaires, vous permettant d'apporter des modifications supplémentaires avant une présentation plus large.

Choisir un visuel efficace :  des visuels spécifiques sont conçus pour des types de fichiers spécifiques. Par exemple, les tracés éclatés indiquent bien les relations entre deux variables, tandis que les diagrammes à courbes indiquent bien les données de séries temporelles. Assurez-vous que le visuel aide réellement le public à comprendre votre idée principale. Un mauvais alignement des graphiques et des données peut avoir le résultat opposé, déroutant votre public encore plus au lieu de fournir de la clarté.

Restez simple :  les outils de visualisation de données peuvent faciliter l'ajout de tous types d'informations à votre visuel. Cependant, c'est n'est pas parce que vous pouvez le faire, que vous devez le faire ! Dans la visualisation de données, vous devez être conscient des informations supplémentaires que vous ajoutez pour concentrer l'attention de l'utilisateur. Par exemple, avez-vous besoin de libellés de données sur chaque barre de votre diagramme à barres ? Peut-être n'avez-vous besoin que d'un ou deux pour aider à illustrer votre point. Avez-vous besoin de différentes couleurs pour communiquer votre idée ? Utilisez-vous des couleurs accessibles à une large plage de publics (ex : tenir compte des couleurs pour les publics aveugles en couleur) ? Concevez votre visualisation de données pour qu'il ait un impact maximum, en éliminant les informations qui peuvent distraire votre public cible.

Solutions connexes
Cognos Analytics

Votre co-pilote Watson digne de confiance pour des analyses plus intelligentes et fiables.

Explorer Cognos Analytics
Planning Analytics

Une solution de planification intégrée infusée d'IA qui vous aide à dépasser les limites de la planification manuelle.

Explorer Planning Analytics
IBM Watson Studio

Créez, exécutez et gérez des modèles d'IA. Préparez les données et construisez des modèles dans n'importe quel cloud à l'aide d'un code source ouvert ou de la modélisation visuelle. Prévoyez et optimisez vos résultats.

Explorer IBM Watson ® Studio
Pour aller plus loin

Bien qu'il existe divers outils de visualisation de données sur le marché, Cognos Analytics est l'outil d'intelligence d'entreprise et de visualisation de données d'IBM. La plateforme en libre-service de Cognos Analytics intègre une technologie d'informatique cognitive, y compris l'intelligence artificielle et l'apprentissage automatique, pour faciliter la visualisation des données, partager de nouvelles informations et encourager la prise de décision en fonction des données dans les organisations.

Explorer IBM Cognos® Analytics maintenant