データの可視化とは、チャートやプロット、インフォグラフィックなどの一般的な画像、さらにアニメーションを使用してデータをわかりやすく表現することです。本ページではデータ可視化の意味や例、ツールの紹介をします。これらの視覚的な情報表示により、複雑なデータ関係とデータ駆動型の洞察がわかりやすい方法で伝えられます。
データの可視化はさまざまな目的に利用でき、データチームだけが使用できるわけではないことに注意するのが重要です。経営陣も組織構造と階層を伝えるために活用し、データアナリストやデータサイエンティストもパターンと傾向の発見や説明のために利用します。Harvard Business Review(ibm.com外部へのリンク)では、データの可視化を、アイデアの生成、アイデアの例示、視覚的な発見、日常的なデータの可視化という4つの主な目的に分類しています。以下でこれらについてさらに詳しく説明します。
データの可視化は、チーム全体でアイデアの生成を促進するためによく使用されます。これは、プロジェクト開始時のブレインストーミングやデザイン思考セッション中に頻繁に活用され、さまざまな視点の収集をサポートし、集団の共通の懸念事項を浮き彫りにします。こうした可視化は通常、磨きがかけられ洗練されたものではありませんが、プロジェクト内で基盤を確立し、主要な利害関係者のために対処しようとしている問題に関してチームが足並みを揃えられるようになります。
データの可視化は、施策やプロセスなどのアイデアを伝えるのに役立ちます。チュートリアル、認定コース、センター・オブ・エクセレンスなどの学習環境でよく使用されますが、組織の構造やプロセスを表すためにも使用でき、特定のタスクに適した個人間のコミュニケーションを促進します。プロジェクト・マネージャーは、ワークフローを示すためにガント・チャートやウォーターフォール・チャートを頻繁に使用します。データ・モデリングでは、抽象化を使用して企業の情報システム内のデータ・フローを表し、理解を深めます。これにより、開発者、ビジネス・アナリスト、Data Architect などがデータベースやデータ・ウェアハウス内の関係を理解しやすくなります。
視覚的な発見と日常的なデータの可視化は、データチームとより密接に関連しています。視覚的な発見は、データアナリストやデータサイエンティストその他のデータ専門家がデータ・セット内のパターンや傾向を特定するのに役立つのに対し、日常的なデータの可視化は、新しい洞察が見つかった後のストーリーテリングをサポートします。
データの可視化はデータサイエンス・プロセスにおいて、重要なステップであり、チームや個人が同僚や意思決定者により効果的にデータを伝えることに貢献します。レポート・システムを管理するチームは通常、定義済みのテンプレート・ビューを活用してパフォーマンスを監視します。ただし、データの可視化はパフォーマンス・ダッシュボードに限定されません。例えば、テキスト・マイニング中に、アナリストがワードクラウドを使用して、非構造化データ内の主要な概念や傾向、隠れた関係を把握するかもしれません。あるいは、グラフ構造を利用してナレッジ・グラフ内のエンティティー間の関係を例示することもあるでしょう。さまざまな種類のデータを表現する方法は数多くあり、これはコア分析チームの枠を超えて拡張すべきスキルセットであることを覚えておくことが重要です。
データの可視化の最も初期の形態は、主に航海を支援するために使用されていた17世紀以前のエジプト人にまでさかのぼります。時代が進むにつれて、人々は経済・社会・健康分野などのより広範な用途にデータの可視化を使用するようになりました。おそらく最も注目すべきなのは、Edward Tufte氏の『The Visual Display of Quantitative Information(定量情報の視覚的表示)』(ibm.com外部へのリンク)が出版されたことです。同書では、個人がデータの可視化を利用して、より効果的な方法でデータを提示できることが例示されています。企業がパフォーマンス指標をリアルタイムで報告するためにダッシュボードに頼るようになった今の時代にも、この著書は色褪せることなく有用な情報を提供してくれます。ダッシュボードは、複数のデータ・ソースからのデータを追跡・視覚化するための効果的なデータの可視化ツールであり、チームまたは隣接チームによる特定の行動がパフォーマンスに及ぼす影響を可視化します。ダッシュボードには、次のような一般的な視覚化手法が含まれます。
データの可視化ツールへのアクセスは、かつてないほど容易になりました。D3.jsなどのオープンソース・ライブラリーは、アナリストのためにインタラクティブなデータ提示方法を提供し、これによりさらに幅広い対象者に新しいデータを提供できるようにします。最も人気のあるオープンソースの視覚化ライブラリーには、次のようなものがあります。
利用可能なデータの可視化ツールが非常に多くなったことで、非効率な情報の可視化も増加しています。データの可視化により、対象者が意図した知見や結論に確実に到達できるように、ビジュアル・コミュニケーションはシンプルかつ慎重に行う必要があります。次のいくつかのベスト・プラクティスは、データの可視化を有用で明瞭なものにすることに役立ちます。
コンテキストを設定する: 特定のデータ・ポイントが重要な理由を相手に理解してもらうには、一般的な背景情報を提供することが重要です。例えば、Eメールの開封率が低迷しているときに、その企業の開封率を業界全体と比較して図示し、その企業には特定のマーケティング・チャネル内に問題があることを示したいとします。是正措置を進めるには、現在のパフォーマンスが目標やベンチマークその他の重要業績評価指標(KPI)などと具体的に比較してどのような状況であるのかを対象者が理解する必要があります。
対象者を知る: 可視化が誰のためのものであるのかを考え、データの可視化がそのニーズに適しているかを検討します。対象となる人が達成しようとしているのは何か。どのような質問に関心を持っているのか。可視化は彼らの懸念に応えるものか。提供するデータが、対象となる人たちが役割の範囲内で、行動を起こしたいという動機を与えるものにする必要があります。可視化されたデータが明瞭であるかはっきりしない場合は、対象者の幾人かにデータを提示し、フィードバックを得るようにしましょう。それにより、大規模なプレゼンテーションの前に編集を行えます。
効果的なビジュアルを選ぶ: 特定のビジュアルは、特定のタイプのデータ・セット向けに設計されています。例えば、散布図は2つの変数間の関係を表示するのに適しており、折れ線グラフは時系列データを表示するのに適しています。ビジュアルが実際に、対象者にとって要点の理解に役立つようにしましょう。グラフとデータの関係が適切でないと、明瞭になるどころか、対象者を混乱させる可能性があります。
シンプルさを保つ: データの可視化ツールを使用すると、ビジュアルにあらゆる種類の情報を簡単に追加できます。ただし、「できる」ということは「そうすべき」という意味ではありません。データの可視化においては、ユーザーの注意を引くために追加する追加情報については、慎重に検討する必要があります。例えば、棒グラフのすべての棒にデータ・ラベルが必要でしょうか。おそらく、要点を例示するには1つか2つだけで十分でしょう。アイデアを伝えるためにカラフルである必要があるでしょうか。幅広い対象者が利用できる色を使用していますか(例えば、色盲の読者を考慮に入れているか)。対象者の注意をそらす可能性のある情報を排除することで、最大限の効果が得られるようにデータの可視化を設計しましょう。
AIを導入した統合計画ソリューション:これにより、手動による計画の限界を超えることができます。
AIモデルの構築、実行、管理を行います。オープンソースコードまたはビジュアルモデリングを使用して、任意のクラウド上でデータを準備し、モデルを構築し、さらに結果を予測して最適化します。
企業データの価値を解き放ち、ビジネス上の優位性をもたらす知見に根差した組織を構築できるよう、IBMコンサルティングが支援します。
信頼できるWatson副操縦士が、よりスマートな分析と自信に満ちた意思決定を行えるよう支援します。
IBM SPSS Statisticsは、強力な統計ソフトウェア・プラットフォームです。使いやすいインターフェースと信頼性の高い機能により、データから実用的な洞察を迅速に導き出します。
IBM Watson Studio内の機能を使用すると、データを可視化して洞察を得られ、データのクレンジングおよび変換を通じて高品質の予測モデルを構築できるようになります。
Data Refineryを使用すると、組織の全スタッフが信頼できるデータの探索・準備・配信が容易にできるようになります。
Apache Superset(エンタープライズ対応の最新のビジネス・インテリジェンスWebアプリケーション)をNetezzaデータベースと一緒に使用し、データの背後にあるストーリーを明らかにする方法をご覧ください。