データ可視化とは、チャートやプロット、インフォグラフィック、さらにはアニメーションなどの一般的なグラフィックを用いてデータを表現することです。 これらの情報は、複雑なデータの関係やデータに基づいた洞察をわかりやすく伝えるために、視覚的に表示されます。
データ視覚化は様々な目的に利用できますが、データ・チームだけが利用するものではないことに留意する必要があります。 また、経営者は組織構造や階層を伝えるために活用し、データ・アナリストやデータ・サイエンティストはパターンやトレンドを発見して説明するために活用しています。ハーバード・ビジネス・レビュー IBM外部へのリンク)では、データ可視化をアイデアの創出、アイデアの図示、ビジュアル・ディスカバリー、日々のデータ可視化の4つの目的に分類しています。 これらについては、以下で詳しく説明します。
データ可視化は、チーム内のアイデアの創出を促進するためによく使われます。 これは、プロジェクト開始時のブレーンストーミングや デザイン・シンキング の際に、さまざまな視点を集め、集団の共通の関心事を浮き彫りにするためによく活用されます。 これらの可視化は通常、洗練されていませんが、主要なステークホルダーのために解決しようとしている問題についてチームが一致していることを確認するために、プロジェクト内の基盤を設定するのに役立ちます。
アイデアの図示のためのデータ可視化は、戦術やプロセスなどのアイデアを伝えるのに役立ちます。 一般的には、チュートリアル、認定コース、センター・オブ・エクセレンスなどの学習環境で使用されますが、組織の構造やプロセスを表現し、特定のタスクに適した個人間のコミュニケーションを促進するためにも使用されます。 プロジェクト・マネージャーは ワークフローを図示するために、ガント・チャートやウォーターフォール・チャートをよく使います。 また、データ・モデリング は、企業の情報システム内のデータの流れを抽象化して表現し、理解しやすくします。これにより、開発者、ビジネス・アナリスト、データ・アーキテクトなどが、データベースやデータウェアハウス内の関係を理解しやすくなります。
ビジュアル・ディスカバリーや日々のデータ可視化は、データ・チームとより密接に関わっています。 ビジュアル・ディスカバリーは、データ・アナリストやデータサイエンティスト、およびその他のデータ専門家がデータ・セット内のパターンやトレンドを特定するのに役立ちますが、日常的なデータ可視化は、新しい洞察を発見した後のストーリーテリングをサポートします。
データ可視化は、データサイエンスのプロセスにおいて重要なステップであり、チームや個人が同僚や意思決定者にデータをより効果的に伝えるのに役立ちます。 レポート・システムを管理するチームは、通常、定義済みのテンプレート・ビューを活用してパフォーマンスを監視します。 ただし、データ可視化はパフォーマンス・ダッシュボードに限定されません。例えば テキスト・マイニング では、非構造化データの中から重要な概念、トレンド、隠れた関係性を見つけ出すためにワード・クラウドを使用することがあります。 あるいは、ナレッジ・グラフのエンティティー間の関係を示すためにグラフ構造を使用することもあります。 さまざまな種類のデータを表現する方法はいくつかありますが、中核となる分析チーム以外にも広げるべきスキルセットであることを覚えておくことが重要です。
データ可視化の最初の形は、17世紀以前のエジプト人にまで遡ることができ、主に航海の補助として使われていました。 時代が進むにつれ、経済、社会、健康など、より幅広い分野でデータ可視化が活用されるようになりました。 特に、Edward Tufte氏は The Visual Display of Quantitative Information IBM外部へのリンク)を発表し、個人がデータをより効果的に表現するためにデータ可視化を活用することを示しました。 彼の著書は、企業がパフォーマンス指標をリアルタイムで報告するためにダッシュボードを利用するようになった今でも、人気であり続けています。 ダッシュボードは、複数のデータ・ソースからのデータを追跡、可視化するための効果的なデータ可視化ツールで、チームや隣接するチームの特定の行動がパフォーマンスに与える影響を可視化します。 ダッシュボードには、以下のような一般的な視覚化技術が含まれています。
データ可視化ツールへのアクセスがこれまでになく簡単になりました。 D3.jsのようなオープンソースのライブラリは、アナリストがデータを対話式に表現する方法を提供し、新しいデータをより多くの人に見てもらうことを可能にします。 代表的なオープン・ソースの可視化ライブラリには、以下のようなものがあります。
多くのデータ可視化ツールが手軽に利用できるようになった一方で、効果のない情報可視化も増えてきました。 視覚的コミュニケーションは、対象者が意図したインサイトや結論に到達できるように、シンプルかつ計画的に行う必要があります。 以下のベスト・プラクティスは、あなたのデータ可視化が有用で明確であることを保証します。
背景を設定する: この特定のデータ・ポイントが重要である理由について、対象者に一般的な背景情報を提供することが重要です。 例えば、メールの開封率が低迷している場合、業界全体と比較した開封率を示し、このマーケティング・チャネルに問題があることを示すことができます。 行動を促すためには、オーディエンスが目標やベンチマーク、その他の重要業績評価指標(KPI)など、明確なものと現在のパフォーマンスとの比較を理解する必要があります。
オーディエンスを知る: 可視化が誰を対象としたものかを考え、データ可視化が彼らのニーズに合っていることを確認します。 その人は何をしようとしているのでしょうか。 どんな質問が気になりますか。 可視化することで、彼らの不安を解消することができますか? あなたが提供するデータは、人々が自分の役割の範囲内で行動するように動機づけるためのものです。 可視化が明確かどうかわからない場合は、ターゲットとなる人々の中の1人か2人に提示してフィードバックをもらい、大規模なプレゼンテーションを行う前に追加の編集を行うことができます。
効果的なビジュアルを選択する: 特定のタイプのデータ・セットのために、特定のビジュアルがデザインされています。 例えば、散布図は2つの変数の関係をよく表し、折れ線グラフは時系列データをうまく表します。 オーディエンスが要点を理解するのに役立つビジュアルであることを確認してください。 チャートやデータがずれていると、分かりやすくするどころか、逆に聴衆を混乱させてしまいます。
単純にする: データ可視化ツールを使えば、さまざまな情報を簡単にビジュアルに加えることができます。 ただし、できるからといって、そうすべきだという意味ではありません。 データ可視化では、ユーザーの注目を集めるために、追加する情報は慎重に判断したいものです。 例えば、棒グラフのすべてのバーにデータラベルが必要でしょうか? おそらく要点を伝えるためには、1つか2つあれば十分でしょう。 アイデアを伝えるために、さまざまな色が必要ですか? 幅広い層に受け入れられる色を使用していますか(例えば、色覚異常への配慮など)。 データ可視化では、ターゲットとなる人々の気を散らすような情報を排除し、最大限のインパクトを与えるようにデザインします。
信頼できるWatson副操縦士がいれば、よりスマートな分析と自信に満ちた意思決定を行うことができます。
手動による計画の限界を乗り越えるのに役立つ、AIを活用した統合計画ソリューションです。
AIモデルを構築、実行、管理します。 オープンソース・コードやビジュアル・モデリングを使用して、任意のクラウド上でデータを準備し、モデルを構築できます。 結果の予測と最適化を行うこともできます。