データ可視化とは何か
データ可視化によって、どのように理解や分析が向上し、より良い迅速な意思決定が可能になるのかをご紹介します。
IBM Planning Analytics with Watsonの詳細はこちら
黒と青の背景
データ可視化とは何か

データ可視化とは、チャートやプロット、インフォグラフィック、さらにはアニメーションなどの一般的なグラフィックを用いてデータを表現することです。 これらの情報は、複雑なデータの関係やデータに基づいた洞察をわかりやすく伝えるために、視覚的に表示されます。

データ視覚化は様々な目的に利用できますが、データ・チームだけが利用するものではないことに留意する必要があります。 また、経営者は組織構造や階層を伝えるために活用し、データ・アナリストやデータ・サイエンティストはパターンやトレンドを発見して説明するために活用しています。ハーバード・ビジネス・レビュー IBM外部へのリンク)では、データ可視化をアイデアの創出、アイデアの図示、ビジュアル・ディスカバリー、日々のデータ可視化の4つの目的に分類しています。 これらについては、以下で詳しく説明します。

アイデアの創出

データ可視化は、チーム内のアイデアの創出を促進するためによく使われます。 これは、プロジェクト開始時のブレーンストーミングや デザイン・シンキング の際に、さまざまな視点を集め、集団の共通の関心事を浮き彫りにするためによく活用されます。 これらの可視化は通常、洗練されていませんが、主要なステークホルダーのために解決しようとしている問題についてチームが一致していることを確認するために、プロジェクト内の基盤を設定するのに役立ちます。

アイデアの図示

アイデアの図示のためのデータ可視化は、戦術やプロセスなどのアイデアを伝えるのに役立ちます。 一般的には、チュートリアル、認定コース、センター・オブ・エクセレンスなどの学習環境で使用されますが、組織の構造やプロセスを表現し、特定のタスクに適した個人間のコミュニケーションを促進するためにも使用されます。 プロジェクト・マネージャーは ワークフローを図示するために、ガント・チャートやウォーターフォール・チャートをよく使います。 また、データ・モデリング は、企業の情報システム内のデータの流れを抽象化して表現し、理解しやすくします。これにより、開発者、ビジネス・アナリスト、データ・アーキテクトなどが、データベースやデータウェアハウス内の関係を理解しやすくなります。

ビジュアル・ディスカバリー

ビジュアル・ディスカバリーや日々のデータ可視化は、データ・チームとより密接に関わっています。 ビジュアル・ディスカバリーは、データ・アナリストやデータサイエンティスト、およびその他のデータ専門家がデータ・セット内のパターンやトレンドを特定するのに役立ちますが、日常的なデータ可視化は、新しい洞察を発見した後のストーリーテリングをサポートします。

データ可視化

データ可視化は、データサイエンスのプロセスにおいて重要なステップであり、チームや個人が同僚や意思決定者にデータをより効果的に伝えるのに役立ちます。 レポート・システムを管理するチームは、通常、定義済みのテンプレート・ビューを活用してパフォーマンスを監視します。 ただし、データ可視化はパフォーマンス・ダッシュボードに限定されません。例えば  テキスト・マイニング では、非構造化データの中から重要な概念、トレンド、隠れた関係性を見つけ出すためにワード・クラウドを使用することがあります。 あるいは、ナレッジ・グラフのエンティティー間の関係を示すためにグラフ構造を使用することもあります。 さまざまな種類のデータを表現する方法はいくつかありますが、中核となる分析チーム以外にも広げるべきスキルセットであることを覚えておくことが重要です。

データ可視化の種類

データ可視化の最初の形は、17世紀以前のエジプト人にまで遡ることができ、主に航海の補助として使われていました。 時代が進むにつれ、経済、社会、健康など、より幅広い分野でデータ可視化が活用されるようになりました。 特に、Edward Tufte氏は The Visual Display of Quantitative Information IBM外部へのリンク)を発表し、個人がデータをより効果的に表現するためにデータ可視化を活用することを示しました。 彼の著書は、企業がパフォーマンス指標をリアルタイムで報告するためにダッシュボードを利用するようになった今でも、人気であり続けています。 ダッシュボードは、複数のデータ・ソースからのデータを追跡、可視化するための効果的なデータ可視化ツールで、チームや隣接するチームの特定の行動がパフォーマンスに与える影響を可視化します。 ダッシュボードには、以下のような一般的な視覚化技術が含まれています。

  • 表: これは、変数を比較するための行と列で構成されています。 表は、大量の情報を構造的に表示することができますが、高レベルのトレンドを知りたいユーザーにとっては負担になることもあります。
  • 円グラフと積み上げ棒グラフ:  これらのグラフは、全体の一部を表すセクションに分かれています。 データを整理し、各コンポーネントのサイズを比較するためのシンプルな方法を提供します。
  • 折れ線グラフと面グラフ: これらのビジュアルは、一連のデータ・ポイントの経時変化をプロットすることで1つ以上の数量の変化を示すものであり、予測分析で頻繁に使用されます。 折れ線グラフはその変化を線で表し、面積グラフはデータ・ポイントを線分で結び、変数を重ねて色で区別します。
  • ヒストグラム: このグラフは、数字の分布を棒グラフ(棒と棒の間にスペースがない)で表したもので、特定の範囲に収まるデータの量を表しています。 この図により、エンド・ユーザーは、与えられたデータセット内の外れ値を簡単に特定することができます。
  • 散布図: これらの図は2つの変数の関係性を明らかにするのに有効で、回帰データ分析によく用いられます。 しかし、バブル・チャートと混同されることがあります。バブル・チャートは、X軸、Y軸、バブルの大きさによって3つの変数を可視化するために使用されます。
  • ヒート・マップ:  これらのグラフ表示は、場所ごとの行動データを可視化するのに役立ちます。 これは、地図上の場所であったり、Webページであったりします。
  • ツリー・マップ:  階層的なデータを、入れ子状になった図形(主に長方形)のセットとして表示します。 ツリー・マップは、カテゴリー間の割合を面積の大きさで比較するのに適しています。
オープン・ソースの可視化ツール

データ可視化ツールへのアクセスがこれまでになく簡単になりました。 D3.jsのようなオープンソースのライブラリは、アナリストがデータを対話式に表現する方法を提供し、新しいデータをより多くの人に見てもらうことを可能にします。 代表的なオープン・ソースの可視化ライブラリには、以下のようなものがあります。

  • D3.js: Webブラウザー上で動的な対話式のデータ可視化を行うためのフロントエンドJavaScriptライブラリーです。D3.js (IBM外部へのリンク)は、HTML、CSS、およびSVGを使用して、どのブラウザーでも表示可能なデータの視覚的表現を作成します。 また、対話やアニメーションの機能も備えています。
  • Eチャート:  製品、研究論文、プレゼンテーションなどに、直感的で対話式、かつ高度にカスタマイズ可能なチャートを簡単に追加する方法を提供する、強力なチャート化、可視化ライブラリーです。 Eチャート (IBM外部へのリンク)は、JavaScriptと軽量なキャンバス・ライブラリーであるZRenderをベースにしています。
  • Vega: Vega (IBM外部へのリンク)は、自らを「visualization grammar」と定義し、Webからアクセス可能な大規模データ・セット全体の可視化をカスタマイズするためのサポートを提供しています。
  • deck.g: Uberのオープン・ソース可視化フレームワーク・スイートの一部です。deck.gl (IBM外部へのリンク)は、ビッグデータの 探索的データ分析(EDA) に使用されるフレームワークです。 Web上での高性能なGPUを使った可視化の構築を支援します。
データ可視化のベスト・プラクティス

多くのデータ可視化ツールが手軽に利用できるようになった一方で、効果のない情報可視化も増えてきました。 視覚的コミュニケーションは、対象者が意図したインサイトや結論に到達できるように、シンプルかつ計画的に行う必要があります。 以下のベスト・プラクティスは、あなたのデータ可視化が有用で明確であることを保証します。

背景を設定する:  この特定のデータ・ポイントが重要である理由について、対象者に一般的な背景情報を提供することが重要です。 例えば、メールの開封率が低迷している場合、業界全体と比較した開封率を示し、このマーケティング・チャネルに問題があることを示すことができます。 行動を促すためには、オーディエンスが目標やベンチマーク、その他の重要業績評価指標(KPI)など、明確なものと現在のパフォーマンスとの比較を理解する必要があります。

オーディエンスを知る: 可視化が誰を対象としたものかを考え、データ可視化が彼らのニーズに合っていることを確認します。 その人は何をしようとしているのでしょうか。 どんな質問が気になりますか。 可視化することで、彼らの不安を解消することができますか? あなたが提供するデータは、人々が自分の役割の範囲内で行動するように動機づけるためのものです。 可視化が明確かどうかわからない場合は、ターゲットとなる人々の中の1人か2人に提示してフィードバックをもらい、大規模なプレゼンテーションを行う前に追加の編集を行うことができます。

効果的なビジュアルを選択する: 特定のタイプのデータ・セットのために、特定のビジュアルがデザインされています。 例えば、散布図は2つの変数の関係をよく表し、折れ線グラフは時系列データをうまく表します。 オーディエンスが要点を理解するのに役立つビジュアルであることを確認してください。 チャートやデータがずれていると、分かりやすくするどころか、逆に聴衆を混乱させてしまいます。

単純にする:  データ可視化ツールを使えば、さまざまな情報を簡単にビジュアルに加えることができます。 ただし、できるからといって、そうすべきだという意味ではありません。 データ可視化では、ユーザーの注目を集めるために、追加する情報は慎重に判断したいものです。 例えば、棒グラフのすべてのバーにデータラベルが必要でしょうか? おそらく要点を伝えるためには、1つか2つあれば十分でしょう。 アイデアを伝えるために、さまざまな色が必要ですか? 幅広い層に受け入れられる色を使用していますか(例えば、色覚異常への配慮など)。 データ可視化では、ターゲットとなる人々の気を散らすような情報を排除し、最大限のインパクトを与えるようにデザインします。

関連ソリューション
Cognos Analytics

信頼できるWatson副操縦士がいれば、よりスマートな分析と自信に満ちた意思決定を行うことができます。

Cognos Analyticsの詳細はこちら
Planning Analytics

手動による計画の限界を乗り越えるのに役立つ、AIを活用した統合計画ソリューションです。

Planning Analyticsの詳細はこちら
IBM Watson® Studio

AIモデルを構築、実行、管理します。 オープンソース・コードやビジュアル・モデリングを使用して、任意のクラウド上でデータを準備し、モデルを構築できます。 結果の予測と最適化を行うこともできます。

IBM Watson® Studioの詳細を見る
詳細情報はこちら

市場には様々なデータビジュアライゼーションツールがありますが、Cognos AnalyticsはIBMのビジネス・インテリジェンスとデータ可視化のツールです。 Cognos Analyticsのセルフサービス・プラットフォームは、人工知能や機械学習などのコグニティブ・コンピューティング技術を統合しており、組織はデータの可視化、新しい洞察の共有、およびデータ駆動型の意思決定の促進を容易に行うことができます。

最新のIBM Cognos® Analyticsの詳細はこちら