My IBM ログイン ニュースレター
データの可視化とは

データの可視化とは

データの可視化とは、チャートやプロット、インフォグラフィックなどの一般的な画像、さらにアニメーションを使用してデータをわかりやすく表現することです。本ページではデータ可視化の意味や例、ツールの紹介をします。これらの視覚的な情報表示により、複雑なデータ関係とデータ駆動型の洞察がわかりやすい方法で伝えられます。

データの可視化はさまざまな目的に利用でき、データチームだけが使用できるわけではないことに注意するのが重要です。経営陣も組織構造と階層を伝えるために活用し、データアナリストやデータサイエンティストもパターンと傾向の発見や説明のために利用します。Harvard Business Review(ibm.com外部へのリンク)では、データの可視化を、アイデアの生成、アイデアの例示、視覚的な発見、日常的なデータの可視化という4つの主な目的に分類しています。以下でこれらについてさらに詳しく説明します。

アイデアの生成

データの可視化は、チーム全体でアイデアの生成を促進するためによく使用されます。これは、プロジェクト開始時のブレインストーミングやデザイン思考セッション中に頻繁に活用され、さまざまな視点の収集をサポートし、集団の共通の懸念事項を浮き彫りにします。こうした可視化は通常、磨きがかけられ洗練されたものではありませんが、プロジェクト内で基盤を確立し、主要な利害関係者のために対処しようとしている問題に関してチームが足並みを揃えられるようになります。

アイデアの例示

データの可視化は、施策やプロセスなどのアイデアを伝えるのに役立ちます。チュートリアル、認定コース、センター・オブ・エクセレンスなどの学習環境でよく使用されますが、組織の構造やプロセスを表すためにも使用でき、特定のタスクに適した個人間のコミュニケーションを促進します。プロジェクト・マネージャーは、ワークフローを示すためにガント・チャートやウォーターフォール・チャートを頻繁に使用します。データ・モデリングでは、抽象化を使用して企業の情報システム内のデータ・フローを表し、理解を深めます。これにより、開発者、ビジネス・アナリスト、Data Architect などがデータベースやデータ・ウェアハウス内の関係を理解しやすくなります。

視覚的な発見

視覚的な発見と日常的なデータの可視化は、データチームとより密接に関連しています。視覚的な発見は、データアナリストやデータサイエンティストその他のデータ専門家がデータ・セット内のパターンや傾向を特定するのに役立つのに対し、日常的なデータの可視化は、新しい洞察が見つかった後のストーリーテリングをサポートします。

データの可視化

データの可視化はデータサイエンス・プロセスにおいて、重要なステップであり、チームや個人が同僚や意思決定者により効果的にデータを伝えることに貢献します。レポート・システムを管理するチームは通常、定義済みのテンプレート・ビューを活用してパフォーマンスを監視します。ただし、データの可視化はパフォーマンス・ダッシュボードに限定されません。例えば、テキスト・マイニング中に、アナリストがワードクラウドを使用して、非構造化データ内の主要な概念や傾向、隠れた関係を把握するかもしれません。あるいは、グラフ構造を利用してナレッジ・グラフ内のエンティティー間の関係を例示することもあるでしょう。さまざまな種類のデータを表現する方法は数多くあり、これはコア分析チームの枠を超えて拡張すべきスキルセットであることを覚えておくことが重要です。

データの可視化のタイプ

データの可視化のタイプ

データの可視化の最も初期の形態は、主に航海を支援するために使用されていた17世紀以前のエジプト人にまでさかのぼります。時代が進むにつれて、人々は経済・社会・健康分野などのより広範な用途にデータの可視化を使用するようになりました。おそらく最も注目すべきなのは、Edward Tufte氏の『The Visual Display of Quantitative Information(定量情報の視覚的表示)』(ibm.com外部へのリンク)が出版されたことです。同書では、個人がデータの可視化を利用して、より効果的な方法でデータを提示できることが例示されています。企業がパフォーマンス指標をリアルタイムで報告するためにダッシュボードに頼るようになった今の時代にも、この著書は色褪せることなく有用な情報を提供してくれます。ダッシュボードは、複数のデータ・ソースからのデータを追跡・視覚化するための効果的なデータの可視化ツールであり、チームまたは隣接チームによる特定の行動がパフォーマンスに及ぼす影響を可視化します。ダッシュボードには、次のような一般的な視覚化手法が含まれます。

  • 表: これは、変数の比較に使用される行と列で構成されます。表は、構造化された方法で大量の情報を表示できますが、それは単に大まかな傾向を探しているだけのユーザーを途方に暮れさせてしまう可能性もあります。
 
  • 円グラフと積み上げ棒グラフ: これらのグラフは、全体の一部を表すセクションに分かれています。データを整理し、各コンポーネントのサイズを比較するシンプルな方法を提供します。
 
  • 折れ線グラフと面グラフ: これらのグラフは、時系列に一連のデータ・ポイントを配置することで、1つまたは複数の量の変化を示すもので、予測分析で頻繁に使用されます。 折れ線グラフは線を使ってこれらの変化を示します。一方、面グラフはデータ・ポイントを線分で結び、変数を積み上げ、色を使って変数を区別します。
 
  • ヒストグラム: 棒グラフを使って数値の分布を配置するグラフ(棒の間にスペースは入れない)で、特定の範囲に含まれるデータ量を表します。これにより、ユーザーは特定のデータ・セット内の外れ値を簡単に特定できます。
 
  • 散布図: 2つの変数の関係を明確に場合に役立ち、回帰データ分析で一般的に使用されます。この図はX軸とY軸および円のサイズによって3つの変数を視覚化するために使用されるバブル・チャートと混同されることがあります。
 
  • ヒート・マップ: 行動データを場所ごとに視覚化する際に役立つグラフ表示です。これは、地図上の場所やWebページである場合もあります。
 
  • ツリーマップ: 階層化されたデータを、入れ子状の図形(通常は長方形)の集合として表示します。ツリーマップは、エリアの大きさによってカテゴリー間の比率を比較する場合に適しています。
 
オープンソースの可視化ツール

オープンソースの可視化ツール

データの可視化ツールへのアクセスは、かつてないほど容易になりました。D3.jsなどのオープンソース・ライブラリーは、アナリストのためにインタラクティブなデータ提示方法を提供し、これによりさらに幅広い対象者に新しいデータを提供できるようにします。最も人気のあるオープンソースの視覚化ライブラリーには、次のようなものがあります。

  • D3.js: Webブラウザー上でダイナミックでインタラクティブなデータの可視化を生成するためのフロントエンドJavaScriptライブラリーです。D3.js(ibm.com外部へのリンク)は、HTMLやCSS、SVGを使用して、任意のブラウザーで表示できるデータの視覚的表現を作成します。また、インタラクションとアニメーション用の機能も備わっています。
 
  • ECharts: 直感的かつインタラクティブで高度にカスタマイズ可能なチャートを製品や研究論文、プレゼンテーションなどに簡単に追加できる強力なチャート作成・視覚化ライブラリーです。Echarts(ibm.com外部へのリンク)は、JavaScriptと軽量のキャンバス・ライブラリーであるZRenderをベースにしています。
 
  • Vega: Vega(ibm.com外部へのリンク)は、自らを「可視化文法」と定義し、Webからアクセス可能な大規模なデータ・セット全体における可視化カスタマイズのためのサポートを提供します。
 
  • deck.gl: Uberのオープン・ソース可視化フレームワーク・スイートの一部です。deck.gl (リンクは ibm.com 外部にあります) は、ビッグ・データの探索的データ分析 に使用されるフレームワークです。Web上でGPUを活用した高性能な可視化を構築するのに役立ちます。
 
データの可視化のベスト・プラクティス

データの可視化のベスト・プラクティス

利用可能なデータの可視化ツールが非常に多くなったことで、非効率な情報の可視化も増加しています。データの可視化により、対象者が意図した知見や結論に確実に到達できるように、ビジュアル・コミュニケーションはシンプルかつ慎重に行う必要があります。次のいくつかのベスト・プラクティスは、データの可視化を有用で明瞭なものにすることに役立ちます。

コンテキストを設定する: 特定のデータ・ポイントが重要な理由を相手に理解してもらうには、一般的な背景情報を提供することが重要です。例えば、Eメールの開封率が低迷しているときに、その企業の開封率を業界全体と比較して図示し、その企業には特定のマーケティング・チャネル内に問題があることを示したいとします。是正措置を進めるには、現在のパフォーマンスが目標やベンチマークその他の重要業績評価指標(KPI)などと具体的に比較してどのような状況であるのかを対象者が理解する必要があります。

対象者を知る: 可視化が誰のためのものであるのかを考え、データの可視化がそのニーズに適しているかを検討します。対象となる人が達成しようとしているのは何か。どのような質問に関心を持っているのか。可視化は彼らの懸念に応えるものか。提供するデータが、対象となる人たちが役割の範囲内で、行動を起こしたいという動機を与えるものにする必要があります。可視化されたデータが明瞭であるかはっきりしない場合は、対象者の幾人かにデータを提示し、フィードバックを得るようにしましょう。それにより、大規模なプレゼンテーションの前に編集を行えます。

効果的なビジュアルを選ぶ: 特定のビジュアルは、特定のタイプのデータ・セット向けに設計されています。例えば、散布図は2つの変数間の関係を表示するのに適しており、折れ線グラフは時系列データを表示するのに適しています。ビジュアルが実際に、対象者にとって要点の理解に役立つようにしましょう。グラフとデータの関係が適切でないと、明瞭になるどころか、対象者を混乱させる可能性があります。

シンプルさを保つ: データの可視化ツールを使用すると、ビジュアルにあらゆる種類の情報を簡単に追加できます。ただし、「できる」ということは「そうすべき」という意味ではありません。データの可視化においては、ユーザーの注意を引くために追加する追加情報については、慎重に検討する必要があります。例えば、棒グラフのすべての棒にデータ・ラベルが必要でしょうか。おそらく、要点を例示するには1つか2つだけで十分でしょう。アイデアを伝えるためにカラフルである必要があるでしょうか。幅広い対象者が利用できる色を使用していますか(例えば、色盲の読者を考慮に入れているか)。対象者の注意をそらす可能性のある情報を排除することで、最大限の効果が得られるようにデータの可視化を設計しましょう。

関連ソリューション

関連ソリューション

Planning Analytics

AIを導入した統合計画ソリューション:これにより、手動による計画の限界を超えることができます。

Planning Analyticsはこちら
IBM Watson Studio

AIモデルの構築、実行、管理を行います。オープンソースコードまたはビジュアルモデリングを使用して、任意のクラウド上でデータを準備し、モデルを構築し、さらに結果を予測して最適化します。

IBM Watson Studioの詳細はこちら
データと分析コンサルティング

企業データの価値を解き放ち、ビジネス上の優位性をもたらす知見に根差した組織を構築できるよう、IBMコンサルティングが支援します。

データと分析コンサルティング
Cognos Analytics

信頼できるWatson副操縦士が、よりスマートな分析と自信に満ちた意思決定を行えるよう支援します。

Cognos Analyticsの詳細はこちら
IBM SPSS Statistics

IBM SPSS Statisticsは、強力な統計ソフトウェア・プラットフォームです。使いやすいインターフェースと信頼性の高い機能により、データから実用的な洞察を迅速に導き出します。

IBM SPSS Statisticsの詳細はこちら
次のステップ

AIを活用した柔軟な予測機能を通じて、「what-if」シナリオをリアルタイムで分析します。IBM Planning Analyticsは、未加工データをアクションにつながるインサイトに変換する、統合ビジネス・プランニング・ソリューションです必要に応じて、オンプレミスまたはクラウドに展開できます。

Planning Analyticsはこちら デモの予約