チュートリアル: SPSS Statistics での分析

このチュートリアルでは、IBM® SPSS® Statistics を使用して、Db2® データベースに保管されているデータを分析する方法について説明します。

このチュートリアルのビデオ・バージョンを表示するには、ここを参照してください。

このチュートリアルでは、以下のタスクの実行方法を示します。

  • SPSS Statistics へのデータベースの接続。
  • 分析の準備。
  • データの分析。

所要時間

5 分

シナリオ

あなたは、スポーツ用品メーカーのデータ・サイエンティストです。このスポーツ用品メーカーの製品を販売している店舗がどこにあるかを確認します。このシナリオでは、Db2 データベースに既にロードされているサンプル・データを使用します。

難易度

初級

対象読者

データ・サイエンティスト

分析の準備

このタスクについて

データベース接続を正常に確立した後、正しいデータを識別してそれを構造化することによって、分析の準備を開始できます。以下のステップに従って、データを分析用に準備します。

手順

  1. 「データベース ウィザード」で、「次へ」をクリックして、データベース内の表のリストを表示します。
  2. 以下のステップに従って、小売業者の店舗ごとに別個のエントリーを取得します。
    1. 「使用可能なテーブル」リストから「GOSALESRT.RETAILER_SITE」を選択します。
    2. 「GOSALESRT.RETAILER_SITE」を展開します。
    3. 「RETAILER_SITE_CODE」を選択します。
    4. 右矢印のボタンをクリックして、「RETAILER_SITE_CODE」「読み込むフィールドの順序」リストに移動します。
  3. 以下のステップに従って、小売業者が存在する国を確認します。
    1. 「使用可能なテーブル」リストから「GOSALES.COUNTRY」を選択します。
    2. 「GOSALES.COUNTRY」を展開します。
    3. 「COUNTRY_EN」を選択します。
    4. 右矢印のボタンをクリックして、「COUNTRY_EN」「読み込むフィールドの順序」リストに移動します。
  4. 以下のステップに従って、共通の列で GOSALESRT.RETAILER_SITE と GOSALES.COUNTRY を結合します。
    1. 「次へ」をクリックして、「データベース ウィザード」「リレーションシップの指定」ページを開きます。
    2. 「GOSALES.COUNTRY」リストから「COUNTRY CODE」を選択します。
    3. 「GOSALESRT.RETAILER_SITE」リストから「RTL COUNTRY CODE」を選択します。
    4. 「結合型」リストから「内部 (Inner)」を選択します。
    5. 「結合」をクリックします。
  5. 「完了」をクリックして、小売業者店舗ごとの別個のエントリーとその小売業者店舗がある国を含む表を作成します。

データの分析

最後に、データを分析して、分析の結果を視覚化します。次の手順を実行します。

手順

  1. 「IBM SPSS Statistics データ エディタ (IBM SPSS Statistics Data Editor)」で、「分析」 > 「記述統計」 > 「度数分布表」をクリックして、「度数分布表」ウィンドウを開きます。
  2. 「度数分布表」ウィンドウで、各国における小売業者店舗数をカウントするため、「COUNTRY_EN」を選択します。
  3. 右矢印のボタンをクリックして、「COUNTRY_EN」「変数」リストに移動します。
  4. 「図表」をクリックして、「度数分布表: 図表の設定」ウィンドウを開きます。
  5. 「度数分布表: 図表の設定」ウィンドウの「グラフの種類」セクションで、「棒グラフ」をクリックして、結果を棒グラフに視覚化します。
  6. 「続行」をクリックして、選択内容を確認します。
  7. 「度数分布表」ウィンドウで、「OK」をクリックして、データを分析します。

    分析の結果は、「IBM SPSS Statistics ビューア (IBM SPSS Statistics Viewer)」ウィンドウに表示されます。「IBM SPSS Statistics ビューア (IBM SPSS Statistics Viewer)」ウィンドウには、さまざまな国の小売業者店舗の分布を示す表が含まれます。この表には、合計数とパーセンテージが示されます。

    表 1. 出力表
      (国) 度数分布 パーセント 有効パーセント 累積パーセント
    有効 オーストラリア 20 2.5 2.5 2.4
      オーストリア 25 3.0 3.0 5.3
      ベルギー 20 2.4 2.4 7.7
      ブラジル 16 1.9 1.9 9.6
      カナダ 56 6.6 6.6 16.2
      中華人民共和国 35 4.1 4.1 20.3
      デンマーク 17 2.0 2.0 22.3
      フィンランド 19 2.2 2.2 24.6
      フランス 64 7.6 7.6 32.1
      ドイツ 61 7.2 7.2 39.3
      イタリア 30 3.5 3.5 42.9
      日本 66 7.8 7.8 50.6
      韓国 20 2.4 2.4 53.0
      メキシコ 17 2.0 2.0 55.0
      オランダ 33 3.9 3.9 58.9
      シンガポール 28 3.3 3.3 62.2
      スペイン 21 2.5 2.5 64.7
      スウェーデン 26 3.1 3.1 67.8
      スイス 35 4.1 4.1 71.9
      英国 57 6.7 6.7 78.6
      米国 181 21.4 21.4 100
      合計 847 100 100  
    注: 実際の SPSS 出力表のレイアウトは、ここで示されているものとは少し異なります。ここに示されている出力は、読みやすくするために再フォーマットしたものです。

    「IBM SPSS Statistics ビューア (IBM SPSS Statistics Viewer)」ウィンドウには、結果を視覚化した棒グラフも含まれます。この棒グラフは、ほとんどの小売業者店舗が米国に存在することを示しています。

    結果の棒グラフ

チュートリアルのまとめ

「データベース ウィザード」で ODBC 接続を追加して、データベースを SPSS Statistics に接続します。Db2「接続情報」ページの「ODBC データ・ソース名 (DSN) の設定」セクションに、ODBC 接続を確立するために必要な情報が含まれています。分析を準備するため、「データベース ウィザード」「使用可能なテーブル」リストから必要な情報を含む表および列を選択します。「リレーションシップの指定」ページを使用して、分析の基本となる表を作成します。例えば、共通列で表を結合できます。特定の基準に一致する項目数をカウントして、その結果を視覚化するには、「度数分布表」ウィンドウを使用します。