IBM SPSS Data Preparationとは?

IBM® SPSS® Data Preparationでは、データ準備段階を合理化する高度な手法を使用して、短時間でより精度の高いデータ分析結果を得ることができます。 分析担当者は、完全に自動化されたデータ準備手続きを選択してすぐに結果を得ることも、別の方法を選択してより難易度の高いデータ・セットを準備することもできます。 このソフトウェアを使用すると、疑わしい、または無効なケース、変数、およびデータ値を簡単に特定できます。 また、欠損データのパターンの表示や変数分布の要約、および名義型属性用に設計されたアルゴリズムのより正確な操作が可能です。

このモジュールは、オンプレミス向けのSPSS Professionalエディション、およびサブスクリプション・プランのBaseエディションに含まれています。

主要な機能

「変数」タブ

「データの検証」ダイアログは、データを検証するために使用されます。「変数」タブには、ファイル内の変数が表示されます。最初に目的の変数を選択して、「分析変数」リストに移動します。

基本的なチェック

ファイル内の変数とケースに適用する基本的なチェックを指定できます。例えば、欠損値や空のケースの割合が高い変数を示すレポートを取得できます。

標準とカスタムの規則

有効な範囲の外にある値や欠損値など、無効値を示す個々の変数に規則を適用します。 独自の規則や変数間共通の規則を作成し、定義済みの規則を適用できます。

推奨事項

データの自動準備では推奨事項が示され、推奨事項を詳しく調べて検討できます。

1ステップでデータを自動的に準備

手作業のデータ準備は複雑で時間を要します。短時間で結果を得る必要がある場合、ADP手順により、効率的な1ステップで質的エラーを検出、修正し、欠損値を補完することができます。ADP機能は、包括的な推奨事項を示す、視覚に訴える分かりやすいレポートを表示して、分析で使用する適切なデータを決定できるようにします。

データ準備のその他のオプション

データの自動チェックを実行して、データ検証手順により、時間のかかる面倒な手作業のチェックをなくします。この手順により、各変数の尺度基準(カテゴリー型または連続型)に基づいてデータ検証規則を適用できます。 その後、データの妥当性を判断して、分析前に自分の判断で疑わしいケースを除去または修正できます。

さまざまな機能へのアクセス

SPSS Data Preparationには、データ検証、自動化されたデータ準備、最適なビン分割、異常なケースの特定といった機能が含まれています。

尺度変数のビン分割または分割点の設定

最適なビン分割手順により、名義属性(Naive Bayesやロジット・モデルなど)のために設計されたアルゴリズムをより正確に使用できます。 最適なカテゴリー(ビン)により、尺度変数をビン分割し、分割点を設定することができます。

3つのタイプの最適なビン分割から選択

モデル作成の前に、プリプロセッシング・データ用にこれらのタイプの最適なビン分割手順から1つを選択します:1)教師なし: カウントが等しいビンを作成します。
2)教師あり: ターゲット変数を考慮に入れて、分割点を決定します。 この手法は「教師なし」よりも正確ですが、より多くの計算を必要とします。
3)ハイブリッド・アプローチ: 「教師なし」と「教師あり」のアプローチを組み合わせます。 この手法は、特殊値が大量にある場合に特に役立ちます。

製品イメージ

技術的詳細

SPSS Data Preparationの購入方法

  • オンプレミス: Professionalエディションの購入
  • サブスクリプション・プランの場合: Baseエディションの購入

ハードウェア要件

  • プロセッサー: 2 GHz以上
  • モニター: 1024*768以上
  • メモリー: 4 GBのRAMが必要、8 GB以上のRAMを推奨
  • ディスク・スペース: 2GB以上

Next Steps

SPSS Statisticsを無料で試す

今すぐ購入して始めましょう