スポットライト

「変数」タブ

「データの検証」ダイアログは、データを検証するために使用されます。「変数」タブには、ファイル内の変数が表示されます。最初に目的の変数を選択して、「分析変数」リストに移動します。

基本的なチェック

ファイル内の変数とケースに適用する基本的なチェックを指定できます。例えば、欠損値や空のケースの割合が高い変数を示すレポートを取得できます。

標準とカスタムの規則

有効な範囲の外にある値や欠損値など、無効値を示す個々の変数に規則を適用します。独自の規則や変数間共通の規則を作成し、定義済みの規則を適用できます。

推奨

データの自動準備では推奨事項が示され、推奨事項を詳しく調べて検討できます。

1ステップでデータを自動的に準備

手作業のデータ準備は複雑で時間を要します。短時間で結果を得る必要がある場合、ADP手順により、効率的な1ステップで質的エラーを検出、修正し、欠損値を補完することができます。ADP機能は、包括的な推奨事項を示す、視覚に訴える分かりやすいレポートを表示して、分析で使用する適切なデータを決定できるようにします。

データ準備のその他のオプション

データの自動チェックを実行して、データ検証手順により、時間のかかる面倒な手作業のチェックをなくします。この手順により、各変数の尺度基準(カテゴリー型または連続型)に基づいてデータ検証規則を適用できます。その後、データの妥当性を判断して、分析前に自分の判断で疑わしいケースを除去または修正できます。

尺度変数のビン分割または分割点の設定

最適なビン分割手順により、名義属性(Naive Bayesやロジット・モデルなど)のために設計されたアルゴリズムをより正確に使用できます。最適なカテゴリー(ビン)により、尺度変数をビン分割し、分割点を設定することができます。

3つのタイプの最適なビン分割から選択

モデル構築のためのデータの前処理として、3種類の最適なビン分割から選択できます:1) 非監視: 等しい数のビンを作成します。2) 監視: 分割点を決定するためにターゲット変数を考慮に入れます。この方式は非監視よりも正確ですが、計算集約型です。3) ハイブリッド・アプローチ: 非監視と監視のアプローチを結合します。この方法は、特に離散値が多数である場合に役立ちます。

技術的詳細

ソフトウェア要件

IBM SPSS Data Preparationには、有効なIBM SPSS Statistics Baseのライセンスが必要です。

  • 前提条件: IBM SPSS Statistics

ハードウェア要件

  • プロセッサー: 2GHz以上
  • モニター: 1024*768以上
  • メモリー: 4GBのRAMが必要、8GB以上のRAMを推奨
  • ディスク容量: 2GB以上

仕組みを見る

購入・お問い合わせ