Funzione in evidenza

Scheda Variables

La finestra di dialogo Validate Data viene utilizzata per convalidare i dati. La scheda Variables mostra le variabili personali. Iniziare selezionando le variabili desiderate e spostandole sull'elenco Analysis Variables.

Controlli base

È possibile specificare i controlli base da applicare alle variabili e ai casi personali. Ad esempio, è possibile ottenere report che identificano le variabili con un'elevata percentuale di valori mancanti o casi vuoti.

Regole standard e personalizzate

Applicare le regole alle singole variabili che identificano i valori non validi– i valori che non rientrano in un range valido o i valori mancanti. Inoltre è possibile creare delle regole personalizzate, regole tra variabili e applicare quelle predefinite.

Raccomandazioni

La preparazione automatizzata dei dati offre dei suggerimenti e consente agli utenti di provare ed esaminare i suggerimenti.

Preparare i dati in un unico passaggio – automaticamente

La preparazione manuale dei dati è un processo lungo e complesso. Se hai bisogno di risultati rapidi, la procedura ADP ti consente di rilevare e correggere gli errori di qualità e di attribuire i valori mancanti con un passaggio efficiente. La funzione ADP offre un report facile da comprendere con visualizzazioni e suggerimenti completi per determinare i giusti dati da utilizzare nell'analisi.

Opzioni aggiuntive per la preparazione dei dati

Eseguire i controlli dei dati automatici ed eliminare i noiosi e lunghi controlli manuali utilizzando la procedura di convalida dei dati. Questa procedura ti consente di applicare le regole per eseguire i controlli dei dati in base al livello di misura di ogni variabile (categorico o continuo). Quindi, determinare la validità dei dati e rimuovere o correggere i casi sospetti a propria discrezione prima dell'analisi.

Binning o impostazione dei limiti per le variabili di scala

Con la procedura di binning ottimizzata, è possibile usare in modo più accurato gli algoritmi progettati per gli attributi nominali (come modelli logit e Naive Bayes). Il binning ottimale consente di associare valori binari – o impostare limiti alle – variabili di scala.

Selezionare dai tre tipi di binning ottimale

Scegliere uno di questi tipi di binning ottimale per l'elaborazione dei dati prima di creare il modello. 1) Non supervisionato: creare valori binari con conteggi uguali. 2) Supervisionato: tenere in considerazione la variabile di destinazione per determinare i limiti. Questo metodo è più accurato rispetto a quello non supervisionato: tuttavia, risulta anche più complesso dal punto di vista dell'elaborazione. 3) Approccio ibrido: combina l'approccio supervisionato e quello non supervisionato. Questo metodo è particolarmente utile in presenza di numerosi valori distinti.

Dettagli tecnici

Requisiti software

IBM SPSS Data Preparation richiede una licenza IBM SPSS Statistics Base valida.

  • Prerequisito: IBM SPSS Statistics

Requisiti hardware

  • Processore: 2 GHz o più veloce
  • Display: 1024*768 o superiore
  • Memoria: 4 GB di RAM richiesto, 8 GB di RAM o più consigliato
  • Spazio su disco: 2 GB o più

Scopri come funziona