Home
Analytics
SPSS
SPSS Statistics
Data Preparation
IBM SPSS Data Preparation utilizza tecniche avanzate per semplificare la fase di preparazione dei dati, fornendo risultati di analisi più rapidi e accurati. Scegli una procedura di preparazione dei dati automatizzata per ottenere risultati rapidi o seleziona altri metodi per preparare serie di dati più complesse. Identifica facilmente casi, variabili e valori di dati sospetti o non validi. Visualizza i pattern dei dati mancanti, riepiloga le distribuzioni delle variabili e lavora in modo più accurato con algoritmi progettati per attributi nominali.
Il modulo è incluso nell'edizione SPSS Professional per gli ambienti on-premises e nell'edizione base per i piani di abbonamento.
La finestra di dialogo Convalida dati viene utilizzata per convalidare i dati. La scheda delle variabili mostra le variabili presenti nel file. Inizia selezionando le variabili desiderate e spostandole nell'elenco Variabili di analisi.
È possibile specificare i controlli di base da applicare alle variabili e ai casi nel file. Ad esempio, è possibile ottenere report che identificano le variabili con un'alta percentuale di valori mancanti o di casi vuoti.
Applica le regole a singole variabili per identificare valori non validi, ovvero valori al di fuori di un intervallo valido, o valori mancanti. È anche possibile creare regole personalizzate e regole per più variabili o applicare regole predefinite.
La preparazione dei dati automatizzata fornisce raccomandazioni e consente agli utenti di approfondirle ed esaminarle.
La preparazione manuale dei dati è un processo lungo e complesso. Se hai bisogno di ottenere risultati rapidi, la procedura ADP può aiutarti a rilevare e correggere gli errori di qualità e ad assegnare i valori mancanti in un unico ed efficiente passaggio. La funzionalità ADP fornisce un report di facile comprensione con raccomandazioni e visualizzazioni complete per aiutarti a determinare i dati giusti da utilizzare nella tua analisi.
Esegui controlli automatici dei dati ed elimina i lunghi e noiosi controlli manuali utilizzando la procedura di convalida dei dati. Questa procedura consente di applicare regole per eseguire controlli sui dati in base al livello di misura di ciascuna variabile, sia essa categorica o continua. Quindi, consente di determinare la validità dei dati e rimuovere o correggere i casi sospetti a propria discrezione prima dell'analisi.
SPSS Data Preparation include funzionalità come la convalida dei dati, la preparazione dei dati automatizzata, l'optimal binning e l'identificazione di casi insoliti.
Con la procedura di optimal binning, è possibile utilizzare in modo più accurato algoritmi progettati per attributi nominali, come Naive Bayes e modelli logit. L'optimal binning consente di eseguire il binning o impostare punti di divisione per le variabili di scala.
Scegli uno tra i seguenti tipi di optimal binning per la pre-elaborazione dei dati prima della creazione del modello:
1) Non supervisionato: crea bin con conteggi uguali.
2) Supervisionato: considera la variabile di destinazione per determinare i punti di divisione. Questo metodo è più preciso di quello non supervisionato; tuttavia, comporta un maggiore utilizzo di calcolo.
3) Approccio ibrido: combina l'approccio supervisionato e l'approccio non supervisionato. Questo metodo è particolarmente utile se si dispone di una grande quantità di valori distinti.