Scopri tutto quello che hai bisogno di sapere sull'analisi esplorativa dei dati, un metodo utilizzato per analizzare e riepilogare i set di dati.
L'analisi esplorativa dei dati è utilizzata dai data scientist per analizzare e investigare i set di dati e riassumere le loro caratteristiche principali, spesso utilizzando metodi di visualizzazione dei dati. Aiuta a determinare il modo migliore per utilizzare le origini dati per ottenere le risposte di cui hai bisogno, rendendo più facile per i data scientist scoprire modelli, individuare anomalie, testare un'ipotesi o controllare i presupposti.
L'analisi esplorativa dei dati viene utilizzata principalmente per vedere cosa i dati possono rivelare al di là delle attività di modellazione formale o di test delle ipotesi e fornisce una migliore comprensione delle variabili dei set di dati e delle relazioni tra loro. Può anche aiutare a determinare se le tecniche statistiche che stai prendendo in considerazione per l'analisi dei dati sono appropriate. Originariamente sviluppato dal matematico americano John Tukey negli anni '70, le tecniche di analisi esplorativa dei dati continuano ad essere un metodo ampiamente utilizzato nel processo di rilevamento oggi.
Lo scopo principale dell'analisi esplorativa dei dati è quello di aiutare a guardare i dati prima di fare qualsiasi ipotesi. Può aiutare a identificare errori evidenti, nonché a comprendere meglio i modelli all'interno dei dati, rilevare valori o eventi anomali e trovare relazioni interessanti tra le variabili.
I data scientist possono usare l'analisi esplorativa per assicurarsi che i risultati che producono siano validi e applicabili a qualsiasi risultato e obiettivo aziendale desiderato. L'analisi esplorativa dei dati aiuta anche le parti interessate dando loro la conferma che stanno facendo le domande giuste. L'analisi esplorativa dei dati può aiutare a rispondere alle domande sulle deviazioni standard, le variabili categoriali e gli intervalli di confidenza. Dopo che l'analisi esplorativa dei dati è stata completata e gli insight sono stati ricavati, le sue funzioni possono essere utilizzate per analisi dei dati più sofisticate o per la modellazione, compreso il machine learning.
Le funzioni e le tecniche statistiche specifiche che si possono eseguire con gli strumenti di analisi esplorativa dei dati includono:
Esistono quattro tipi primari di analisi esplorativa dei dati:
Altri tipi comuni di grafici multivariati includono:
Alcuni degli strumenti di data science più comuni utilizzati per creare un'analisi esplorativa dei dati includono:
Per un'analisi approfondita delle differenze tra questi approcci, consulta "Confronto tra Python e R: qual è la differenza?"
Utilizza IBM® Watson Studio per determinare se le tecniche statistiche che stai prendendo in considerazione per l'analisi dei dati sono appropriate.