Co to jest IBM SPSS Data Preparation?

IBM® SPSS® Data Preparation wykonuje zaawansowane operacje techniczne w celu usprawnienia etapu przygotowania danych — szybciej dostarczając dokładniejsze wyniki analizy danych. Wybierz procedurę automatycznego przygotowania danych dla szybkiego wyniku lub inne metody w celu przygotowania bardziej wymagających zestawów danych. Łatwa identyfikacja podejrzanych lub niepoprawnych obserwacji, zmiennych i wartości danych. Wyświetlanie wzorców brakujących danych, sumowanie rozkładów zmiennych i dokładniejsze prace z algorytmami zaprojektowanymi dla atrybutów nominalnych.

Moduł ten jest dołączony do edycji SPSS Professional dla wdrożeń lokalnych, oraz do wersji Base dla planów subskrypcji.

Wyróżnione cechy i funkcje

Karta Zmienne

Okno dialogowe Walidacja danych służy do sprawdzania poprawności danych. Karta Zmienne pokazuje zmienne w pliku. Zacznij od zaznaczenia wybranych zmiennych i przeniesienia ich na listę analizowanych zmiennych.

Sprawdzenia podstawowe

Możesz zdefiniować sprawdzenia podstawowe, które mają być stosowane dla zmiennych i obserwacji w pliku. Przykładowo, możesz uzyskać raporty, które identyfikują zmienne z dużym odsetkiem brakujących wartości lub pustych obserwacji.

Reguły standardowe i niestandardowe

Zastosuj reguły do poszczególnych zmiennych, które identyfikują niepoprawne wartości — wartości spoza poprawnego zakresu lub brakujące. Możliwe jest też tworzenie własnych reguł, w tym reguł wielu zmiennych, a także stosowanie reguł predefiniowanych.

Rekomendacje

W procesie zautomatyzowanego przygotowania danych użytkownikowi udostępniane są rekomendacje do analizy i wypróbowania.

Przygotuj dane jednym ruchem — automatycznie

Ręczne przygotowanie danych to proces złożony i czasochłonny. Kiedy nie można czekać na wyniki, zautomatyzowane przygotowanie danych pozwala wykryć i poprawić błędy wpływające na jakość i podstawić brakujące wartości w jednym kroku. Funkcja zautomatyzowanego przygotowania danych udostępnia przejrzyste raporty z kompleksowymi rekomendacjami i wizualizacjami, które pozwalają określić, jakie dane będą potrzebne do przeprowadzenia analizy.

Dodatkowe opcje w procesie przygotowania danych

Automatyczne kontrole danych pozwalają wyeliminować konieczność czasochłonnego i żmudnego sprawdzania ręcznego, dzięki procedurze walidacji danych. Ta procedura umożliwia zastosowanie reguł w celu sprawdzenia danych na podstawie poziomu miary każdej zmiennej — jakościowej lub ilościowej. Dzięki temu można określić poprawność danych i swobodnie usunąć lub poprawić podejrzane obserwacje jeszcze przed przystąpieniem do analizy.

Bogaty zestaw funkcji

SPSS Data Preparation obejmuje funkcje takie jak: sprawdzanie poprawności danych, automatyczne przygotowanie danych, optymalne kategoryzowanie i identyfikację nietypowych obserwacji.

Kategoryzowanie zmiennych ilościowych i ustawianie dla nich punktów podziału

Dzięki optymalnej procedurze kategoryzacji można precyzyjniej korzystać z algorytmów zaprojektowanych dla atrybutów nominalnych, takich jak modele Naive Bayes i logit. Optymalna kategoryzacja umożliwia kategoryzowanie — lub ustawianie punktów podziału — dla zmiennych ilościowych.

Do wyboru są trzy typy kategoryzacji optymalnej

Przed zbudowaniem modelu należy wybrać jeden z następujących typów optymalnej kategoryzacji dla danych wstępnego przetwarzania: 1) Nienadzorowany: twórz kategoryzacje z równą liczebnością.
2) Nadzorowany: uwzględnij zmienną docelową do określenia punktów podziału. Metoda ta jest dokładniejsza niż nienadzorowana; jest też jednak bardziej intensywna obliczeniowo.
3) Podejście hybrydowe: połączenie podejść nienadzorowanych i nadzorowanych. Ta metoda jest szczególnie przydatna, jeśli istnieje duża liczba odrębnych wartości.

Ilustracje przedstawiające produkt

Szczegóły techniczne

Jak kupić SPSS Data Preparation

  • Wdrożenia lokalne: Zakup edycji Professional
  • Modele subskrypcji: Zakup edycji Base

Wymagania sprzętowe

  • Procesor: 2 GHz lub szybszy
  • Wyświetlacz: 1024 x 768 pikseli lub więcej
  • Pamięć: min. 4 GB pamięci RAM, zalecane co najmniej 8 GB pamięci RAM
  • Miejsce na dysku: 2 GB lub więcej

Next Steps

Wypróbuj SPSS Statistics bezpłatnie

Kup teraz i postaw pierwszy krok już dziś