Wyróżnione funkcje

Karta Zmienne

Okno dialogowe Walidacja danych służy do sprawdzania poprawności danych. Karta Zmienne pokazuje zmienne w pliku. Zacznij od zaznaczenia wybranych zmiennych i przeniesienia ich na listę analizowanych zmiennych.

Sprawdzenia podstawowe

Możesz zdefiniować sprawdzenia podstawowe, które mają być stosowane dla zmiennych i obserwacji w pliku. Przykładowo, można uzyskać raporty, które identyfikują zmienne z dużym odsetkiem brakujących wartości lub pustych obserwacji.

Reguły standardowe i niestandardowe

Reguły można stosować do poszczególnych zmiennych, tak by określały wartości nieprawidłowe — wartości spoza poprawnego zakresu lub brakujące. Możliwe jest też tworzenie własnych reguł, w tym reguł wielu zmiennych, a także stosowanie reguł predefiniowanych.

Rekomendacje

W procesie zautomatyzowanego przygotowania danych użytkownikowi udostępniane są rekomendacje, które może przeanalizować i wypróbować.

Jednoetapowe (automatyczne) przygotowanie danych

Ręczne przygotowanie danych to proces złożony i czasochłonny. Kiedy na wyniki nie można czekać, zautomatyzowane przygotowanie danych pozwala wykryć i poprawić błędy wpływające na jakość i podstawić brakujące wartości w jednym kroku. Funkcja zautomatyzowanego przygotowania danych udostępnia przejrzyste raporty z kompleksowymi rekomendacjami i wizualizacjami, które pozwalają określić, jakie dane będą potrzebne do przeprowadzenia analizy.

Dodatkowe opcje w procesie przygotowania danych

Automatyczne kontrole danych pozwalają wyeliminować konieczność czasochłonnego i żmudnego sprawdzania ręcznego dzięki procedurze walidacji danych. Ta procedura umożliwia zastosowanie reguł, które pozwalają na przeprowadzenie kontroli danych w oparciu o poziom pomiaru każdej zmiennej (jakościowej lub ciągłej). Dzięki temu można określić poprawność danych i swobodnie usunąć lub poprawić podejrzane obserwacje jeszcze przed przystąpieniem do analizy.

Kategoryzowanie zmiennych ilościowych i ustawianie dla nich punktów podziału

Dzięki procedurze kategoryzacji optymalnej można w bardziej precyzyjny sposób stosować algorytmy operujące na atrybutach nominalnych (np. naiwnego klasyfikatora bayesowskiego i modeli logitowych). Kategoryzacja optymalna pozwala grupować zmienne ilościowe i ustawiać dla nich punkty podziału.

Do wyboru są trzy typy kategoryzacji optymalnej

Przed przystąpieniem do budowy modelu można wybrać jeden z typów kategoryzacji optymalnej i przeprowadzić wstępne przetwarzanie danych. 1) Typ nienadzorowany: Utwórz kategorie o takiej samej liczebności. 2) Typ nadzorowany: Określ punkty podziału w oparciu o zmienną docelową. To metoda dokładniejsza od nienadzorowanej, jest jednak bardziej intensywna obliczeniowo. 3) Typ hybrydowy: Łączy cechy rozwiązania nienadzorowanego i nadzorowanego. Ta metoda sprawdza się zwłaszcza w wypadku dużej liczby odrębnych wartości.

Szczegóły techniczne

Wymagania dotyczące oprogramowania

IBM SPSS Data Preparation wymaga ważnej licencji dla IBM SPSS Statistics Base.

  • Wymaganie wstępne: IBM SPSS Statistics

Wymagania sprzętowe

  • Procesor: 2 GHz lub szybszy
  • Rozdzielczość wyświetlacza: 1024 na 768 lub wyższa
  • Pamięć RAM: minimum 4 GB, zalecane 8 GB lub więcej
  • Miejsce na dysku: 2 GB lub więcej

Zobacz, jak to działa

Kup teraz i postaw pierwszy krok