Węzeł źródłowy programu Excel
Węzeł źródłowy programu Excel umożliwia importowanie danych z programu Microsoft Excel w formacie pliku .xlsx.
Typ pliku. Należy wybrać typ pliku Excel, jaki ma zostać zaimportowany.
Importuj Plik. Określa nazwę i lokalizację pliku arkusza do zaimportowania.
Użyj nazwanego zakresu komórek. Umożliwia określenie nazwanego zakresu komórek, zgodnie z definicją w arkuszu Excel. Należy kliknąć przycisk wielokropka (...). Pozwoli to wybrać dostępny zakres z listy. Jeśli użyty zostanie nazwany zakres, inne ustawienia arkusza i zakresu danych nie będą miały już zastosowania i wyniku tego zostaną wyłączone.
Wybierz arkusz. Określa arkusz do zaimportowania według indeksu lub według nazwy.
- Według indeksu. Należy określić wartość indeksu dla arkusza, jaki ma zostać zaimportowany, rozpoczynając od wartości 0 dla pierwszego arkusza, 1 dla drugiego itd.
- Według nazwy. Należy określić nazwę arkusza, jaki ma zostać zaimportowany. Należy kliknąć przycisk wielokropka (...), aby wybrać dostępny arkusz z listy.
Zakres w arkuszu. Dane można importować, rozpoczynając od pierwszego niepustego wiersza lub określonego zakresu komórek.
- Początek zakresu od pierwszego niepustego wiersza. Lokalizuje pierwszą niepustą komórkę i używa jej jako górny lewy róg zakresu danych.
- Określony zakres komórek. Umożliwia wybranie określonego zakresu komórek według wiersza i kolumny. Na przykład, aby określić zakres w programie Excel A1:D5, można wprowadzić A1 w pierwszym polu i D5 w drugim (lub alternatywnie R1C1 i R5C4). Zwrócone zostaną wszystkie wiersze w określonym zakresie, również wiersze puste.
Na pustych wierszach. Jeśli więcej niż jeden wiersz jest pusty, można wybrać opcję Przerwij odczyt lub opcję Zwróć puste wiersze, aby kontynuować odczyt wszystkich danych do końca arkusza, wraz z pustymi wierszami.
Pierwszy wiersz zawiera nazwy zmiennych. Oznacza, że pierwszy wiersz w określonym zakresie powinien być używany jako nazwy zmiennych (kolumn). Jeśli ta opcja nie zostanie zaznaczona, nazwy zmiennych będą generowane automatycznie.
Wiersze do przeskanowania dla kolumny i typu. Można zwiększyć tę wartość, jeśli IBM® SPSS Modeler ma analizować więcej wierszy danych w formacie Excel, aby określić typ kolumny i składowania. Wartość domyślna to 200 wierszy. Należy pamięć, że to ustawienie ma wpływ na wydajność.
Składowanie zmiennej i poziom pomiaru
Podczas odczytywania wartości z programu Excel zmienne z numerycznym typem składowania są odczytywane domyślnie z typem pomiaru Ilościowy, z zmienne łańcuchowe są odczytywane jako typ Nominalny.
Istnieje możliwość ręcznej zmiany poziomu pomiaru (ilościowy a nominalny) na karcie Typ, ale typ składowania jest określany automatycznie (choć w razie konieczności można go zmienić za pomocą funkcji przekształcenia, takiej jak
to_integer w węźle wypełniania lub wyliczeń). Więcej informacji można znaleźć w temacie Ustawienia składowania i formatowania zmiennej.
Domyślnie zmienne z mieszanymi wartościami numerycznymi i łańcuchowymi są odczytywane jako liczby, co oznacza, że dowolne wartości łańcuchowe zostaną w programie IBM SPSS Modeler ustawione na wartość null (systemowe braki danych). Wynika to z faktu, że w odróżnieniu od programu Excel, program IBM SPSS Modeler nie zezwala na występowanie w zmiennej różnych typów składowania. Aby tego uniknąć, można ręcznie ustawić format komórki na Tekst w arkuszu Excel, co spowoduje, że wszystkie wartości (w tym liczbowe) będą odczytywane jako łańcuchy.