Brakujące wartości (modelowanie przyczynowe szeregów czasowych)
Brakujące wartości w danych wejściowych są zastępowane przez wartość podstawianą. Dostępne są zastępujące metody zastępowania:
- Interpolacja liniowa
- Powoduje zastąpienie braków danych przy wykorzystaniu interpolacji liniowej. W interpolacji używana jest ostatnia ważna wartość przed brakiem danych oraz pierwsza ważna za brakiem. Jeśli pierwsza lub ostatnia obserwacja w szeregu zawiera brakujące wartości, wówczas używane są dwie najbliższe niebrakujące wartości na początku i na końcu serii.
- Średnia szeregu
- Zastępuje braki danych średnią obliczoną ze wszystkich obserwacji.
- Średnia z sąsiednich punktów
- Powoduje zastąpienie braków danych średnią z ważnych wartości sąsiednich. Rozpiętość sąsiednich punktów, to liczba poprawnych wartości występujących przed i po brakującej wartości, jakie są wykorzystywane do obliczenia średniej.
- Mediana z sąsiednich punktów
- Powoduje zastąpienie braków danych medianą ważnych wartości sąsiednich. Rozpiętość sąsiednich punktów, to liczba poprawnych wartości występujących przed i po brakującej wartości, jakie są wykorzystywane do obliczenia mediany.
- Trend liniowy
- Ta opcja wykorzystuje niebrakujące obserwacje w szeregu do dopasowania prostego modelu regresji liniowej, który jest następnie używany w celu przypisania brakujących wartości.
Inne ustawienia:
- Maksymalny procent braków danych (%)
- Określa maksymalną wartość procentową braków danych, jaka jest dozwolona w szeregu. Szeregi z większą liczbą braków danych od określonego maksimum są wykluczane z analizy.
- Braki danych
- Ta opcja określa, czy braki danych użytkownika będą traktowane jako poprawne dane i czy będą uwzględniane w szeregu. Domyślnie braki danych użytkownika są wykluczane i są traktowane jako systemowe braki danych, które później są zastępowane.