Estymacja krzywej

Procedura estymacji krzywej pozwala obliczyć statystykę regresyjną dla estymacji krzywej oraz uzyskać odpowiednie wykresy z użyciem 11 różnych modeli regresji. Dla każdej zmiennej zależnej tworzony jest odrębny model. Wartości przewidywane, reszty oraz przedziały predykcji można również zapisywać jako nowe zmienne.

Przykład. Dostawca usługi internetowej wykrywa procent zainfekowanej wirusem poczty e-mail w swojej sieci na przestrzeni czasu. Wykres rozrzutu pozwala stwierdzić istnienie zależności liniowej. Dysponując tą informacją, można dopasować do danych odpowiedni model liniowy lub sześcienny i sprawdzić prawdziwość założeń oraz dobroć dopasowania modelu.

Statystyki. W przypadku każdego modelu: współczynniki regresji, wielorakie R, R 2 skorygowane R 2, błąd standardowy oszacowania, tabela analizy wariancji, wartości przewidywane, reszty oraz przedziały predykcji. Modele: liniowy, logarytmiczny, odwrotny, kwadratowy, sześcienny, potęgowy, złożony, krzywej S, logistyczny, wzrostu i wykładniczy.

Wymagania dotyczące danych przy estymacji krzywej

Dane. Zmienne zależne i niezależne powinny być zmiennymi ilościowymi. Jeżeli jako zmienna niezależna zamiast zmiennej z aktywnego zbioru danych wybrana zostanie opcja Czas, to procedura Estymacja krzywej wygeneruje zmienną czasu z jednolitymi przedziałami czasu między obserwacjami. Przy wybranej opcji Czas zmienna zależna powinna być miarą szeregu czasowego. Analiza szeregów czasowych wymaga określonej struktury pliku danych, w której każda obserwacja (wiersz) odpowiada zbiorowi obserwacji dokonanych w różnych momentach czasu, przy czym przedziały czasu między pomiarami są jednakowe.

Założenia. Dane warto wyświetlić w postaci graficznej, by ustalić typ relacji między zmiennymi zależnymi i niezależnymi (liniowa, wykładnicza itp.). Reszty w przypadku dobrego modelu powinny być równomiernie rozmieszczone i zgodne z rozkładem normalnym. Jeśli używany jest model liniowy, spełnione muszą być następujące założenia: dla każdej wartości zmiennej niezależnej rozkład zmiennej zależnej musi być normalny. Wariancja rozkładu zmiennej zależnej powinna być stała dla wszystkich wartości zmiennej niezależnej. Relacja między zmienną zależną a zmienną niezależną powinna być liniowa, a wszystkie obserwacje powinny być niezależne.

Wykonywanie estymacji krzywej

  1. Z menu wybierz:

    Analiza > Regresja > Estymacja Krzywej ...

  2. Wybierz co najmniej jedną zmienną zależną. Dla każdej zmiennej zależnej tworzony jest odrębny model.
  3. Wybierz zmienną niezależną (zmienną w aktywnym zbiorze danych lub opcję Czas).
  4. Opcjonalnie:
  • Wybierz zmienną umieszczaną w etykietach obserwacji na wykresach rozrzutu. Dla każdego punktu na wykresie rozrzutu można użyć narzędzia wyboru punktów, aby wyświetlić wartość zmiennej Opis obserwacji.
  • Kliknij przycisk Zapisz, aby zapisać wartości przewidywane, reszty i przedziały predykcji jako nowe zmienne.

Dostępne są także następujące opcje:

  • Uwzględnij stałą w równaniu. Powoduje oszacowanie składnika stałego w równaniu regresji. Stała jest uwzględniana domyślnie.
  • Graficzna prezentacja modeli. Sporządza wykres wartości zmiennej zależnej i każdego wybranego modelu względem zmiennej niezależnej. Dla każdej zmiennej zależnej tworzony jest oddzielny wykres.
  • Wyświetl tabelę ANOVA. Wyświetla tabelę podsumowującą analizę wariancji dla każdego wybranego modelu.

Ta procedura służy do wkleiania składni komendy CURVEFIT .