Zustandsraummodelle haben ihren Ursprung im Systems-Engineering, wo sie in den 1960er Jahren eine entscheidende Rolle bei Navigationsberechnungen für das Apollo-Programm spielten.1 SSMs werden auch in der Elektrotechnik eingesetzt, wo sie für die Signalverarbeitung, die Regelungstheorie und die Robotertechnik von grundlegender Bedeutung sind. Aber die vielleicht wichtigste Eigenschaft von SSMs ist ihre Vielseitigkeit, insbesondere für Systeme mit mehreren Eingängen und mehreren Ausgängen.

SSMs liegen zwei einfache Gleichungen zugrunde: Die eine beschreibt die interne Dynamik eines Systems, die nicht direkt beobachtbar ist, und die andere beschreibt, wie diese interne Dynamik mit den beobachtbaren Ergebnissen zusammenhängt. Diese einfache, flexible Formulierung kann an eine Vielzahl von multivariaten Zeitreihendaten angepasst werden.

Im Bereich der Wirtschaft können SSMs modellieren, wie sich Trends und Saisonalität auf die Aktienkurse auswirken. In den Neurowissenschaften können sie Beziehungen zwischen messbaren Gehirnsignalen (wie fMRIs) und der zugrunde liegenden neuronalen Aktivität abbilden. Im Bereich der Ökologie kann man anhand von SSMs die Populationsdynamik, die Bewegungen von Tieren und Capture-Recapture-Daten modellieren.2 SSMs werden ebenfalls bei Wettervorhersagen und anderen Arten von Zeitreihenanalysen genutzt.

In den letzten Jahren hat sich die Forschung an Zustandsraummodellen auf ihre Verwendung in Deep Learning konzentriert und neuronale Netze als Parameter von SSM-Gleichungen integriert. In jüngster Zeit und vor allem ist daraus die Mamba-Modellarchitektur für Large Language Models (LLMs) hervorgegangen, die nachweislich der Leistung von Transformer-Modellen entspricht und gleichzeitig eine überragende Geschwindigkeit und Effizienz bietet.