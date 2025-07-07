SSM은 원래 일부 입력을 기반으로 전기 신호, 날씨 패턴 또는 움직이는 물체의 궤적과 같은 연속 시퀀스의 다음 상태를 예측하도록 설계되었습니다. SSM은 개념적으로나 수학적으로나 2017년 트랜스포머가 도입되기 전 자연어 처리(NLP)를 지배했던 순환 신경망(RNN)뿐만 아니라 컨볼루션 신경망(CNN) 및 은닉 마르코프 모델(HMM)과 같은 다른 머신 러닝 알고리즘과도 연관이 있습니다.

이름에서 알 수 있듯이, SSM은 시스템의 상태와 각 변수의 가능성 범위를 상호 연계하여 설명하는 모든 상태 변수의 수학적 표현인 상태 공간을 모델링하여 동적 시스템의 다음 상태를 예측합니다.

SSM은 아웃풋 시퀀스 y(t)를 예측하기 위해 입력 시퀀스 x(t)를 RNN의 숨겨진 상태와 유사한 잠재된 상태 표현인 h(t)에 매핑합니다. 모든 SSM의 핵심에는 2개의 방정식이 있습니다.

상태 방정식, h ′ ( t ) = A * h ( t ) + B * x ( t )

출력 방정식: y ( t ) = C * h ( t ) + D * x ( t )

모델의 주요 매개변수는 A, B, C 및 D이며, 일반적으로 가중치 행렬의 형태를 취합니다. 제어 이론과 같이 SSM이 일반적으로 사용되는 분야에서 이러한 행렬은 종종 고정된 것으로 가정됩니다. 즉, 이러한 행렬은 확립된 시스템의 역학을 나타내며, SSM은 원하는 아웃풋 y로 이어지는 입력 x를 찾는 데 사용됩니다.SSM에 대한 보다 현대적인 개념에서 이러한 행렬 자체는 머신 러닝을 통해 최적화되는 매개변수입니다. 딥 러닝 모델에서 이러한 행렬은 신경망의 학습 가능한 가중치로 표현됩니다.