날씨 모델은 날씨 연구 및 예측을 위해 대기를 컴퓨터로 시뮬레이션한 것입니다
날씨를 예측하는 것은 어렵습니다. 정확한 예측을 위해 기상학자는 현재와 과거의 날씨 데이터를 사용하여 대기의 미래 상태와 날씨 패턴에 미치는 영향을 예측합니다. 그러나 정확한 예보를 위해서는 어떤 날씨 데이터가 필요할까요? 기상학자들은 전 세계의 기상 관측소, 기상 위성, 기상 풍선 등을 통해 온도, 기압, 습도, 강수량, 풍속 등에 대한 기상 관측 자료를 수집합니다. 이러한 기상 조건은 시간이 지남에 따라 계속 변하기 때문에 방대한 데이터가 생성됩니다.
이 데이터를 활용하여 날씨를 정확하게 예측하려면 일정한 흐름 상태에 있는 수천 또는 수백만 개의 변수 간의 상호 작용을 모델링해야 합니다. 수학에서는 이 계산을 “유체역학 미분 방정식”이라고 합니다. 이러한 수학 방정식은 매우 복잡하고 너무 많은 데이터를 포함하므로 슈퍼컴퓨터에서 실행됩니다.
이러한 방정식을 바탕으로 한 날씨 예보를 수치적 날씨 예측이라고 하며, 이를 실행하는 컴퓨터 프로그램을 날씨 모델이라고 합니다.
날씨 모델은 대기를 컴퓨터로 시뮬레이션한 것입니다.
지구의 대기는 약 60마일 높이의 공기층이며, 공기(유체)는 복잡한 화학 반응, 열역학, 유체역학적 작용으로 인해 한 지점에서 다른 지점으로 이동합니다. 이론적으로 이러한 공기 흐름은 물리 및 수학 법칙을 사용하여 계산할 수 있습니다. 충분한 데이터, 컴퓨팅 성능, 그리고 여러 요소 간의 상호 작용을 정확하게 설명할 수 있는 방정식만 있으면 됩니다.
날씨 데이터, 컴퓨팅 성능, 대기 중 다양한 날씨 조건의 상호 작용을 시뮬레이션하는 수학 방정식은 모든 날씨 예보 모델의 세 가지 필수 요소입니다.
컴퓨터 프로그램이 미래 대기 상태에 대한 예측을 출력하려면 먼저 모델에서 설명할 지역에 대한 현재 날씨 데이터를 입력해야 합니다. 일반적으로 날씨 모델은 특정 위치에 집중하는 로컬 모델과 지구 전체의 날씨를 정확하게 예측하는 것을 목표로 하는 글로벌 모델 등 두 가지 유형으로 나뉩니다.
두 가지 유형의 모델 모두 비슷한 프로세스를 사용하지만, 차이점은 규모입니다. 기상 관측은 기상 관측소, 기상 풍선, 부표, 레이더, 위성 등을 이용해 이루어지며, 강수량과 뇌우, 풍속과 풍향, 기온과 기압 등에 대한 데이터가 수집됩니다. 이러한 초기 데이터는 특정 시점의 정보를 기반으로 하며, 모델에서는 이를 '초기 조건'이라고 합니다. 이러한 초기 데이터는 정기적으로 반복되는 시간 단계에 따라 주기적으로 업데이트됩니다.
이러한 초기 조건에서 얻은 데이터는 모델이 적용되는 지역을 포괄하고 대기 상층까지 확장되는 3차원 구조의 점 집합인 그리드로 배열됩니다. 그리드 포인트는 기상 관측이 이루어진 지점이 아니라 공간적으로 등거리이며 수평 및 수직 방향으로 이어지는 컴퓨터로 생성된 위치 집합입니다. 각 그리드 포인트에서 컴퓨터 프로그램이 모델 실행을 진행하여 해당 위치에 대한 수치 예측을 생성하고, 전체 그리드에 대한 계산이 완료될 때까지 각 그리드 포인트에 대해 이 과정을 반복합니다.
이러한 초기 조건에서 모델은 점진적인 시간 단계를 수행하여 대기의 흐름과 그로 인해 발생할 수 있는 날씨 조건을 예측할 수 있습니다.
그리드 포인트의 수와 각 그리드 포인트 사이의 간격은 예측 모델의 정확도에 영향을 미칩니다. 그리드 포인트 수가 많은 모델을 '고해상도'라고 하며 정확도가 향상되지만, 고해상도 그리드에는 더 많은 컴퓨팅 성능이 필요합니다.1
가장 단순한 예측 모델조차 복잡한 수학 방정식을 사용하며, 모델이 활용하는 데이터가 많을수록 더 많은 컴퓨팅 성능이 필요합니다. 세계에서 가장 정교하고 정확한 예측 모델은 유럽 중기예보센터(ECMWF)에서 운영하는 모델이나 미국 해양대기청(NOAA)에서 사용하는 고해상도 고속 갱신(HRRR) 모델과 같이, 초당 12,000조 회의 연산을 수행할 수 있는 슈퍼컴퓨터에서 실행됩니다.2 반면, 데이터 포인트가 적은 간단한 기상 모델은 적은 컴퓨팅 성능으로도 작동 가능하며 슈퍼컴퓨터에서 실행하지 않아도 됩니다.3
날씨는 상호 연관된 변수가 많아 혼돈 시스템으로 알려져 있습니다. 초기 조건의 작은 변화(예: 4mph인 풍속을 측정한 것과 4.2mph인 풍속을 측정한 것의 차이)가 빠르게 증가하여 나머지 시스템에 큰 영향을 미칠 수 있습니다. 시간이 지남에 따라 그 변화를 예측하기 어렵습니다.
기상 시스템과 관련된 수많은 변수와 알 수 없는 것들 때문에 기상학자들은 종종 앙상블 예측이라고 하는 것에 의존합니다. 앙상블 예측에서는 불확실성을 설명하기 위해 각각 다른 매개변수를 사용하여 여러 모델 실행이 수행됩니다. 이러한 예측의 전체 집합, 즉 앙상블은 대기의 가능한 미래 상태 범위를 모델링하고 미래 날씨에 대한 예측을 제공하는 데 사용할 수 있습니다.4
기상학자는 날씨 예보에 다양한 모델을 사용하는데, 이는 정확히 무엇을 예보하고자 하는지에 따라 달라집니다. 특정 지역을 대상으로 실행되는 지역 모델은 전 지구를 대상으로 하는 글로벌 모델과는 매우 다른 정보를 제공합니다. 각 날씨 모델에는 어떤 데이터를 포함할지, 어떤 수학 방정식으로 대기 현상을 가장 잘 시뮬레이션할지, 어떤 유형의 예보에 우선순위를 두는 것이 가장 중요한지 등에 대한 선택이 포함됩니다.
어떤 모델도 모든 기상 현상을 정확하게 예측할 수는 없습니다. 대신 기상학자들은 예측하고자 하는 대상을 선택하고 해당 종류의 결과에 대해 높은 정확도를 갖도록 모델을 설계합니다. 특정 분야의 정확성을 높이는 대신, 다른 분야의 정확성이 낮아질 수 있습니다. 예를 들어, 모델은 단기 예측(최대 3일 전), 중기 예측(3~15일 전) 또는 장기 예측(10일~2년 전)에 대해 높은 정확도를 갖도록 설계되며 각 유형에 따라 다른 선택이 필요합니다. 단기 예측을 원하는 기상학자는 대기 중 1,000km 상공의 지점에서 수집한 기상 데이터를 통합하는 중간 규모 모델을 사용할 수 있는데, 이 중간 규모 데이터는 더 정확한 단기 예측을 생성하기 때문입니다. 보다 신뢰할 수 있는 장기 예측을 위해 기상학자는 비중간 규모 모델, 즉 고고도 대기에서 기상 관측을 제외하는 모델을 선호할 수 있습니다.
기상학자는 항상 기존 날씨 모델을 개선하기 위해 노력하고 있으며, 날씨 연구 및 예측을 위한 새로운 컴퓨터 모델을 만들 수도 있습니다. 모델의 수학 방정식은 대기를 시뮬레이션하기 위한 것이므로 기상학자는 알고리즘을 테스트하고 조정하여 어떤 알고리즘이 가장 정확한 날씨 예보를 제공하는지 확인합니다. 이러한 공식 중 일부는 오픈 소스이고 일부는 독점적입니다.
가장 잘 알려진 두 가지 글로벌 모델은 미국 기상청의 글로벌 예보 시스템(GFS) 모델과 유럽 중기예보센터(ECMWF)에서 운영하는 모델로, 일반적으로 각각 미국 모델과 유럽 모델로 불립니다.
GFS는 하루에 4번 업데이트되며 최대 16일까지 예측합니다. ECMWF는 하루에 2번만 업데이트되고 10일 예측을 생성하지만 GFS보다 해상도가 높으며 역사적으로 더 정확한 예측을 생성했습니다.
또 다른 잘 알려진 예측 모델은 북미 중간 규모 모델(NAM)로, 북미 전역을 포괄하고 61시간 예측을 생성하는 단기 지역 모델입니다. NAM은 기상 연구 및 예측(WRF) 모델을 기반으로 하며, 이 모델은 미국 해양대기청(NOAA)에서 운영하는 두 가지 대표적인 모델인 신속 갱신(RR 또는 RAP) 모델과 고해상도 고속 갱신(HRRR) 모델의 기반이 되기도 합니다.
캐나다 기상 센터(CMC) 모델, 영국 기상청 모델, 독일 기상청(DWD) 모델, 호주 기상청(BoM) 모델 등 다른 날씨 모델이 있습니다. 각 모델은 서로 다른 사항에 집중하여 정확한 예측을 만들도록 설계되었으며, 다른 데이터를 통합하고 다른 수학 방정식으로 계산하여 가장 원하는 정확도를 생성합니다. 각각 고유한 강점과 한계가 있습니다.