불확실성은 데이터 기반 불확실성과 모델 기반 불확실성의 두 가지 기본 유형으로 나뉩니다. 두 경우 모두 예측이 이루어지기 전과 후에 예측이 얼마나 신뢰할 수 있는지 아는 것이 도움이 될 수 있습니다.

이를 도어 경첩이 약 1000회 작동에 실패하기 전에 몇 번이나 열고 닫을 수 있는지 예측하는 모델로 생각할 수 있습니다. 또한 이번에는 문 경첩을 닫으면 문 경첩이 부러질 가능성도 표시됩니다.

샘플링 기반 방법

샘플링 기반 접근 방식은 모든 종류의 모델 복잡성을 처리할 수 있고 직관적이고 포괄적인 불확실성 특성화를 제공하기 때문에 불확실성 정량화에 가장 일반적으로 사용되는 기술 중 일부입니다. 샘플링은 가능한 많은 시나리오를 생성함으로써 어떤 결과가 발생할 수 있는지, 실제 데이터에 적용될 때 예측이 얼마나 불확실한지에 대한 통계적 그림을 구축할 수 있습니다. 불확실성을 분석적으로 계산하는 대신 이러한 방법은 많은 샘플 아웃풋에 대한 통계 분석을 사용하여 불확실성 분포를 특성화합니다.

몬테카를로 시뮬레이션은 가장 일반적인 접근 방식 중 하나입니다. 이 시뮬레이션은 가능한 아웃풋의 범위를 확인하기 위해 무작위로 다양한 입력으로 수천 개의 모델 시뮬레이션을 실행합니다. 가능한 모든 값의 범위를 확인하기 위해 서로 다른 모델에 대한 신뢰 구간과 아웃풋을 비교하는 파라메트릭 모델에서 특히 자주 사용됩니다.

라틴어 하이퍼큐브 샘플링이라고 하는 몬테카를로 시뮬레이션의 변형은 입력 공간을 잘 커버하면서도 더 적은 수의 실행이 필요한 보다 효율적인 버전입니다.

몬테카를로 드롭아웃은 예측 중에 드롭아웃을 활성 상태로 유지하고 여러 차례의 전방 패스를 실행하여 아웃풋 분포를 얻는 또 다른 기법입니다.2 드롭아웃은 주로 머신 러닝 모델을 미세 조정하는 데 사용되는 방법인 정규화 기법로 사용됩니다. 과적합 또는 과소적합 문제를 피하면서 조정된 손실 함수를 최적화하는 것을 목표로 합니다.

Monte Carlo Dropout은 테스트 시간에 드롭아웃을 적용하고 서로 다른 드롭아웃 마스크를 사용하여 여러 포워드 패스를 실행합니다. 이렇게 하면 모델이 단일 포인트 추정치가 아닌 예측 분포를 생성합니다. 이 분포는 예측에 대한 모델 불확실성에 대한 인사이트를 제공합니다. 네트워크를 여러 번 학습시킬 필요 없이 신경망을 아웃풋 분포로 만드는 계산 효율적인 기술입니다.

실제 모델을 여러 번 실행하는 데 비용이 너무 많이 드는 경우 통계학자는 가우스프로세스 회귀(GPR)와 같은 기술을 사용하여 단순화된 '대리' 모델을 만듭니다. 5 GPR은 예측의 확실성을 모델링하기 위한 베이지안 접근 방식으로, 최적화, 시계열 예측 및 애플리케이션에 유용한 도구입니다. GPR은 공동 가우스 분포를 갖는 확률 변수의 모음인 '가우스 프로세스'의 개념을 기반으로 합니다.

가우스 프로세스는 함수의 분포로 생각할 수 있습니다. GPR은 함수에 대한 사전 분포를 배치한 다음 관찰된 데이터를 사용하여 사후 분포를 생성합니다. GPR을 사용하여 불확실성을 계산하는 것은 아웃풋이 본질적으로 분포를 통해 추정치에 대해 모델이 얼마나 확실하거나 불확실한지 표현하기 때문에 추가 학습이나 모델 실행이 필요하지 않습니다. Scikit-learn과 같은 라이브러리는 불확실성 분석을 위한 GPR 구현을 제공합니다.

샘플링 방법의 선택은 모델 및 시나리오에 가장 중요한 기능에 따라 달라집니다. 대부분의 실제 애플리케이션은 여러 접근 방식을 결합합니다.

베이지안 방법

베이지안 통계는 베이즈의 정리를 사용하여 이전의 믿음과 관찰된 데이터를 결합하고 가설의 확률을 업데이트하는 통계적 추론에 대한 접근 방식입니다. 베이지안 통계는 단일 고정 값이 아닌 확률 분포를 할당하여 불확실성을 명시적으로 처리합니다. 베이지안 방법은 모델 매개변수에 대해 단일 '최적' 추정치를 제공하는 대신 가능한 추정치의 가능성 분포를 제공합니다.

베이지안 추론은 새로운 데이터를 사용할 수 있게 되면 예측을 업데이트하며, 이는 공변량을 추정하는 과정 전반에 걸쳐 자연스럽게 불확실성을 통합합니다. 마르코프 연쇄 몬테카를로(MCMC) 방법은 수학적 솔루션이 복잡할 때 베이지안 접근 방식을 구현하는 데 도움이 됩니다. MCMC 접근 방식은 직접 샘플링할 수 없는 복잡한 고차원 확률 분포, 특히 베이지안 추론의 사후 분포에서 샘플링합니다.

베이지안 신경망(BNN)은 네트워크 가중치를 고정 소수점 추정치가 아닌 확률 분포로 처리하는 기존 신경망에서 출발합니다. 이러한 확률론적 접근 방식을 통해 원칙적이고 엄격한 불확실성 정량화가 가능합니다. 이러한 신경망은 가중치에 대한 단일 지점 추정치 대신 모든 네트워크 매개변수에 대한 확률 분포를 유지합니다. 예측에는 일반적으로 다음이 포함됩니다.

예측 분포에 대한 평균 및 분산 추정치

예측 분포의 샘플

분포에서 도출된 신뢰할 수 있는 구간

PyMC 및 Tensorflow-Probability와 같은 BNN을 구현하기 위한 몇 가지 인기 있는 오픈 소스 라이브러리가 있습니다.

앙상블 방법

앙상블 기반 불확실성 정량화의 핵심 아이디어는 독립적으로 학습된 여러 모델이 예측에 동의하지 않는 경우 이 불일치는 정답에 대한 불확실성을 나타낸다는 것입니다.4 반대로, 앙상블의 모든 모델이 일치하면 예측에 대한 신뢰도가 더 높다는 것을 나타냅니다. 이러한 직관은 앙상블 예측의 분산 또는 확산을 통해 구체적인 불확실성 측정으로 변환됩니다.

f₁, f₂, ..., fn이 입력 x에 대한 N 앙상블 멤버의 추정량을 나타내는 경우 불확실성은 다음과 같이 정량화할 수 있습니다.

V a r [ f ( x ) ] = 1 N ∑ i = 1 N ( f i ( x ) - f ¯ ( x ) ) 2

여기서 f(x)는 앙상블 평균입니다. 여러 가지 다양한 모델(서로 다른 아키텍처, 학습 데이터 하위 집합 또는 초기화)을 학습하고 해당 예측을 결합합니다. 이 접근 방식의 주요 단점은 계산 비용입니다. 여러 모델을 학습하고 실행해야 하기 때문입니다.

등각 예측

등각 예측은 불확실성 정량화를 위한 기술입니다. 이는 회귀 시나리오의 경우 예측 구간을 생성하고 분류 애플리케이션의 경우 예측 세트를 생성하기 위한 분포 없는 모델 독립적 프레임워크를 제공합니다.3 이는 모델 또는 데이터에 대한 최소한의 가정으로 유효한 적용 범위를 보장합니다. 따라서 등각형 예측은 블랙박스 사전 학습된 모델로 작업할 때 특히 유용합니다.

등각 예측에는 널리 적용할 수 있는 몇 가지 기능이 있습니다. 예를 들어, 데이터 포인트가 독립적이고 동일하게 분산되어 있어야 하는 것이 아니라 교환 가능하기만 하면 됩니다. 등각형 예측은 모든 예측 모델에도 적용할 수 있으며 모델의 허용 가능한 예측 불확실성을 설정할 수 있습니다.

예를 들어, 회귀 작업에서 95% 커버리지를 달성하고자 할 수 있습니다. 이 접근 방식은 모델 독립적이며 분류, 회귀, 신경망 및 다양한 시계열 모델에서 잘 작동합니다.

등각 예측을 사용하려면 데이터를 학습 세트, 기준선 테스트 세트 및 보정 세트의 세 가지 세트로 분할합니다. 보정 세트는 부적합 점수를 계산하는 데 사용되며 종종 s i 로 표시됩니다. 이 점수는 예측이 얼마나 비정상적인지 측정합니다. 새 입력이 주어지면 이러한 점수를 기반으로 예측 구간을 형성하여 적용 범위를 보장합니다.

분류 작업에서 등각 예측 부적합 점수는 새 인스턴스가 학습 세트의 기존 인스턴스에서 얼마나 벗어났는지를 측정한 것입니다. 이는 새 인스턴스가 특정 클래스에 속하는지 여부를 결정합니다. 다중 클래스 분류의 경우 일반적으로 특정 레이블에 대해 1(예측 클래스 확률)입니다.

s i = 1 - f ( x i ) [ y i ]

따라서 특정 클래스에 속하는 새 인스턴스의 예측 확률이 높으면 부적합 점수가 낮으며, 그 반대의 경우도 마찬가지입니다. 일반적인 접근 방식은 보정 세트의 각 인스턴스에 대한 s i 점수를 계산하고 점수를 낮음(확실)에서 높음(불확실)으로 정렬하는 것입니다.

95% 등각 커버리지에 도달하려면 s i 점수의 95%가 더 낮은 임계값 q를 계산합니다. 새 테스트 예제의 경우 s i 가 임계값 q보다 작은 경우 예측 집합에 레이블을 포함합니다.

모델의 등각 커버리지가 95%라는 보장이 필요한 경우 모든 클래스에 대해 평균 s i 점수를 얻을 수 있습니다. 그런 다음 데이터의 95%를 포함하는 s i 점수의 임계값을 찾을 수 있습니다. 그러면 분류기가 모든 클래스에서 새 인스턴스의 95%를 올바르게 식별한다는 것을 확신할 수 있습니다.

등각 예측이 여러 클래스를 식별할 수 있기 때문에 이는 분류기의 정확도와 약간 다릅니다. 다중 클래스 분류기에서 등각 예측은 모든 클래스에 대한 적용 범위도 표시합니다. 전체 학습 집합이 아닌 개별 클래스에 적용 범위 비율을 할당할 수 있습니다.