Bayes Net 노드

베이지안 네트워크 노드를 사용하면 관측되고 기록된 증거를 "상식적인" 실제 지식과 결합하여 겉보기에 링크되지 않은 속성을 사용하여 발생 가능성을 설정함으로써 확률 모델을 작성할 수 있습니다. 노드는 분류에 주로 사용되는 TAN (Tree Augmented Naïve Bayes) 및 Markov Blanket 네트워크에 초점을 맞춥니다.

베이지안 네트워크는 여러 다양한 상황에서 예측하는 데 사용됩니다. 몇 가지 예는 다음과 같습니다.

  • 낮은 채무 불이행 위험이 있는 대출 기회를 선택합니다.
  • 센서 입력 및 기존 레코드를 기반으로 장비에 서비스, 부품 또는 교체가 필요한 시기를 추정합니다.
  • 온라인 문제점 해결 도구를 통해 고객 문제점 해결
  • 휴대 전화 네트워크를 실시간으로 진단하고 문제점을 해결합니다.
  • 최상의 기회에 자원을 집중하기 위해 연구 개발 프로젝트의 잠재적 위험 및 보상을 평가합니다.

베이지안 네트워크는 데이터 세트의 변수 (종종 노드라고도 함) 와 이들 사이의 확률적 또는 조건부 독립성을 표시하는 그래픽 모델입니다. 노드 간의 인과 관계는 베이지안 네트워크로 표시될 수 있습니다. 그러나 네트워크의 링크 ( 라고도 함) 가 반드시 직접적인 원인과 결과를 나타내는 것은 아닙니다. 예를 들어, 베이지안 네트워크는 그래프에 표시된 바와 같은 증상과 질병 사이의 확률적 독립성이 참인 경우, 특정 증상 및 기타 관련 데이터의 존재 또는 부재를 고려하여 특정 질병을 갖는 환자의 확률을 계산하는 데 사용될 수 있습니다. 네트워크는 정보가 누락되어 있는 경우 매우 강력하며 존재하는 정보를 사용하여 가능한 최상의 예측을 작성합니다.

베이지안 네트워크의 일반적이고 기본적인 예는 Lauritzen및 Spiegelhalter (1988) 에 의해 작성되었습니다. 종종 "아시아" 모델이라고도 하며 의사의 새 환자를 진단하는 데 사용할 수 있는 네트워크의 단순화된 버전입니다. 링크의 방향은 대략적으로 인과관계에 해당합니다. 각 노드는 환자의 상태와 관련이 있을 수 있는 측면을 나타냅니다. 예를 들어, "흡연"은 흡연이 확인되었다는 것을 나타내고, " "VisitAsia" "는 최근에 아시아를 방문했는지를 보여줍니다. 확률 관계는 임의의 노드 사이의 링크에 의해 표시됩니다. 예를 들어, 흡연은 환자가 기관지염과 폐암 둘 다에 걸릴 가능성을 증가시키는 반면, 나이는 폐암 발생 가능성과만 관련이 있는 것으로 보입니다. 동일한 방식으로, 폐의 x-레이 상의 이상은 결핵 또는 폐암에 의해 야기될 수 있는 반면, 호흡 곤란 (호흡곤란) 을 앓고 있는 환자가 기관지염 또는 폐암을 앓고 있는 경우에는 증가된다.

그림 1. Lauritzen및 Spegelhalter의 아시아 네트워크 예
Lauritzen및 Spegelhalter의 아시아 네트워크 예

베이지안 네트워크를 사용하기로 결정할 수 있는 몇 가지 이유가 있습니다.

  • 이는 인과 관계에 대해 학습하는 데 도움이 됩니다. 이를 통해 문제 영역을 이해하고 개입의 결과를 예측할 수 있습니다.
  • 네트워크는 데이터 과적합을 방지하기 위한 효율적인 접근 방식을 제공합니다.
  • 관련된 관계의 명확한 시각화가 쉽게 관찰됩니다.

요구사항. 대상 필드는 범주형이어야 하며 명목, 순서또는 플래그의 측정 수준을 가질 수 있습니다. 입력은 모든 유형의 필드일 수 있습니다. 연속형 (숫자 범위) 입력 필드는 자동으로 구간화되지만 분포가 비대칭인 경우 베이지안 네트워크 노드 이전에 구간화 노드를 사용하여 필드를 수동으로 구간화하면 더 나은 결과를 얻을 수 있습니다. 예를 들어, 감독자 필드 가 베이지안 네트워크 노드 목표 필드와 동일한 최적 구간화를 사용하십시오.

예제. 은행의 분석가는 대출 상환에서 채무 불이행 가능성이 높은 고객 또는 잠재 고객을 예측할 수 있기를 원합니다. 베이지안 네트워크 모델을 사용하여 가장 채무 불이행 가능성이 높은 고객의 특성을 식별하고 잠재적 채무 불이행자를 예측하는 데 가장 적합한 모델을 설정하기 위해 여러 가지 다른 유형의 모델을 빌드할 수 있습니다.

예제. 통신 운영자는 비즈니스를 떠나는 고객 수 ("이탈" 이라고 함) 를 줄이고 각 이전 월의 데이터를 사용하여 월별 기준으로 모델을 업데이트하려고 합니다. 베이지안 네트워크 모델을 사용하여 이탈할 가능성이 가장 높은 고객의 특성을 식별하고 새 데이터를 사용하여 매월 모델 훈련을 계속할 수 있습니다.