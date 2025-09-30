예측 분석 모델은 과거 데이터를 평가하고, 패턴을 발견하고, 추세를 관찰하고, 해당 정보를 사용하여 미래 추세를 예측하도록 설계되었습니다. 널리 사용되는 예측 분석 모델에는 분류, 클러스터링 및 시계열 모델이 포함됩니다.

분류 모델

분류 모델은 지도형 머신 러닝 모델 부문에 속합니다. 이러한 모델은 과거 데이터를 기반으로 데이터를 분류하고 지정된 데이터 세트 내의 관계를 설명합니다. 예를 들어, 이 모델은 세분화 목적을 위해 고객이나 잠재 고객을 그룹으로 분류하는 데 사용될 수 있습니다. 또는 예 또는 아니요, 참과 거짓과 같은 이진 출력으로 질문에 답하는 데 사용할 수도 있으며, 사기 탐지 및 신용 위험 평가에 널리 사용되는 사용 사례입니다. 분류 모델 유형에는 로지스틱 회귀, 의사 결정 트리, 랜덤 포레스트, 신경망, Naïve Bayes 등이 있습니다.

클러스터링 모델

클러스터링 모델은 비지도형 학습에 속합니다. 이는 유사한 속성을 기반으로 데이터를 그룹화합니다. 예를 들어, 전자 상거래 사이트에서는 이 모델을 사용하여 공통 기능을 기반으로 고객을 유사한 그룹으로 구분하고 각 그룹에 대한 마케팅 전략을 개발할 수 있습니다. 일반적인 클러스터링 알고리즘에는 K-평균 클러스터링, 평균 시프트 클러스터링, 잡음이 있는 애플리케이션의 밀도 기반 공간 클러스터링(DBSCAN), 가우스 혼합 모델(GMM)을 사용한 기대 최대화(EM) 클러스터링, 계층적 클러스터링 등이 있습니다.

시계열 모델

시계열 모델은 일별, 주별, 월별 등과 같은 특정 시간 빈도에서 다양한 데이터 입력을 사용합니다. 계절성, 추세 및 주기적 동작에 대한 데이터를 평가하기 위해 종속 변수를 시간에 따라 플롯하는 것이 일반적이며, 이는 특정 변환 및 모델 유형이 필요함을 나타낼 수 있습니다. 자기회귀(AR), 이동 평균(MA), ARMA 및 ARIMA 모델은 모두 자주 사용되는 시계열 모델입니다. 예를 들어, 콜 센터는 시계열 모델을 사용하여 하루 중 다양한 시간에 시간당 수신되는 전화 수를 예측할 수 있습니다.