Watson Studio
SPSS Statistics
지도 학습은 훈련 세트를 사용하여 원하는 출력을 산출하도록 모델을 교육합니다. 이 훈련 데이터 세트에는 입력 및 올바른 출력이 포함되어 있으며, 이를 통해 시간이 지남에 따라 모델이 학습할 수 있습니다. 이 알고리즘은 손실 함수를 통해 해당 정확도를 측정하며, 오류가 충분히 최소화될 때까지 조정합니다.
지도 학습은 데이터 마이닝—분류와 회귀분석이라는 두 가지 유형의 문제로 나눌 수 있습니다.
다양한 알고리즘과 계산 기술이 지도형 머신 러닝 프로세스에 사용됩니다. 다음은 가장 일반적으로 사용되는 몇 가지 학습 방법에 대한 간략한 설명이며, 보통 R 또는 Python과 같은 프로그램을 사용하여 계산됩니다.
비지도형 머신 러닝 및 지도형 머신 러닝은 함께 논의되는 경우가 많습니다. 지도 학습과 달리, 비지도 학습은 레이블이 지정되지 않은 데이터를 사용합니다. 해당 데이터에서 클러스터링 또는 연관 문제를 해결하는 데 도움이 되는 패턴을 발견합니다. 특히, 업무 전문가(SME)가 데이터 세트 내의 공통 특성을 확신할 수 없을 때 유용합니다. 일반적인 클러스터링 알고리즘은 계층적, k-평균 및 가우시안 혼합 모델입니다.
준지도 학습은 주어진 입력 데이터의 일부만 레이블이 지정된 경우에 발생합니다. 지도 학습에 적합한 데이터 레이블을 지정하기 위해 도메인 전문 지식에 의존하는 것은 시간과 비용이 많이 들 수 있으므로, 비지도 및 준지도 학습이 더 매력적인 대안이 될 수 있습니다.
이러한 접근 방식의 차이점을 자세히 알아보려면 "지도 학습과 비지도 학습: 차이점"의 내용을 확인하세요.
지도 학습 모델은 다음을 포함하여 다양한 비즈니스 애플리케이션을 구축하고 발전시키는 데 사용할 수 있습니다.
지도 학습은 심도 깊은 데이터 인사이트 및 향상된 자동화와 같은 비즈니스 이점을 제공할 수 있지만, 지속 가능한 지도 학습 모델을 구축하는 데에는 몇 가지 과제가 있습니다. 다음은 이러한 과제 중 일부입니다.