세상은 갈수록 '더 스마트'해지고 있습니다. 그리고 소비자들의 기대에 부응하기 위해 머신 러닝 알고리즘을 사용해 작업을 간소화하는 기업들은 점점 더 많아지고 있습니다 이러한 알고리즘은 최종 사용자 장치(스마트폰 잠금 해제를 위한 얼굴 인식을 통해) 또는 신용카드 사기 감지(비정상적인 구매에 대한 경고 알림 등) 등에서 사용되고 있습니다.
인공지능(AI)과 머신 러닝에는 지도 학습과 비지도 학습이라는 두 가지 기본 접근 방식이 있습니다. 주요 차이점은 하나는 레이블이 지정된 데이터를 사용해 결과를 예측하는 데 도움을 주는 반면 다른 하나는 그렇지 않다는 것입니다. 하지만 두 접근 방식 사이에는 약간의 미묘한 차이가 있고, 한 접근 방식이 다른 접근 방식을 능가하는 주요 영역이 있습니다. 이 게시물에서는 상황에 가장 적합한 접근 방식을 선택할 수 있도록 그 차이점을 설명하겠습니다.
업계 뉴스레터
가장 중요하고 흥미로운 AI 뉴스에 대한 선별된 인사이트를 확인하세요. 주간 Think 뉴스레터를 구독하세요. IBM 개인정보 보호정책을 참조하세요.
구독은 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
지도 학습은 레이블이 지정된 데이터 세트를 사용하는 머신 러닝 접근 방식입니다. 이러한 데이터 세트는 데이터를 분류하거나 결과를 정확하게 예측하도록 알고리즘을 학습시키거나 '감독'하도록 설계되었습니다. 모델은 레이블이 지정된 입력과 출력을 사용해 정확도를 측정하고 시간이 흐름에 따라 지속적으로 학습할 수 있습니다.
지도 학습은 데이터 마이닝 시 분류와 회귀라는 두 가지 유형의 문제로 구분될 수 있습니다.
비지도 학습은 머신 러닝 알고리즘을 사용해 레이블이 지정되지 않은 데이터 세트를 분석하고 클러스터링합니다. 이러한 알고리즘은 인간의 개입 없이 숨겨진 패턴이나 데이터 그룹을 찾아내기 때문에 '비지도' 학습으로 불립니다.
비지도 학습 모델은 클러스터, 연관, 차원 축소의 3가지 주요 작업에 활용됩니다.
두 접근 방식의 주요 차이점은 레이블이 지정된 데이터 세트를 사용한다는 것입니다. 간단히 말해, 지도 학습은 레이블이 지정된 입력과 출력 데이터를 사용하지만 비지도 학습 알고리즘은 그렇지 않습니다.
지도 학습에서는 데이터를 반복적으로 예측하고 정답을 조정한 학습 데이터 세트를 바탕으로 알고리즘을 '학습'시킵니다. 일반적으로 지도 학습 알고리즘은 비지도 학습 모델보다 더 정확하지만, 데이터에 적절한 레이블을 지정하려면 사전에 인간의 개입이 필요합니다. 예를 들어, 지도 학습 모델은 시간, 기상 조건 등을 기반으로 출퇴근 시간을 예측할 수 있습니다. 하지만 비가 내리면 운전 시간이 길어진다는 것을 알기 위해서는 먼저 모델을 학습시켜야 합니다.
반면, 비지도 학습 모델은 자체적으로 작동하며 레이블이 지정되지 않은 데이터의 고유한 구조를 발견합니다. 하지만 출력 변수의 유효성을 검사하기 위해서는 여전히 인간의 개입이 어느 정도 필요합니다. 예를 들어, 비지도 학습 모델은 온라인 쇼핑객이 여러 제품을 동시에 구매하는 경우가 많다는 사실을 파악할 수 있습니다. 하지만 추천 엔진이 아기 옷을 기저귀, 사과 소스, 빨대 컵 주문과 함께 그룹화하는 것이 합리적인지는 데이터 분석가가 검증해야 합니다.
상황에 맞는 올바른 접근 방식은 데이터 과학자가 데이터의 구조와 양, 사용 사례를 어떻게 평가하는지에 따라 그 선택이 달라질 수 있습니다. 결정을 내릴 때 다음을 고려하세요.
지도 학습에서 빅데이터를 분류하는 것은 매우 어려운 일이지만, 그 결과는 매우 정확하고 신뢰할 수 있습니다. 반대로 비지도 학습은 대량의 데이터를 실시간으로 처리할 수 있습니다. 하지만 데이터가 클러스터링되는 방식에 대한 투명성이 부족하고 부정확한 결과가 나올 위험이 높습니다. 이때 필요한 것이 바로 준지도 학습입니다.
지도 학습, 비지도 학습 중 어떤 것을 선택해야 할지 결정하기 힘드신가요? 준지도 학습은 레이블이 지정된 데이터와 레이블이 지정되지 않은 데이터가 모두 포함된 학습 데이터 세트를 사용하는 매개체입니다. 준지도 학습은 데이터에서 관련 기능을 추출하기 어렵거나 데이터의 양이 많을 때 특히 유용합니다.
준지도 학습은 적은 양의 학습 데이터로도 정확도를 크게 향상시킬 수 있는 의료 이미지에 이상적입니다. 예를 들어, 방사선 전문의는 CT 스캔의 작은 하위 집합에 종양이나 질병에 대한 레이블을 지정해 기계가 더 많은 치료가 필요한 환자를 보다 정확하게 예측할 수 있도록 할 수 있습니다.
머신 러닝 모델은 세상을 더 나아지게 하는 데이터 인사이트를 확보할 수 있는 강력한 방법입니다. 지도 학습과 비지도 학습에 사용되는 특정 알고리즘에 대해 자세히 알아보고 싶다면 이러한 테크닉이 설명되어 있는 학습 허브 문서를 살펴보는 것을 권장합니다. 한 걸음 더 나아가 딥 러닝과 신경망에 대해 자세히 살펴보는 블로그 게시물도 살펴보세요.
AI 빌더를 위한 차세대 엔터프라이즈 스튜디오인 IBM watsonx.ai로 생성형 AI, 파운데이션 모델 및 머신 러닝 기능을 학습, 검증, 조정 및 배포하세요. 적은 데이터로 짧은 시간 내에 AI 애플리케이션을 구축하세요.
업계 최고의 AI 전문성과 솔루션 포트폴리오를 보유한 IBM과 함께 AI를 비즈니스에 활용하세요.
AI 추가를 통해 중요한 워크플로와 운영을 혁신함으로써 경험, 실시간 의사 결정 및 비즈니스 가치를 극대화합니다.