머신 러닝이란?

머신 러닝은 명시적인 프로그래밍을 통해서가 아닌 데이터로부터 시스템을 학습할 수 있는 AI의 한 형태입니다. 그러나 머신 러닝은 단순한 프로세스가 아닙니다. 알고리즘을 통해 학습 데이터를 수집한 후 해당 데이터를 기반으로 더 정확한 모델을 생성할 수 있습니다. 머신 러닝 모델은 데이터를 사용하여 머신 러닝 알고리즘을 학습할 때 생성되는 결과물입니다. 학습을 마친 후 모델에 입력 내용을 제공하면 결과물을 받게 됩니다. 예를 들면, 예측 알고리즘에서는 예측 모델이 생성됩니다. 그런 다음 예측 모델에 데이터를 제공하면 해당 모델을 학습한 데이터를 기반으로 예측 정보를 받게 됩니다.

머신 러닝에 대한 그림

반복 학습

머신 러닝을 사용하면 모델을 배치하기 전에 데이터 세트를 기반으로 학습할 수 있습니다. 일부 머신 러닝 모델은 온라인에서 이루어지며 지속적입니다. 온라인 모델의 이러한 반복적인 프로세스를 통해 데이터 요소 사이에서 이루어지는 연결 유형이 개선됩니다. 이러한 패턴과 연관성은 그 복잡성과 크기로 인해 사용자가 간과하기 쉽습니다. 모델을 학습한 후에는 모델을 실시간으로 사용하여 데이터로부터 학습할 수 있습니다. 머신 러닝에 포함되는 학습 과정 및 자동화로 인해 정확도가 향상됩니다.

머신 러닝에 대한 접근법

예측 모델의 정확도를 높이려면 머신 러닝 기술이 필요합니다. 다루고 있는 비즈니스 문제의 특성에 따라 데이터 유형 및 용량을 기반으로 다양한 접근법이 있습니다. 이 섹션에서는 머신 러닝의 다양한 범주를 살펴보겠습니다.

감독 학습

감독 학습은 일반적으로 구축된 데이터 세트와 해당 데이터를 분류하는 방식에 대한 확실한 이해를 바탕으로 시작됩니다. 감독 학습은 분석 프로세스에 적용할 수 있도록 데이터에서 패턴을 찾기 위한 방식입니다. 이러한 데이터에는 데이터의 의미를 정의하는 분류된 기능이 있습니다. 예를 들면, 이미지 또는 작성된 설명을 기반으로 수백만 마리의 동물을 구별하는 머신 러닝 애플리케이션을 만들 수 있습니다.

무감독 학습

무감독 학습은 문제에 엄청난 양의 분류되지 않은 데이터가 필요한 경우 사용됩니다. 예를 들면, Twitter, Instagram, Snapchat과 같은 소셜 미디어 애플리케이션에는 모두 대규모의 분류되지 않은 데이터가 있습니다. 이러한 데이터에 숨겨진 의미를 이해하려면 발견된 패턴 또는 클러스터를 기반으로 데이터를 분류하는 알고리즘이 필요합니다. 무감독 학습에서는 대화식 프로세스를 수행하여 인간의 개입 없이 데이터를 분석합니다. 이 방식은 이메일 스팸 탐지 기술에 사용되고 있습니다. 합법적인 이메일과 스팸 메일에는 너무 많은 변수가 있어 분석가가 원치 않는 대량의 이메일에 태그를 지정하기 어렵습니다. 대신 클러스터링 및 연관성을 기반으로 머신 러닝 분류자를 적용하면 원치 않는 이메일을 파악할 수 있습니다.

강화 학습

강화 학습은 행동 학습 모델입니다. 알고리즘에 데이터 분석에서 얻은 피드백이 접목되어 사용자에게 최적의 결과를 안내합니다. 강화 학습은 다른 유형의 감독 학습과 다릅니다. 샘플 데이터 세트를 사용하여 시스템을 학습하지 않기 때문입니다. 대신 시행착오를 통해 시스템을 학습합니다. 따라서 일련의 성공적인 의사결정을 통해 프로세스가 강화되는데, 문제를 언제든 가장 효과적으로 해결하기 때문입니다.

딥 러닝

딥 러닝은 데이터로부터 반복적으로 학습할 수 있도록 연속된 계층에 신경망을 통합하는 특정 머신 러닝 방법론입니다. 딥 러닝은 비정형 데이터로부터 패턴을 학습할 때 특히 유용합니다. 딥 러닝의 복잡한 신경망은 인간의 두뇌가 작동하는 방식을 모방하도록 설계되었으므로, 불완전하게 정의된 추상화 및 문제를 다루도록 시스템을 학습할 수 있습니다. 평균 5세의 어린이는 교사의 얼굴과 건널목 안전 지킴이 얼굴의 차이를 쉽게 인식할 수 있습니다. 그러나 컴퓨터에서는 누가 누구인지 알아내기 위해 많은 작업을 수행해야 합니다. 신경망과 딥 러닝은 흔히 이미지 인식, 음성, 컴퓨터 비전 애플리케이션에 사용됩니다.

머신 러닝에 대한 그래픽

머신 러닝 환경의 빅데이터

머신 러닝을 수행하려면 학습 프로세스에 올바른 데이터 세트를 적용해야 합니다. 조직은 머신 러닝 기술을 사용하기 위해 빅데이터를 보유할 필요가 없습니다. 그러나 빅데이터가 있으면 머신 러닝 모델의 정확도를 높이는 데 도움이 될 수 있습니다. 빅데이터를 사용하면 데이터를 가상화하여 온프레미스 또는 클라우드에 가장 효율적이고 비용 효과적인 방식으로 저장할 수 있습니다. 또한 네트워크 속도 및 안정성이 개선되어 대용량 데이터를 허용 가능한 속도로 관리하는 작업과 관련된 기타 물리적 제한사항이 제거되었습니다. 여기에 가격 변경과 정교한 컴퓨터 메모리가 미치는 영향을 더하면 5년 전만 해도 상상할 수 없었던 방식으로 기업이 데이터를 활용할 수 있습니다.

비즈니스 요구사항에 머신 러닝 적용

빅데이터를 활용하는 기업은 머신 러닝을 통해 잠재적 가치를 더하고, 행동, 환경 설정 또는 고객 만족도에서 일어나는 미묘한 변화를 더 잘 이해할 수 있습니다. 비즈니스 책임자는 조직 및 업계 내에서 일어나는 많은 일을 조회를 통해서는 이해할 수 없다는 점을 깨닫기 시작했습니다. 이미 알고 있는 문제에 대한 이야기가 아닙니다. 데이터에 묻혀 있는 숨겨진 패턴과 이상 항목으로, 도움이 되거나 상처를 줄 수 있습니다.

포괄적인 운영 방법

머신 러닝의 장점은 결과를 예측하기 위해 알고리즘과 모델을 활용할 수 있다는 점입니다. 그 비결은 작업을 수행 중인 데이터 사이언티스트가 올바른 알고리즘을 사용하고 가장 적합한 데이터(즉, 정확하고 정리된 데이터)를 수집하며 최상의 수행 모델을 지속적으로 사용할 수 있도록 보장하는 것입니다. 이러한 모든 요소를 모으면 데이터로부터 학습하여 모델을 지속적으로 학습하고 그 결과를 통해 다시 학습할 수 있습니다. 모델링, 모델 학습, 테스트로 이루어진 이러한 과정을 자동화하면 정확한 예측을 도출하여 비즈니스 변화를 지원할 수 있습니다.

인공 지능

제품

IBM Watson Studio

최고 수준의 오픈 소스 툴을 사용하여 팀에서 데이터 솔루션을 탐색, 모델링, 배치할 수 있는 공동 머신 러닝 플랫폼을 제공하는 온프레미스, 프라이빗 또는 퍼블릭 클라우드 솔루션입니다.

IBM Machine Learning for z/OS

엔터프라이즈 데이터에서 숨겨진 가치를 도출하는 온프레미스 머신 러닝 솔루션입니다. IBM z Systems® 데이터를 사용하여 데이터를 신속하게 수집하고 전환하여 매우 정확한 셀프 러닝 모델을 생성, 배치, 관리합니다.

IBM SPSS® Modeler

기술 수준과 관계없이 사용자가 텍스트 분석, 지형 공간 분석, 최적화와 같은 광범위한 알고리즘과 기능을 사용하여 규모에 맞게 인사이트를 구현할 수 있는 그래픽 분석 플랫폼입니다.

IBM Watson Explorer

머신 러닝 기반의 콘텐츠 분석 및 코그너티브 검색 플랫폼으로, 사용자가 모든 데이터로부터 얻은 실행 가능한 정보를 이용하고 비즈니스 실적을 향상시킬 수 있습니다.

성공 사례

Watson Explorer를 통해 고품질의 의료 서비스 제공에 필요한 새로운 인사이트를 얻은 Ahus

Akershus University Hospital(Ahus)은 파트너 Capgemini와 함께 Watson Explorer를 사용하여 수많은 방사선학 보고서를 분석하여 팀이 우수 사례를 따르고 있음을 보장하므로 높은 의료 표준을 유지하는 데 도움이 됩니다.

실시간 콘텐츠 분석으로 콜센터를 통한 고객 지원의 효율성 개선

Mizuho Bank Ltd.에서는 IBM Watson Explorer의 실시간 자연어 처리 기능을 사용하여 고객과의 상호 작용을 효율적으로 수행하고 고객 처리 시간을 단축했습니다.

리소스

머신 러닝 모델을 구축하여 IBM Watson Studio에서 고객의 해약을 예측하는 방법을 살펴보세요.

추가 머신 러닝 및 딥 러닝 애플리케이션 학습서를 확인하세요.

지금 바로 Watson Studio 체험판을 무료로 시작해 보세요.