예측 분석을 통해 보다 나은 의사결정을 내릴 수 있도록 데이터 분석을 가속화합니다.

정의

예측 분석이란?

예측 분석은 통계 모델링, 데이터 마이닝 기술 및 머신 러닝과 결합된 히스토리 데이터를 사용하여 향후 결과를 예측하는 고급 분석의 한 분야입니다. 기업들은 예측 분석을 사용하여 이러한 데이터의 패턴을 찾음으로써 리스크와 영업 기회를 식별합니다.

예측 분석은 종종 빅데이터 및 데이터 사이언스와 연관됩니다. 오늘날 기업들은 트랜잭션 데이터베이스, 장비 로그 파일, 이미지, 비디오, 센서 또는 기타 데이터 소스에 상주하는 데이터로 작업을 수행하고 있습니다. 이 데이터에서 인사이트를 얻기 위해 데이터 사이언티스트는 딥 러닝 및 머신 러닝 알고리즘을 사용하여 패턴을 찾고 향후 이벤트를 예측합니다. 여기에는 선형 및 비선형 회귀, 신경망, 서포트 벡터 머신 및 의사결정 트리가 포함됩니다. 예측 분석을 통해 얻은 학습은 처방 분석 내에서 추가로 사용되어 예측 인사이트를 기반으로 조치를 취할 수 있습니다.

IBM은 확장 가능한 예측 모델을 보다 손쉽고 빠르게 구축할 수 있도록 도와주는 소프트웨어 툴셋을 제공합니다. 이러한 툴은 클라우드와 온프레미스 등 어디서나 모델을 구축하고 실행할 수 있도록 해주는 컨테이너형 데이터 및 AI 플랫폼인 IBM Cloud Pak® for Data에서도 실행될 수 있습니다.

이점

예측 모델의 구축을 위한 유연한 플랫폼

확장성

데이터 사이언스와 데이터 엔지니어링 작업을 자동화합니다. 다수의 엔터프라이즈 애플리케이션에서 완벽하게 모델을 훈련, 테스트 및 배치합니다. 하이브리드, 멀티클라우드 환경에서 공통 데이터 사이언스 기능을 확장합니다.

속도

사전 제작된 애플리케이션과 사전 훈련된 모델을 활용합니다. 데이터 사이언스 및 비즈니스 팀이 최신의 IBM 및 오픈 소스 소프트웨어를 사용하여 협업을 수행하고 모델 구축을 효율화할 수 있도록 지원합니다.

단순성

중앙 플랫폼을 사용하여 전체 데이터 사이언스 라이프사이클을 관리합니다. 개발 및 배치 프로세스를 표준화합니다. 기업에서 데이터 거버넌스와 보안을 위한 단일 프레임워크를 구축합니다.

IBM의 예측 분석 툴

데이터 사이언스 플랫폼

IBM Watson® Studio는 오픈 소스 코드나 비주얼 모델링을 사용하여 어디에서나 데이터를 준비하고 모델을 구축할 수 있는 툴을 제공하여 AI의 운용을 지원합니다.

통계 분석 소프트웨어

IBM® SPSS® Statistics는 임시 분석, 가설 검증, 지리공간 분석 및 예측 분석을 사용하여 비즈니스 및 연구 문제점을 해결하도록 설계되었습니다.

시각적 모델링 툴

IBM SPSS Modeler 솔루션은 즉시 이용이 가능한 알고리즘과 모델을 사용하여 데이터 자산과 최신 애플리케이션을 활용할 수 있도록 지원합니다.

의사결정 최적화 솔루션

IBM Decision Optimization은 규범적 분석 기능을 제공하여 머신 러닝 모델의 예측 인사이트를 보강함으로써 결과를 최적화합니다.

예측 분석 예제

산업용 유스케이스 살펴보기

금융업

금융 서비스는 머신 러닝과 정량적 툴을 사용하여 신용 리스크를 예측하고 사기를 감지합니다.

의료 서비스

의료 서비스의 예측 분석은 만성 질환이 있는 환자들을 감지하고 이들의 치료를 관리하는 데 사용됩니다.

인적 자원(HR)

HR 팀은 예측 분석을 사용하여 직원들을 찾아서 고용하고, 노동시장을 판별하며, 직원들의 성과 수준을 예측합니다.

마케팅 및 세일즈

예측 분석은 고객 라이프사이클 및 교차 판매 전략 전체에서 마케팅 캠페인에 사용될 수 있습니다.

소매업

소매업체는 예측 분석을 사용하여 상품 추천을 식별하고, 매출을 예측하며, 시장을 분석하고, 계절성 재고를 관리합니다.

공급망

기업들은 예측 분석을 사용하여 재고 관리를 보다 효율화함으로써 재고를 최소화하면서도 수요를 충족시키는 데 도움을 줍니다.

예측 분석에 대한 심층 분석

모델 유형 등

예측 모델링의 유형

데이터 사이언스 및 분석 팀은 예측 모델링, 설명 모델링 및 의사결정 모델링 등 세 가지 유형의 예측 모델을 활용합니다.

예측 모델링
예측 모델링은 통계를 사용하여 결과를 예측합니다. 목표는 상이한 샘플의 유사 유닛이 유사 성능을 보여줄 가능성을 평가하는 것입니다. 예측 모델링을 사용하여 신용 리스크와 같은 고객의 행동을 예측할 수 있습니다.

설명 모델링
설명 모델링은 제공된 데이터 세트 내의 관계를 설명하며, 이는 주로 세그먼트화 용도로 고객이나 잠재 고객을 그룹으로 분류하는 데 사용됩니다. 이러한 유형의 모델링은 제품 환경 설정 및 라이프 스테이지 등 고객과 제품 간의 다양한 관계를 식별하는 데 집중합니다.

의사결정 모델링
의사결정 모델링은 결과 예측을 위해 데이터, 의사결정 및 예측 결과 등 의사결정의 요소들 간의 관계를 설명합니다. 이러한 유형을 사용하여 기타 결과를 최소화하면서도 특정 결과를 극대화할 수 있습니다.

유명한 예측 분석 모델

예측 분석 모델은 히스토리 데이터를 평가하고 패턴을 발견하며 경향을 관찰하고 해당 정보를 사용하여 향후 경향을 예측하도록 설계되었습니다. 유명한 예측 분석 모델에는 아래에서 보다 자세히 설명된 분류, 클러스터링, 예측, 아웃라이어 및 시계열 등이 포함됩니다.

분류 모델
분류 모델은 감독형 머신 러닝 모델로 분류됩니다. 이는 데이터를 히스토리 데이터의 결론을 기반으로 카테고리에 배치합니다. 이 모델은 일반적으로 '예' 또는 '아니요' 혹은 '참' 및 '거짓' 등 2진 출력으로 질문에 응답하는 데 사용됩니다. 분류 모델의 유형에는 로지스틱 회귀, 의사결정 트리, 랜덤 포레스트, 신경망 및 Naive Bayes 등이 있습니다.

클러스터링 모델
클러스터링 모델은 비감독형 러닝으로 분류됩니다. 이는 유사한 속성을 기반으로 데이터를 그룹으로 정렬합니다. 예를 들어, 전자상거래 사이트는 이 모델을 사용하여 공통 기능을 기반으로 고객을 유사한 그룹으로 분리한 후 각 그룹의 마케팅 전략을 개발할 수 있습니다. 일반적인 클러스터링 알고리즘에는 k-평균 클러스터링, 평균-시프트 클러스터링, DBSCAN(Density-Based Spatial Clustering of Applications with Noise), GMM(Gaussian Mixture Models)을 사용한 예측 극대화(EM) 클러스터링, 그리고 계층형 클러스터링이 포함됩니다.

예측 모델
예측 모델은 메트릭 값 예측을 사용함으로써 히스토리 데이터의 동향을 기반으로 새 데이터의 숫자 값을 추정합니다. 예를 들어, 콜센터는 이 모델을 사용하여 시간당 수신될 호출 수를 예측할 수 있습니다. 시계열 및 경제적 모델은 예측 모델의 실제 사례입니다.

아웃라이어 모델
아웃라이어 모델은 데이터 세트에서 변칙적 데이터 항목을 처리합니다. 예를 들어, 보험 회사는 사기 탐지에 이를 사용함으로써 트랜잭션 목록 내에서 변칙 데이터에 플래그를 지정할 수 있습니다.아웃라이어 감지를 위한 일부 인기 있는 방법에는 극단값 분석, 확률 및 통계 모델링, 선형 회귀, 근접 기반 모델링 및 정보 이론 모델링 등이 있습니다.

시계열 모델
시계열 모델은 입력 매개변수로 시간을 사용하여 일련의 데이터 점을 채택합니다. 이는 작년의 데이터를 가져와서 숫자 메트릭을 계산한 후 해당 메트릭을 사용하여 3-6주 간의 데이터를 예측할 수 있습니다. 예를 들어, 이 모델을 병원에서 사용하여 지난 6주 동안 내방한 환자들의 수를 기준으로 응급실 용적을 예측할 수 있습니다.

예측 분석 프로세스

예측 분석은 낭비를 줄이고 시간을 절감하거나 비용을 줄이는 등의 비즈니스 목표에서 시작됩니다. 이 프로세스는 모델을 사용하여 대규모 데이터 세트를 활용하여 해당 목표를 지원하는 결과를 생성합니다.

예를 들어, 판매 수익의 예측을 위한 예측 분석 프로세스는 다음의 기본 단계를 따릅니다.

  1. 다양한 소스에서 데이터를 가져옵니다. 이러한 데이터 소스에는 제품 판매, 마케팅 예산 및 국가 GDP가 포함됩니다.
  2. 아웃라이어(예: 데이터 스파이크, 누락 데이터)를 제거하고 집계하여 데이터를 정리합니다. 단일 테이블을 사용하여 제품 판매, 마케팅 예산 및 국가 GDP 등 다양한 유형의 데이터를 집계할 수 있습니다.
  3. 적절한 적합성 보장을 기반으로 예측 모델을 개발합니다. 예를 들어, 신경망을 이용하여 수익 예측을 위한 예측 모델을 구축하고 훈련할 수 있습니다.
  4. 다른 애플리케이션을 통해 액세스할 수 있는 프로덕션 환경에 모델을 배치합니다.

예측 분석 프로그램 구현

예측 분석의 사용은 분석 여정의 중요 이정표이자 고전적 통계 분석이 인공지능의 신세계와 만나는 융합점입니다. 오늘날의 전례 없는 직관적 툴의 통합으로, 새로운 예측 기술과 하이브리드 클라우드 배치 모델은 예측 분석과 모델링에 그 어느 때보다도 쉽게 액세스할 수 있도록 해줍니다. 처음으로, 모든 규모의 기업들은 예측 분석을 자체 비즈니스 프로세스에 임베드하고 규모에 맞게 AI를 활용할 수 있는 툴을 보유할 수 있습니다.

엔터프라이즈 데이터 사이언스 프로그램으로 진화하면 상당한 경쟁우위가 제공될 수 있습니다. 이러한 진화의 전형적인 단계는 다음과 같습니다.

1단계: 시작

기업이 데이터 사이언스 기능의 빌드를 시작하는 경우, 이는 일반적으로 특정 질문에 응답하거나 연구 프로젝트를 지원하기 위한 모델의 개발과 같은 임시 프로젝트로 시작합니다. IBM Watson Studio Desktop 등의 솔루션을 사용하여, 데이터 사이언티스트들은 자체 컴퓨터나 랩탑에서 연중무휴 24시간 내내 작업할 수 있으며 필요 시에 보다 광범위한 팀과 동기화할 수 있습니다.

2단계: 채택 성장

데이터 사이언스가 비즈니스 전반에 걸쳐 더욱 광범위하게 채택됨에 따라, 서로 다른 부서들은 자체 모델을 배치하고 이를 데이터 소스에 연결하며 이를 프로덕션 애플리케이션에 주입해야 합니다. IBM Watson Studio 및 IBM Watson Machine Learning을 사용하면 부서 데이터 사이언스 및 IT 팀이 이 라이프사이클에서 보다 손쉽게 협업할 수 있습니다.

3단계: 엔터프라이즈급 채택

일단 비즈니스 핵심 프로세스에 AI가 임베드되면, 기업들은 모델 및 데이터를 관리하고 통제할 수 있는 중앙 플랫폼을 구축해야 합니다. IBM Cloud Pak for Data는 단일 제어 지점으로 작동하는 포괄적인 멀티클라우드 플랫폼에 필요한 인프라와 툴을 제공할 수 있습니다.

직접 체험하기

코드 패턴 및 튜토리얼

심장마비를 예측하기 위해 스코어링 모델을 작성하고 배치

사물인터넷(IoT) 센서 데이터를 사용하여 장비 장애 예측

오픈 의료 데이터 세트를 분석하여 인사이트 얻기

예측 분석을 위한 원시 데이터의 구성 및 세분화

시작하기

예측 분석 여정을 시작합니다.