튜토리얼: 보조 특징량을 활용한 AutoAI 다변량 시계열 실험
예제 데이터를 사용하여 예측 변수에 영향을 미치는 보조 특징 변수를 활용해 오염도와 기온을 예측하는 다변량 시계열 모델을 학습합니다.
실험을 설정할 때, 2010년부터 2014년까지 베이징의 기상 상황을 기록한 샘플 데이터를 불러옵니다. 이 실험은 이슬, 기압, 눈, 비 등의 보조 특징값을 활용해 알고리즘을 통해 향후 오염도와 기온을 예측하는 일련의 파이프라인을 생성합니다. 파이프라인을 생성한 후 AutoAI에서 비교하고 테스트하며 성능이 가장 우수한 파이프라인을 선택하여 검토할 수 있도록 리더보드에 표시합니다.
데이터 세트 개요
이 튜토리얼에서는 리소스 허브의 베이징 PM 2.5 데이터 세트를 사용합니다. 이 데이터 세트는 2010년부터 2014년까지 베이징의 기상 상황을 기록한 것으로, 1일 단위로 측정되었습니다. 이 데이터 세트를 사용하여 ‘ AutoAI ’ 실험을 구성하고 ‘Supporting features’를 선택합니다. 데이터 세트에 대한 자세한 내용은 다음에서 확인할 수 있습니다:
- 날짜 열을 제외한 각 열은 오염 지수에 영향을 미치는 기상 조건을 나타냅니다.
- 리소스 허브 항목에는 데이터의 출처가 표시됩니다. 파일을 다운로드하기 전에 미리 볼 수 있습니다.
- 샘플 데이터는 행과 열로 구조화되고 .CSV 파일로 저장됩니다.

태스크 개요
이 튜토리얼에서는 다음 지원 기능을 사용하는 다변량 시계열 실험을 만드는 단계를 따라가게 됩니다:
프로젝트 작성
다음 단계를 따라 빈 프로젝트를 생성하고, IBM watsonx 리소스 허브에서 베이징 PM 2.5 데이터 세트를 다운로드하세요:
- 메인 탐색 창에서 ‘프로젝트’ > ‘모든 프로젝트’를 클릭한 다음, ‘새 프로젝트’를 클릭합니다.
a. 빈 프로젝트 작성을 클릭하십시오.
b. 프로젝트 이름과 (선택 사항인) 설명을 입력하세요.
c. 작성을 클릭하십시오. - 메인 탐색 패널에서 ‘리소스 허브(Resource hub) ’를 클릭한 다음, ‘베이징 PM 2.5 ’ 데이터 세트의 로컬 사본을 다운로드하세요.
AutoAI 실험 작성
다음 단계를 따라 ‘ AutoAI ’ 실험을 생성하고 실험에 샘플 데이터를 추가하세요:
프로젝트 내의 [자산 ] 탭에서 [ 새 자산] > [머신 러닝 모델 자동 생성]을 클릭합니다.
실험의 이름과 (선택 사항인) 설명을 입력하세요.
8 vCPU 와 32GB RAM으로 구성된 환경 설정을 선택하십시오.
작성을 클릭하십시오.
샘플 데이터를 추가하려면 다음 방법 중 하나를 선택하십시오:
- 파일을 로컬에 다운로드했다면, ‘찾아보기’를 클릭한 후 안내에 따라 훈련 데이터 파일( PM25.csv )을 업로드하십시오.
- 파일을 이미 프로젝트에 업로드한 경우, ‘프로젝트에서 선택’을 클릭한 다음 ‘데이터 자산’ 탭을 선택하고 ‘Beijing PM 25.csv ’을 선택하세요.
실험 설정하기
다변량 AutoAI 시계열 실험을 구성하려면 다음 단계를 따르세요:
시계열 예측을 작성하는 옵션에 대해 Yes를 클릭하십시오.
예측 변수로 다음을 선택하세요:
pollution,temp.날짜/시간 열로 선택하십시오.
date.
실험 설정을 클릭하여 실험을 구성합니다:
a. ‘예측’ 페이지에서 ‘포함할 알고리즘’ 항목의 기본 설정을 그대로 사용하십시오. 보조 기능을 사용할 수 있게 해주는 알고리즘은 ‘보조 기능 허용’ 열에 체크 표시로 표시됩니다.
b. ‘데이터 소스’ 페이지로 이동하세요. 이 튜토리얼에서는 테스트를 진행하는 동안 지원 기능의 향후 값을 직접 입력하게 됩니다. 예측 기간 동안 지원 특징량의 값을 알 수 있는 경우, 미래 값이 유용합니다. 지원 기능의 향후 가치를 활용하기 위해 기본 활성화 설정을 적용하십시오. 또한, 보조 특징으로 사용될 열에 대해서는 기본 선택 사항을 그대로 적용하십시오.
c. ‘취소’를 클릭하면 실험 설정에서 나갑니다.훈련을 시작하려면 실행 실험을 클릭하십시오.
실험 결과 검토
실험이 완료되는 데 몇 분이 걸립니다. 실험이 진행됨에 따라 관계 맵에는 파이프라인을 생성하는 데 사용되는 변환들이 표시됩니다. 다음 단계를 따라 실험 결과를 검토하고 성능이 가장 우수한 파이프라인을 저장하세요.
선택 사항: 관계도에서 노드 위에 마우스를 올리면 특정 파이프라인의 변환에 대한 세부 정보를 확인할 수 있습니다.

선택 사항: 파이프라인이 순위표에 표시되면 ‘파이프라인 비교’를 클릭하여 각 파이프라인의 차이점을 확인해 보세요. 예를 들어, 다음과 같습니다.
훈련이 완료되면 상위 세 개의 최고 파이프라인이 리더보드에 저장됩니다. 파이프라인 이름을 클릭하면 세부 정보를 확인할 수 있습니다.
참고: 지원 기능을 사용하는 파이프라인은 **SUP** 개선 사항으로 표시됩니다.
Rank 1을 사용하여 파이프라인을 선택하고 다른 이름으로 저장을 클릭하여 모델을 작성하십시오. 그런 다음 작성을 클릭하십시오. 이 작업은 파이프라인을 ‘자산’ 탭의 ‘모델’ 섹션에 저장합니다.
훈련된 모델 배포
훈련된 모델을 사용하여 새 데이터에서 예측을 수행하기 전에 모델을 배치해야 합니다. 다음 단계를 따라 훈련된 모델을 배포 공간으로 이동시키세요:
- 모델 상세 페이지에서 모델을 배포할 수 있습니다. 모델 상세 페이지로 이동하려면 다음 옵션 중 하나를 선택하세요:
- 모델을 저장할 때 표시되는 알림에서 모델 이름을 클릭하세요.
- 모델이 포함된 프로젝트의 ‘자산( Assets )’ 페이지를 열고, ‘ Machine Learning 모델’ 섹션에서 모델 이름을 클릭합니다.
- ‘배포 공간으로
이동’ 아이콘을 클릭한 다음, 모델을 배포할 배포 공간을 선택하거나 생성합니다.
선택 사항 : 다음 단계를 따라 배포 공간을 생성하세요:
a. ‘타겟 공간’ 목록에서 ‘새 배포 공간 만들기’를 선택합니다.
b. 배치 공간 이름을 입력하십시오.
c. 머신 러닝 인스턴스를 연결하려면 ‘머신 러닝 서비스 선택(선택 사항) ’으로 이동하여 목록에서 머신 러닝 인스턴스를 선택하십시오.
d. 작성을 클릭하십시오. - 공간을 선택하거나 생성한 후, ‘홍보’를 클릭하세요.
- 알림에서 배치 공간 링크를 클릭하십시오.
- 배포 공간의 ‘자산’ 탭에서:
a. 모델 이름 위에 마우스를 올린 다음 배포 아이콘을 클릭하세요
.
b. 열린 페이지에서 다음 필드를 입력하세요:
- 배포 유형으로 ‘온라인’을 선택합니다.
- 배포 이름을 지정합니다.
- ‘생성’을 클릭합니다.
배포가 완료되면 ‘배포’ 탭을 클릭하고 배포 이름을 선택하여 세부 정보 페이지를 확인하세요.
배치된 모델 테스트
배포 세부 정보 페이지에서 배포된 모델을 테스트하려면 다음 단계를 따르세요:
배포 세부 정보 페이지의 ‘테스트’ 탭에서 ‘새 관측값(선택 사항) ’ 스프레드시트로 이동하여 다음 값을 입력하세요:
오염도 (double):80.417
기온 (double):-5.5
이슬점 (double):-7.083
기압 (double):1020.667
풍속 (double):9.518
적설량 (double):0
강수량 (double):0향후 지원 변수의 값을 추가하려면 ‘향후 외생 변수(선택 사항) ’ 스프레드시트로 이동하여 다음 값을 입력하십시오:
dew (double):-12.667
press (double):1023.708
wnd_spd (double):9.518
snow (double):0
rain (double):0.042참고: 실험 구성 단계에서 설정한 예측 기간과 동일한 수의 값을 향후 외생 변수에 대해 제공해야 합니다.예측을 클릭하십시오. 그 결과로 도출된 예측치는 오염도와 기온을 나타냅니다.
참고: 출력에 표시된 예측 값은 배포를 테스트할 때 달라질 수 있습니다.