IBM, 리더 기업으로 선정

Gartner, 데이터 사이언스 및 머신 러닝 플랫폼을 위한 2021 Magic Quadrant 발간

AutoML부터 AutoAI까지

AI 및 모델 라이프사이클 관리 가속화

AutoML은 무엇인가요?
자동 머신 러닝(AutoML)은 데이터 과학자가 머신 러닝 모델(ML 모델)을 구축하고 훈련할 때 완료해야 하는 수동 작업을 자동화하는 과정입니다. 수동 작업에는 기능 엔지니어링 및 선택, 머신 러닝 알고리즘 유형 선택, 알고리즘에 기반한 분석 모델 구축, 하이퍼매개변수 최적화, 테스트된 데이터 세트에 대한 모델 훈련, 점수 및 소견을 생성하기 위한 모델 실행이 포함됩니다. 연구자들은 데이터 과학자가 ML 모델에 대한 깊은 전문 지식을 갖추지 않아도 예측 모델을 구축할 수 있도록 AutoML을 개발했습니다.​ 그리고 AutoML은 데이터 과학자들의 머신 러닝 파이프라인 구축 관련 반복 암기 작업의 부담을 덜어주어, 중요한 비즈니스 문제를 해결에 필요한 인사이트 도출에 집중할 수 있도록 돕습니다.

AutoAI는 무엇인가요?
AutoAI는 AutoML의 변형입니다. AutoAI는 전체 AI 라이프사이클까지 모델 구축 자동화를 확장합니다. AutoAI는 AutoML과 마찬가지로 예측 머신 러닝 모델을 구축하는 단계에 지능형 자동화를 적용합니다. 이러한 단계에는 훈련을 위한 데이터 세트 준비, 분류 또는 회귀 모델과 같은 특정 데이터에 대한 최상의 모델 유형 식별, 모델이 해결 중인 문제를 가장 잘 지원하는 데이터 열 선택(일명 기능 선택) 등이 포함됩니다. 자동화 기능은 이어서 생성 과정 중 최상의 결과에 도달할 수 있도록 다양한 하이퍼매개변수 조정 옵션을 테스트하고, 이후 정확도 및 정밀도와 같은 메트릭을 기반으로 모델 후보 파이프라인에 대한 순위를 지정합니다. 최고 성능의 파이프라인을 프로덕션에 투입하여 새로운 데이터를 처리하고 모델 훈련을 기반으로 예측을 제공할 수 있습니다.

빠른 기능 비교

AutoAI vs AutoML

통합 기능 AutoAI AutoML
데이터 준비
기능 엔지니어링
하이퍼매개변수 최적화
모델 구축 자동화
원클릭 배포
모델 테스팅 및 스코어링
코드 생성
지원:
편향성 제거 및 드리프트 완화
모델 위험 관리
AI 라이프사이클 관리
전이 학습
AI 모델 활용
고급 데이터 정제

왜 AutoAI가 중요할까요?

지능형 자동화로 모든 사용자 지원

어떻게 AutoAI를 사용할 수 있을까요?

ModelOps 구축

세 명의 직원이 노트를 쓰고 있는 사람과 상의 중

ModelOps 구축

데이터 과학자와 DevOps 간의 협업을 촉진하여 AI 모델과 애플리케이션 통합을 최적화합니다.

믿을 만하고 설명 가능한 AI 개발

사무실의 데스크톱 모니터 왼쪽을 바라보는 직원

믿을 만하고 설명 가능한 AI 개발

보다 신속하게 결과를 얻고 위험 및 규정 준수를 관리하는 동시에 프로덕션 AI에 대한 신뢰 구축의 중요성을 알아보세요.

시계열 예측 자동화

서류와 노트북을 가지고 상담하는 두 명의 직원

시계열 예측 자동화

어떻게 모델이 단일 클래스뿐 아니라 모든 가능한 모델 클래스에서 최고의 성능을 발휘하는 모델을 통합해 시계열의 미래 값을 예측하는지 알아보세요.

AutoAI의 기능

모델 라이프사이클의 주요 단계 자동화

데이터 전처리

머신 러닝을 위한 원시 데이터를 분석, 청소, 준비하기 위해 다양한 알고리즘, 즉 추정기를 적용합니다. 범주 또는 수치와 같은 데이터 유형에 따라 특징을 자동으로 탐지하고 분류합니다. 하이퍼매개변수 최적화를 사용하여 결측값 대체, 기능 인코딩 및 기능 스케일링에 대한 최적의 전략을 결정합니다.

모델 선택 자동화

후보 알고리즘 테스트와 데이터의 작은 서브세트에 대한 순위를 통해 모델을 선택합니다. 가장 유망한 알고리즘에 대한 서브세트의 크기를 점진적으로 증가시킵니다. 데이터에 가장 적합한 모델 선택을 위해 다수의 후보 알고리즘 순위를 지정할 수 있습니다.

기능 엔지니어링

원시 데이터를 문제를 가장 잘 보여주는 기능의 조합으로 변환하여 가장 정확한 예측을 확보할 수 있습니다. 강화 학습을 통해 모델 정확도를 점진적으로 극대화하면서 구조화되고 불완전한방식을 통해 다양한 기능을 탐색합니다.

하이퍼매개변수 최적화

머신 러닝에서 일반적인 모델 훈련 및 스코어링을 사용하여 모델 파이프라인을 개선하고 최적화합니다. 성능에 기반하여 생산에 투입할 최적의 모델을 선택합니다.

모델 모니터링 통합

모델 입출력 세부 정보, 훈련 데이터 및 페이로드 로깅을 통해 모델 드리프트, 공정성, 품질에 대한 모니터링을 통합합니다. 직접 및 간접 편향성을 분석하는 동시에, 수동적 또는 능동적 편향성을 구현합니다.

모델 유효성 검증 지원

모델 및 데이터 인사이트를 확장하여 모델이 예상 성능을 충족하는지 검증합니다.  모델 품질을 측정하고 모델 성능을 비교함으로써 모델을 지속적으로 개선합니다.

AutoAI의 기능 활용

IBM Watson Studio에서 AutoAI 실행

AutoAI 구성

데이터 소스를 추가하고 AutoAI 실험에 대한 구성을 선택하는 위치를 보여주는 IBM Watson Studio의 스크린샷

AutoAI 구성

.csv 파일을 끌어와 예측 열을 선택합니다.

파이프라인 리더보드

관계 지도 및 파이프라인 리더보드를 보여주는 IBM Watson Studio의 스크린샷

파이프라인 리더보드

모델 정확도 순위를 지정하고 파이프라인 정보를 표시합니다.

모델 평가

모델 평가 수단 목록을 포함하여 파이프라인에 대한 모델 평가를 보여주는 IBM Watson Studio의 스크린샷

모델 평가

정확도, 정밀도, 재현율을 검토하여 모델을 평가합니다.

모델 배치

배치 공간에 대한 테스트 진행 위치를 보여주는 IBM Watson Studio의 스크린샷

모델 배치

모델을 배치 공간으로 이동합니다.

고객 사례

신뢰할 수 있는 AI 개발한 Regions Bank

Regions Bank가 IBM Cloud Pak for Data를 사용하여 데이터를 분석, 데이터 드리프트를 평가, 모델 성능을 측정함으로써 누리게 된 이점을 확인해 보세요.

모델 구축 시간을 90% 단축한 Highmark Health

Highmark Health 의료 네트워크가 보험금 청구 데이터를 사용하여 패혈증에 걸릴 가능성이 있는 환자를 식별하는 예측 모델을 구축했던 방법을 알아보세요.

AI 재해석한 Wunderman Thompson

Wunderman Thompson 마케팅 커뮤니케이션 에이전시가 AutoAI를 사용하여 대용량 예측을 감행하고 새로운 고객을 식별하는 방법을 확인해 보세요.

왜 IBM AutoAI여야 할까요?

IBM Research의 집중 개발

IBM Research 팀은 AI, ML 및 데이터 관리의 최첨단 기술을 적용하여 머신 러닝 및 데이터 사이언스 워크플로우 생성을 가속화하고 최적화하기 위해 노력하고 있습니다. AutoML과 관련하여 팀은 하이퍼매개변수 검색에 하이퍼밴드/Bayesian 최적화를 사용하고, 뉴럴 아키텍처 검색을 위한 하이퍼밴드/ENAS/DARTS에 중점을 두기 위해 최우선의 노력을 기울였습니다.

팀은 파이프라인 구성 자동화와 하이퍼매개변수 최적화를 포함한 AutoAI 개발에 지속적으로 초점을 맞췄습니다. 그 결과 모델 훈련 및 스코어링과 같은 비용 함수 평가에 최적화된 하이퍼매개변수 최적화 알고리즘이 크게 향상되었습니다. 이는 최적의 솔루션으로 신속하게 집중할 수 있게 해줍니다.

그리고 IBM Research는 AI 모델의 신뢰와 설명 가능성을 보장하기 위해 자동화된 인공지능을 적용하고 있습니다. 사용자는 IBM Watson Studio의 AutoAI를 통해 데이터 준비부터 알고리즘 선택, 모델 생성에 이르는 프로세스의 각 단계를 시각화하여 볼 수 있습니다. 더 나아가 IBM AutoAI는 모델의 지속적으로 개선하는 작업을 자동화하고, ModelOps 기능을 통해 AI 모델 API를 애플리케이션에 보다 쉽게 통합할 수 있도록 지원합니다. IBM Watson Studio 제품 내 AutoAI의 발전은 IBM이 2021년 Gartner Magic Quadrant for Data Science and Machine Learning Platforms 부문에서 리더로 선정되는 데 기여했습니다.

자세히 알아보기

AutoML과 딥러닝

딥러닝은 머신 러닝의 하위 분야로서 인간의 개입 없이 분석과 물리적 작업을 수행하는 AI 애플리케이션과 서비스를 지원하는 것으로 알려져 있습니다. 딥러닝의 대표적인 활용 사례로는 챗봇, 의료 영상 인식 기술, 사기 탐지 등이 있습니다. 하지만 머신 러닝과 마찬가지로 딥러닝 알고리즘을 설계하고 실행하기 위해서는 계산 능력은 물론 엄청난 인적 노력이 요구됩니다.

IBM Research 팀은 딥러닝에서 가장 복잡하고 시간이 많이 소요되는 프로세스 중 하나를 탐구했습니다. 즉, 뉴럴 아키텍처 검색(NAS)이라고 하는 기술을 통한 뉴럴 아키텍처의 생성입니다. 팀은 실무자들이 적절한 방법을 선택할 수 있도록 돕겠다는 목표를 가지고 개발된 NAS 방법을 검토하고 각각의 장점을 제시했습니다. 머신 러닝 모델에서 최상의 기능을 수행하는 아키텍처를 찾는 접근 방식을 자동화하면 AI의 민주화는 더욱 확장될 수 있지만, 문제는 복잡하고 해결이 어렵다는 것입니다.

하지만 IBM Watson Studio 내의 딥러닝 서비스를 활용하면 딥러닝을 쉽게 시작할 수 있습니다. 딥러닝 서비스는 복잡한 신경망을 설계한 후, 최적화된 머신 러닝 모델을 배치하기 위한 적정 규모의 실험을 수행할 수 있도록 돕습니다. 모델 훈련 프로세스를 간소화하기 위해 설계된 본 서비스는 컴퓨팅 성능 요구 사항을 해결할 수 있는 온디멘드 GPU 컴퓨팅 클러스터도 함께 제공합니다. 그리고 TensorFlow, Caffe, Torch, Chainer와 같은 인기 있는 오픈 소스 ML 프레임워크를 통합하여 여러 GPU에서 모델을 훈련하고 결과를 가속화할 수 있습니다. BM Watson Studio에서 AutoML, IBM AutoAI, Deep Learning 서비스를 결합하여 실험을 가속화하고, 정형 및 비정형 데이터를 분석하며, 더 나은 모델을 보다 신속하게 배치할 수 있습니다.

오픈 소스 패키지

AutoML에 대한 수요는 데이터 사이언스 전문가와 비전문가 모두가 사용할 수 있는 오픈 소스 소프트웨어의 개발로 이어졌습니다. 대표적인 오픈 소스 툴로는 auto-sklearn, auto-keras, auto-weka가 있습니다. IBM Research는 scikit-learn의 기능을 확장하여 알고리즘 선택, 하이퍼매개변수 조정, 토폴로지 검색을 포함한 광범위한 자동화를 지원하는 Python 라이브러리인 Lale(IBM 외부 링크)에 기여합니다. IBM Research의 논문 (PDF, 1.1MB)에 설명된 바와 같이, Lale은 기존 AutoML 툴을 위한 검색 공간을 자동으로 생성합니다. 실험에 따르면 이러한 검색 공간은 최첨단 툴과 함께 경쟁력 있는 결과를 달성하는 동시에 더 많은 다용성을 제공합니다.

지원 문서

문서

IBM Watson Studio 문서에서 쉽게 답을 찾을 수 있습니다.

지원

IBM의 기술 지원으로 시작해 보세요.

방문

다른 IBM Watson Studio 사용자에게서 기술 관련 문의하세요.

AutoAI 시작하기

IBM Cloud Pak for Data에서 IBM Watson Studio로 AutoAI를 사용해 보세요.