2010년 9월 28일 - 참고자료에 새로운 PMML 기사인 "Representing predictive solutions in PMML: Move from raw data to predictions"으로 링크가 추가됨
누군가가 독자에게 예측 분석을 사용해 본 적이 있는지 물으면 아마도 "아니오"라고 답할 것이다. 그러나 사실은 알고 있지 못할 뿐이지 아마도 매일매일 예측 분석을 사용하고 있을 것이다. 신용카드를 현금인출기에 통과시키거나 온라인에서 사용할 때마다 예측 분석 모델은 해당 트랜잭션이 사기일 가능성을 확인한다. 온라인에서 DVD를 임대하는 경우에는 예측 분석 모델이 고객에게 특정 영화를 추천할 가능성이 있다. 사실상 예측 분석은 이미 생활 깊숙이 들어와 있으며 미래에는 예측 분석 애플리케이션이 훨씬 더 우리의 삶에 도움을 줄 것이다.
교량, 건물, 산업 프로세스 및 기계의 센서에서 데이터를 생성함에 따라 예측 솔루션을 통해 더욱 안전한 환경이 구축되며 이러한 환경에서는 잠재적인 오류나 문제점이 실제로 나타나기 전에 예측을 통해 이러한 오류나 문제점을 경보로 알려준다. 또한, 중환자실에 있는 환자를 모니터하는 데도 센서가 사용된다. IBM®과 온타리오 대학 기술연구소는 현재 미숙아를 모니터하는 데이터 분석 및 예측 솔루션을 구현하는 작업을 공동으로 수행하고 있으며 이 솔루션에서는 생물학적 판독 기능을 사용하여 일반적으로 관찰되기 최대 24시간 전에 생명에 위협이 되는 병원균을 검출한다.
그러나 예측 분석만으로 모든 것을 이해할 수 있을까? 상황에 따라 다르다. 개방형 표준이 반드시 필요하다고 할 수 있다. 예측 솔루션과 데이터 분석이 주는 혜택을 완전히 누리려면 시스템과 애플리케이션에서 다음과 같은 표준을 사용하여 쉽게 정보를 교환할 수 있어야 한다. PMML을 이용하면 애플리케이션과 시스템 간에 예측 분석 모델을 공유할 수 있다.
주요 분석 벤더에서 PMML을 채택한다는 사실은 회사에서 상호 운용성을 인식하고 있다는 좋은 사례이다. IBM, SAS, Microstrategy, Equifax, NASA 및 Zementis는 PMML을 구체화하는 위원회인 DMG(Data Mining Group)의 일원이다. KNIME 및 Rapid-large와 같은 오픈 소스 기업 또한 이 위원회에 소속되어 있다. 여기서 PMML은 예측 분석 분야를 구체화하여 예측 분야가 더욱 개선될 수 있게 하는 역할을 한다.
PMML은 데이터 마이닝 모델을 표현하는 데 사용하는 언어로 사실상 표준이 되었다. 예측 분석 모델과 데이터 마이닝 모델은 대량의 기록 데이터에서 숨겨진 패턴을 학습하는 통계 기술을 사용하는 수학 모델을 언급할 때 사용하는 용어이다. 예측 분석 모델에서는 새로운 데이터에 알려진 패턴이 있는지 예측하는 과정에서 얻은 지식을 사용한다. PMML을 이용하면 다양한 애플리케이션 간에 예측 분석 모델을 쉽게 공유할 수 있다. 따라서 하나의 시스템에서 모델을 학습하여 PMML로 표현한 후, 이 모델을 다른 시스템에 적용하여 기계에 장애가 일어날 가능성과 같은 것을 예측할 수 있다.
PMML은 영리 회사와 오픈 소스 분석 회사로 구성되어 있고 벤더에서 주도하는 위원회인 DMG(Data Mining Group)에서 계획한 것이다. (관련 링크는 참고자료를 확인한다.) 따라서 현재 많이 사용되고 있는 대부분의 데이터 마이닝 도구에는 PMML을 내보내거나 가져올 수 있는 기능이 포함되어 있다. PMML은 지난 10년간 발전을 거듭하여 표준이 되었으며 데이터에서 패턴을 학습하는 데 사용하는 통계 기술인 인공 지능 네트워크 및 의사결정 트리뿐만 아니라 원시 입력 데이터의 사전 처리 및 모델 출력의 사후 처리를 표현할 수 있다(그림 1 참조).
그림 1. PMML은 예측 모델뿐만 아니라 데이터 사전 처리와 사후 처리를 통합함
PMML의 구조는 예측 솔루션을 빌드하는 과정에서 일반적으로 사용하는 단계를 따르며 이러한 단계에는 다음과 같은 것들이 포함된다.
- 데이터 사전은 문제를 즉시 해결하는 데 가장 유용한 입력 데이터 필드를 식별하고 정의하는 데이터 분석 단계에서 필요한 하나의 제품이다. 이러한 필드로는 숫자 필드, 서수 필드, 범주 필드를 들 수 있다.
- 마이닝 스키마에는 결측치와 이상치를 처리하는 방법을 정의한다. 모델을 작동하게 할 때마다 필수 입력 데이터 필드가 비거나 잘못 표현되는 경우가 자주 있기 때문에 이 기능이 매우 유용하다.
- 데이터 변환 단계에서는 원시 입력 데이터를 사전 처리하여 파생 필드에 삽입하는 데 필요한 처리 방법을 정의한다. 파생 필드는 기능 검출기라고도 하며 관련 정보를 더욱 많이 얻기 위해 입력 필드를 결합하거나 수정한다. 예를 들면, 자동차를 정지시키는 데 사용되는 브레이크의 압력을 예측하기 위해 예측 모델에서 외부의 온도와 물의 존재 여부(비가 오고 있었는지 확인하기 위해)를 원시 입력으로 사용할 수 있다. 파생 필드는 이러한 두 개의 필드를 결합하여 도로 표면이 얼었는지 감지할 수 있다. Ice 필드는 자동차가 정지하는 데 필요한 브레이크 압력을 예측하는 모델의 입력으로 직접 사용된다.
- 모델 정의 단계에서는 모델을 작성하는 데 사용하는 구조와 매개변수를 정의한다. PMML은 다양한 통계 기술을 다룬다. 예를 들면, PMML은 신경망을 표현하기 위해 뉴런 간의 결합 강도뿐만 아니라 모든 신경층을 정의한다. 의사결정 트리에서는 모든 트리 노드뿐만 아니라 단일 술어와 합성 술어를 정의한다.
- 출력 단계에서는 예상 모델 출력을 정의한다. 분류 작업을 하는 경우에는 출력에 예측 클래스뿐만 아니라 모든 가능성 클래스와 연관된 확률이 포함될 수 있다.
- 대상 단계에서는 모델 출력에 적용할 사후 처리 단계를 정의한다. 회귀 작업을 하는 경우에는 이 단계에서 출력을 사람이 쉽게 해석할 수 있는 점수(예측 결과)로 변환할 수 있다.
- 모델 설명 단계에서는 모델을 통해 학습 데이터와 상반되는 테스트 데이터를 전달할 때 얻는 성능 지표를 정의한다. 여기에는 필드 상관, 혼동 매트릭스, 이득 및 리프트 차트(Lift Chart) 그리고 ROC(Receiver Operating Caracteristics) 그래프가 포함된다.
- 모델 확인 단계에서는 예상 모델 출력과 함께 샘플 입력 데이터 레코드 세트를 정의한다. 애플리케이션 간에 모델을 이동할 때마다 매칭 테스트를 패스해야 하기 때문에 이 단계가 매우 중요하다고 할 수 있다. 이렇게 하면 동일한 입력을 새로운 시스템에 제공했을 때 기존 시스템과 같은 결과를 얻을 수 있다. 이러한 경우가 발생하게 되면 모델이 검증되었고 작업에 적용할 준비가 된 것으로 간주된다.
PMML을 이용하면 데이터 사전 처리, 데이터 사후 처리 및 모델링 기술이 포함된 예측 솔루션을 완전히 표현할 수 있다는 점을 감안하면 PMML의 구조와 기본 요소에 위에서 살펴본 8가지 단계가 반영되어 있다고 해도 놀랄만한 일은 아니다.
애플리케이션 간에 솔루션을 공유하는 것은 예측 분석이 성공하는 데 필요한 중요한 요건이 된다. 그러나 모델을 공유하려면 먼저 모델을 작성해야 한다.
모델을 작성하는 과정은 철저한 데이터 분석 단계를 수반하는 몇 개의 단계로 구성된다. 이러한 단계에서는 원시 데이터를 세밀하게 분석하여 모델 작성에 필요한 가장 중요한 정보를 선택한다. (이 과정에서 상기 1단계에서 정의한 데이터 사전이 작성된다.) 또한, 새롭고 창조적인 방식으로 원시 데이터를 변환하고 결합하는 파생 필드를 작성할 수도 있다(3단계). 그런 다음에는 원시 필드와 파생 필드를 모델 학습에 사용할 수 있다. 이러한 프로세스 덕택에 분석 단계에서 검토한 데이터 필드 부분만 최종 모델을 작성하는 데 실제로 사용된다(4단계). 모델을 작성한 다음에는 테스트 데이터 세트를 대상으로 모델 성능을 측정한다(7단계). 해결하려고 하는 문제의 복잡도에 따라 이러한 전체 프로세스를 몇 주간 계속할 수도 있다. 때로는 여러 가지 통계 기술을 사용하여 다양한 모델을 작성한 후, 모델을 서로 비교하는 것이 일반적이다. 최종 모델에는 하나의 기술만 포함되거나 여러 가지 기술이 혼합될 수 있으며 후자의 경우에는 PMML 파일에 다수의 모델이 포함된다.
모델 배치는 일반적으로 애플리케이션에서 수행하는 작업으로 모델 작성 프로세스와는 거의 분리되어 있으며 이 단계에서 예측 솔루션이 효과적으로 작동하게 된다. 일반적으로 배치 환경은 예측 솔루션에서 모니터하도록 된 프로세스 및 시스템과 잘 통합된다. 그러나 인터넷 연결 속도가 더욱 빨라지면 이러한 시스템이 물리적으로 가까이 있을 필요가 없다. 인터넷을 통해 웹 서비스를 사용하면 쉽게 통합할 수 있다. 이러한 경우에는 필요에 따라 처리 능력을 조정하여 실시간 요구사항을 이행하고 대용량 데이터를 처리하는 클라우드 컴퓨팅의 출현으로 다양한 혜택을 누릴 수 있게 되었다.
예측 분석 모델이 작동하게 되면 아마도 성능이 악화되어 예측 분석 모델을 다시 고쳐야 할 때까지 일반적으로 수개월이나 수년 동안 예측 분석 모델이 해당 작업을 수행하기를 기대한다. 예측 분석 모델을 고쳐야 하는 경우에는 기존 모델 대신 다른 모델을 작성하여 배치한다. 그러나 대개는 모델을 자주 고쳐야 하며 이 때문에 상호 운용성과 개방형 표준이 강조된다.
시스템마다 처리하는 방식이 다르기 때문에 PMML과 같은 언어가 없으면 예측 솔루션을 배치하기가 매우 어렵다. 하나의 시스템에서 다른 시스템으로 모델을 이동할 때마다 장시간의 변환 프로세스를 거쳐야 하며 이 과정에서 오류가 발생하거나 왜곡이 일어나기 쉽다. PMML을 사용하면 프로세스가 간단해진다. 최근에 필자는 대형 금융회사에서 자사의 데이터 마이닝 전문가가 열심히 작업하여 작성한 모델을 6개월에서 1년에 걸쳐 전개했다는 사실을 알고 놀랐다. PMML을 사용하면 단 몇 분 만에 전개할 수 있다.
PMML을 이용하면 애플리케이션 A에서 B 그리고 C로 예측 솔루션을 쉽게 공유할 수 있으며 모델 작성 단계가 완료되는 즉시 예측 솔루션을 작동할 수 있다. 예를 들면, IBM SPSS Statistics에서 모델을 작성하여 클라우드 컴퓨팅이 주는 혜택을 즉시 누릴 수 있다. 클라우드 컴퓨팅을 이용하면 Zementis 예측 의사결정 플랫폼인 ADAPA에서 모델을 전개할 수 있다. (관련 링크는 참고자료를 확인한다.) 또는 데이터 웨어하우스 부근에 모델이 상주하는 IBM InfoSphere™로 모델을 이동할 수 있다. 게다가 독일 콘스탄츠 대학에서 개발했으며 데이터 플로우를 작성하고 시각화하는 데 필요한 오픈 소스 도구인 KNIME로 모델을 이동할 수 있다. 애플리케이션 간에 모델과 솔루션을 상호 운용할 수 있게 하는 것이 PMML의 기능이다. 또한, PMML을 이용하면 일반 사용자가 통계 도구 및 모델을 쉽게 사용할 수 있다. 현재는 Microsoft® Office Excel에서 해당 데이터를 선택하고 Score를 클릭하여 이전에 직접 Zementis ADAPA 플랫폼에 배치한 예측 모델로부터 도움을 받을 수 있다.
이제 예측 유지보수 분야를 위한 PMML 애플리케이션 및 예측 분석 기능을 살펴보자.
예측 유지보수: PMML 및 데이터 마이닝 애플리케이션
이름에서 알 수 있듯이 예측 유지보수는 안전을 보장하기 위한 명확한 방법으로 결함이나 장애가 발생하기 전에 도구나 프로세스를 변경하거나 유지보수할 수 있는 기능을 의미한다. 에너지 변환기, 양수기 및 공기 펌프, 차단기 및 밸브와 같은 기계류뿐만 아니라 교량 및 건물과 같은 구조물의 현재 상태를 보고하는 작고 비용 효율적인 센서를 사용할 수 있게 되면서 이러한 모든 것이 가능해졌다.
필자는 회전 설비의 고장을 초기에 발견하는 것과 관련된 프로젝트에 참여하는 즐거움을 누린 적이 있다. 예측 유지보수를 하지 않으면 고장이 난 이후에야 중단된 설비를 처리할 수 있다. 이렇게 되면 산업의 프로덕션 라인에서는 기계를 수정하거나 대체할 때까지 운영을 전부 중지해야 한다. 예측 유지보수를 하면 설비를 수리하거나 대체하는 작업이 유휴 시간 즉, 설비가 적게 가동되는 시간에 이루어지거나 스케줄된 유지보수 주기의 일부로 수행되도록 일정을 계획할 수 있다. 필자와 우리 팀은 설비 고장을 초기에 발견하는 것과 관련해서 처음에 여러 가지 문제에 봉착했다. 입력 데이터는 매 시간마다 수 초 동안 캡처한 진동 신호만으로 구성되었다. 많은 회전 장치와 센서를 모두 하나의 랙에 집어넣었기 때문에 인접 장비와의 간섭으로 인해 신호의 품질 손상되었다.
이러한 간섭이 문제가 되었음에 불구하고 데이터 마이닝과 분석을 사용하여 이러한 잡음을 성공적으로 제거할 수 있었다. 이를 위해 PMML을 지원하는 오픈 소스 통계 패키지인 R을 주로 사용했다. 그런 다음, IBM SPSS Statistics를 사용하여 여러 가지 모델을 작성했다. 최종 모델은 높은 정확도로 설비 고장을 예측하는 신경망이었다. 솔루션을 전부 PMML로 표현했기 때문에 이미 클라이언트 사이트에 설치한 Zementis ADAPA 플랫폼에 모델을 쉽게 전개할 수 있었다. 그 후에는 센서 입력이 우리가 의도한 대로 솔루션에 도달할 수 있게 나머지 과제에 집중했다. 또한, 모델에서 생성한 예측 데이터가 공장 작업장에서 구현된 지침과 유지보수 프로세스의 일부로 제대로 사용되는지 확인했다.
예측 분석 모델을 모니터링 도구로 사용하면 장애가 발생하지 않도록 예방할 수 있다. 예측 솔루션은 장애가 발생하기 전에 경보를 통해 장애를 알려줌으로써 더욱 안전한 환경을 보장하는 유용한 도구이다. 석유화학 업계의 경우에는 석유 시추 및 탐사와 관련된 안전 장치 목록의 또 다른 예방 도구로 예측 분석을 사용할 수 있으며 또한 그렇게 하지 않으면 안 된다.
PMML은 대부분의 통계 도구에서 쉽게 내보낼 수 있다. 위에서 언급한 바와 같이 상위 분석 회사들의 제품에는 PMML 파일을 내보내고 가져오는 기능이 있다. 예를 들면, IBM SPSS Statistics에서는 해당하는 모든 모델 매개변수를 선택한 후 PMML 모델을 XML 파일(PMML은 XML 기반임)로 내보내기를 선택하여 PMML 모델을 내보낼 수 있다. 신경망 모델의 경우에는 일반적으로 매개변수를 통해 신경망에 사용된 뉴런과 계층의 수를 지정한다. 이 단계를 완료한 후에는 모델 학습을 하기 전에 Export 탭을 선택하여 해당 모델을 저장한다. 최종 모델이 아니라 하더라도 솔루션을 PMML 파일로 저장하는 것이 좋다. 이렇게 하면 모델이 최종 완료되기 전에 수행한 모든 과정을 PMML 레코드에 유지할 수 있다. 팀 구성원이라면 누구나 이 레코드를 사용하여 적합한 매개변수와 우수 사례를 선택할 수 있다.
이제까지 PMML의 개념과 중요성을 살펴보았으므로 이제 PMML 자체를 깊이 살펴보도록 하자. 위에서 언급한 바와 같이 PMML의 구조에는 원시 입력 데이터 필드를 정의하는 단계("데이터 사전" 단계)에서부터 모델이 올바르게 배치되었는지 확인하는 단계("모델 확인" 단계)에 이르기까지, 예측 솔루션을 작성하는 데 일반적으로 사용하는 8개의 단계가 반영되어 있다.
Listing 1에는 세 개의 필드 즉, 숫자 입력 필드(Value), 범주 입력 필드(Element) 및 숫자 출력 필드(Risk)와 함께 솔루션의 PMML 요소인
DataDictionary의 정의가 표시되어 있다.
Listing 1.
DataDictionary 요소
<DataDictionary numberOfFields="3">
<DataField dataType="double" name="Value" optype="continuous">
<Interval closure="openClosed" rightMargin="60" />
</DataField>
<DataField dataType="string" name="Element" optype="categorical">
<Value property="valid" value="Magnesium" />
<Value property="valid" value="Sodium" />
<Value property="valid" value="Calcium" />
<Value property="valid" value="Radium" />
</DataField>
<DataField dataType="double" name="Risk" optype="continuous" />
</DataDictionary>
|
Value 필드에서 Interval은 유효값의 범위를 마이너스 무한대에서 60까지로 정의한다. 60이 넘는 값은 올바르지 않은 값으로 정의된다. (여기서는 표시하지
않았지만 PMML 요소 MiningSchema를 사용하여 올바르지 않은 값과 누락된 값에 대한 적절한 처리 방법을 정의한다.) Element는 범주형 필드이므로
올바른 값이 명시적으로 표시된다. 이러한 특정 필드를 위한 데이터 피드에 요소 Iron이 포함된 경우, 이 요소는 올바르지 않은 값으로 처리된다.
그림 2에는 입력 계층이 3개의 뉴런으로 구성되어 있고 숨겨진 계층과 출력 계층이 각각 2개의 뉴런과 하나의 뉴런으로 구성된 신경망 모델이 그래픽으로 표현되어 있다. 예상하는 바와 같이 PMML은 이러한 구조를 완전히 표현할 수 있다.
그림 2. 예측 기능이 수행되기 전에 데이터가 일련의 계층을 통해 전달되는 간단한 신경망 모델
Listing 2에는 숨겨진 계층과 이 계층에 있는 뉴런의 정의뿐만 아니라 입력 계층에 있는 뉴런(0, 1, 2)과 숨겨진 계층에 있는 뉴런(3, 4)의 결합 강도가 표시되어 있다.
Listing 2. PMML로 신경층과 뉴런 정의하기
<NeuralLayer numberOfNeurons="2">
<Neuron id="3" bias="-3.1808306946637">
<Con from="0" weight="0.119477686963504" />
<Con from="1" weight="-1.97301278112877" />
<Con from="2" weight="3.04381251760906" />
</Neuron>
<Neuron id="4" bias="0.743161353729323">
<Con from="0" weight="-0.49411146396721" />
<Con from="1" weight="2.18588757615864" />
<Con from="2" weight="-2.01213331163562" />
</Neuron>
</NeuralLayer>
|
PMML을 사용하기는 어렵지 않다. PMML으로 표현하려고 하는 모델링 기술의 복잡도에 따라 PMML을 사용하는 방법도 복잡해진다. 예측 분석과 관련해서 사실상 PMML은 많은 사람들이 갖고 있는 비밀과 은밀한 감정을 공개하는 역할을 한다. PMML을 사용하는 모든 예측 솔루션은 같은 순서의 동일한 언어 요소로 표현된다.
회사 내에서는 PMML을 애플리케이션 사이에서뿐만 아니라 부서와 서비스 제공자 및 외부 벤더 간의 공통 언어로 사용할 수 있다. 이러한 경우에는 PMML이 예측 솔루션을 교환하는 데 필요한 하나의 명확한 솔루션을 정의하는 단일한 표준이 된다.
PMML을 이용하면 예측 솔루션을 즉시 배치할 수 있다. PMML은 예측 분석 모델을 표현하는 사실상의 표준이며 현재 모든 상위 상업용 도구 및 오픈 소스 통계 도구에서 PMML을 지원하고 있다. 센서가 더욱 많이 배치되고 데이터 생성량이 증가하면서 모든 데이터를 이해하는 데 PMML과 같은 개방형 표준과 예측 분석 기능이 중요한 역할을 하게 된다. 사기 적발, 영화 추천, 인명 구조 의료 솔루션 및 예측 유지보수는 가능한 몇 가지 사례에 불과하다. 그러므로 적극적으로 탐구하여 관련된 솔루션을 개발하도록 하자.
교육
- Representing predictive solutions in PMML: Move from raw data to predictions(Alex Guazzelli저, developerWorks, 2010년 9월):
PMML(Predictive Model Markup Language)이
Association Rules, Cluster Models, Neural Networks 및 Decision Trees 등의
예측 모델링 기술을 표현하는 방법을 학습하자. 해당 언어에 대해 더 깊이 연구해보고
데이터 표현, 변환 및 완료된 예측 솔루션을 표현하는 함수를 탐색해보자.
- PMML in Action: Unleashing the Power of Open Standards for Data Mining and Predictive Analytics(Alex Guazzelli, Wen-Ching Lin, Tridivesh Jena, 2010년 5월 CreateSpace): PMML을 효과적으로 살펴봄으로써 예측 모델을 표현하는 방법을 배운다.
- Data Mining Group(DMG): PMML(Predictive Model Markup Language)과 같은 데이터 마이닝 표준을 개발하는, 이러한 벤더 주도형 독립 컨소시엄에서 다양한 참고자료를
탐구하자.
- Zementis PMML Resources 페이지: 클러스터링 모델, 의사결정 트리, Naive Bayes Classifier, 신경망 모델, 회귀 모델, 균형성과표, SVM(Support Vector Machine)과
같은 전체 PMML 사례를 검토하자.
- Wikipedia의 PMML 페이지: PMML의 개요와 스펙에 대한 링크 등을 확인할 수 있다.
- Wikipedia의 Predictive analytics 페이지: 이러한 통계 분석 분야에 공통으로 사용되는 통계 기술과 애플리케이션 및 유형에 관해 읽어보자.
- Wikipedia의 Data Mining 페이지: 이 페이지를 방문하여 데이터에서 패턴을 추출하는 프로세스에 관해 자세히 읽어보자.
- developerWorks Industries 영역: 특정 산업에 적합한 개발자용 최신 기술 자료를 모두 얻자.
- 산업용 라이브러리: 기술 문서와 팁, 튜토리얼, 표준 및 IBM Redbooks는 developerWorks 산업용 라이브러리를 참고하자.
- My developerWorks: developerWorks와 관련된 경험을 개인화할 수 있다.
- developerWorks 기술 행사 및 웹 캐스트: 이러한 세션에 참가하여 최신 기술에 대한 정보를 얻을 수 있다.
- Twitter의 developerWorks 페이지: 오늘 가입하여 developerWorks 트윗을 팔로우하자.
- developerWorks 팟캐스트: 소프트웨어 개발자의 흥미로운 인터뷰와 토론을 확인할 수 있다.
제품 및 기술
- IBM SPSS Statistics 18(이전 SPSS Statistics): 고급 통계 분석 기능을 직접 사용해보자. 통계와 관련하여 초보이건 숙련자이건 관계없이
이러한 포괄적인 도구 세트를 이용하면 원하는 모든 작업을 수행할 수 있다.
- ADAPA: 혁신적인 예측 분석 의사결정 관리 플랫폼인 ADAPA를 사용해보자. 이 플랫폼은 클라우드에서 서비스로 사용하거나 현장에서 사용할 수 있다. 이 플랫폼은
데이터 마이닝 모델과 비즈니스 로직을 전개하여 실제로 사용할 수 있도록 하는 빠르고 안전하고 확장 가능한 환경을 제공한다.
- IBM WebSphere Application Server: IBM WebSphere Application Server를 사용하여 애플리케이션 인프라 비용을 줄이면서 강건하고 민첩하며 재사용 가능한
SOA 비즈니스 애플리케이션과 모든 유형의 서비스를 작성하고 배치, 관리하자.
- IBM 제품 평가판: IBM SQA Sandbox의 온라인 시험판을 다운로드하거나 살펴보고
DB2®, Lotus®, Rational®, Tivoli® 및 WebSphere® 애플리케이션 개발 도구 및 미들웨어 제품을 사용해 볼 수 있다.
토론
- PMML(Predictive Model Markup Language) 그룹: LinkedIn에서 PMML 관련 토론에 참여하자.
- developerWorks 포럼 & 블로그를 통해 developerWorks 커뮤니티에 참여하자.

Alex Guazzelli 박사는 Zementis. Inc. 분석 부문 부사장으로 PMML 기반의 의사결정 플랫폼인 ADAPA를 기반으로 핵심 기술과 예측 솔루션을 개발하는 작업을 책임지고 있다. Guazzelli 박사는 University of Southern California에서 전산학 박사학위를 받았으며 최근에는"PMML in Action: Unleashing the Power of Open Standards for Data Mining and Predictive Analytic"라는 책을 공동 저술했다.