개요 (ADP 명령)

자동화된 데이터 준비는 그렇지 않으면 수동으로 수행되는 지루하고 반복적인 데이터 준비 태스크를 자동화하여 분석을 위해 데이터를 준비하는 데 도움이 됩니다. 수행하는 조작은 분석 속도, 예측력 및 견고성을 향상시킵니다. 구성요소의 주요 기능은 기능 공간 구성-기존 필드의 변환 및 조합을 통해 데이터에서 유용한 예측변수 세트를 발견하는 것입니다. 기능 선택 은 관련 없는 필드를 선별하여 속성 공간을 좁히는 기능을 제공하지만, 자동화된 데이터 준비는 알고리즘을 느리게 하거나 혼동하는 관련 없는 필드를 자동으로 제거하고 예측력을 높이는 새 필드를 작성하기 위해 선택 및 구성 기능을 쌍으로 합니다.

지원되는 조작은 추가 분석에서 데이터에 대해 실행되는 알고리즘을 알지 못하고 수행됩니다. 이는 일반화된 데이터 클리너가 아니며 비즈니스 규칙을 이해하지도 않습니다. 기본 정리 및 무결성 검사는 IBM® SPSS® Statistics 데이터 유효성 검사 프로시저를 사용하여 수행할 수 있습니다.

옵션

날짜 및 시간 처리. 날짜를 포함하는 필드 및 참조 날짜가 계산된 이후의 기간을 포함하는 새 필드에서 연도, 월, 일을 추출할 수 있습니다. 마찬가지로 시간을 포함하는 필드 및 참조 시간이 계산된 이후의 시간을 포함하는 새 필드에서 시간, 분 및 초를 추출할 수 있습니다.

선별. 결측값이 너무 많은 필드와 고유 값이 너무 많거나 단일 값에 너무 많은 값이 집중된 범주형 필드를 선별하여 추가 분석에서 제외할 수 있습니다.

조정. 연속형 입력은 z 스코어 또는 최소-최대 변환을 사용하여 선택적으로 척도 조정할 수 있습니다. 연속 목표는 Cox 사용하여 선택적으로 재조정할 수 있습니다.

변환. 이 프로시저는 범주형 입력의 유사한 범주, 연속형 입력의 구간 값을 합치고 주성분 분석을 사용하여 연속형 입력에서 새 입력 필드를 구성하고 선택하는 데 사용되는 변환을 제안할 수 있습니다.

기타 대상 및 입력 처리. 이 프로시저는 이상값 처리를 위한 규칙을 적용하고, 결측값을 대체하고, 명목 필드의 범주를 코딩변경하고, 연속형 및 순서 필드의 측정 수준을 조정할 수 있습니다.

출력. 이 프로시저는 제안된 조작을 포함하는 XML 파일을 작성합니다. 이는 모델 XML 병합 대화 상자 (유틸리티> 모델 XML 병합) 를 사용하여 모델 XML 파일과 병합하거나 TMS IMPORT를 사용하여 명령 구문으로 변환할 수 있습니다.

기본 스펙

기본 지정 사항은 입력 및 선택적으로 대상을 지정하는 FIELDS 하위 명령과 변환 규칙을 저장해야 하는 위치를 지정하는 OUTFILE 하위 명령이 있는 ADP 명령입니다.

구문 규칙

VARIABLES 및 OUTFILE 부속 명령은 필수입니다. 다른 모든 부속 명령은 선택적입니다.
하위 명령은 임의의 순서로 지정할 수 있습니다.
각 하위 명령의 단일 인스턴스만 허용됩니다.
하위 명령 내에서 키워드가 두 번 이상 지정되면 오류가 발생합니다.
구문 차트에 표시된 괄호, 등호 및 슬래시가 필요합니다.
명령 이름, 하위 명령 이름 및 키워드의 전체 철자를 입력해야 합니다.
비어 있는 하위 명령은 허용되지 않습니다.

제한사항

SPLIT FILE 는 이 명령에서 무시됩니다.