주목받는 기능

변수 탭

데이터 검증 대화상자는 데이터의 유효성을 검증하는 데 사용됩니다. 변수 탭에는 파일의 변수가 표시됩니다. 원하는 변수를 선택한 다음 분석 변수 목록으로 이동하여 시작할 수 있습니다.

기본 검사

파일의 변수 및 사례에 적용할 기본 검사를 지정할 수 있습니다. 예를 들면, 결측된 값이나 비어 있는 사례의 비율이 높은 변수를 파악하는 보고서를 얻을 수 있습니다.

표준 및 사용자 정의 규칙

올바르지 않은 값(올바른 범위를 벗어난 값 또는 결측된 값)을 파악하는 개별 변수에 규칙을 적용합니다. 고유 규칙 또는 교차 변수 규칙을 만들거나 사전 정의된 규칙을 적용할 수도 있습니다.

권장사항

자동화된 데이터 준비를 위한 권장사항이 제공되므로 사용자는 해당 권장사항을 상세히 분석하고 검토할 수 있습니다.

한 번에 자동으로 데이터 준비

수작업으로 이루어지는 데이터 준비 과정은 복잡하고 시간이 오래 걸립니다. 신속한 결과가 필요한 경우 ADP 프로시저를 사용하면 한 번에 효율적으로 품질 오류를 발견 및 수정하고 결측된 값을 대체할 수 있습니다. ADP 기능은 포괄적 권장사항과 시각적 효과가 포함되어 이해하기 쉬운 보고서를 제공하므로 분석에 사용할 올바른 데이터를 결정하는 데 도움이 됩니다.

데이터 준비를 위한 추가 옵션

자동으로 데이터 검사를 수행하고 데이터 검증 프로시저를 사용하여 시간이 오래 걸리고 번거로운 수작업을 없앨 수 있습니다. 이 프로시저를 사용하면 각 변수의 측정 레벨(범주별 또는 지속형)에 따른 데이터 검사 수행 규칙을 적용할 수 있습니다. 그런 다음 분석하기 전에 데이터 유효성을 판별하고 사용자의 판단에 따라 의심 사례를 제거하거나 정정합니다.

척도 변수 저장 또는 잘라내기 지점 설정

Optimal Binning 프로시저를 사용하면 명목 속성(예: Naive Bayes 및 로짓 모델)을 위해 설계된 알고리즘을 더 정확하게 사용할 수 있습니다. Optimal Binning을 사용하면 척도 변수를 저장하거나 잘라내기 지점을 설정할 수 있습니다.

세 가지 Optimal Binning 유형 중에서 선택

모델을 구축하기 전 데이터를 사전 처리하기 위해 다음 세 가지 Optimal Binning 유형 중에서 하나를 선택합니다. 1) 무감독: 동일한 개수의 저장소를 만듭니다. 2) 감독: 대상 변수를 고려하여 잘라내기 지점을 결정합니다. 이 방법은 무감독 유형보다 더 정확하지만 더 높은 계산 성능이 필요합니다. 3) 하이브리드 접근 방식: 감독 및 무감독 접근 방식을 결합합니다. 이 방법은 특히 개별 값이 대량으로 있는 경우 유용합니다.

기술 요구사항

소프트웨어 요구사항

IBM SPSS Data Preparation을 사용하려면 유효한 IBM SPSS Statistics Base 라이센스가 필요합니다.

  • 필수 소프트웨어: IBM SPSS Statistics

하드웨어 요구사항

  • 프로세서: 2GHz 이상
  • 디스플레이: 1024x768 이상
  • 메모리: 4GB RAM 필요, 8GB 이상의 RAM 권장
  • 디스크 공간: 2GB 이상

세부기능을 확인하세요

구매하고 시작하세요