IBM SPSS Data Preparation 소개

IBM® SPSS® Data Preparation은 데이터 준비 단계를 능률화하는 고급 기술을 활용하여 더 빠르고 정확한 데이터 분석 결과를 제공합니다. 자동화된 데이터 준비 프로시저에서 빠른 결과를 선택하거나, 또는 기타 방법들을 선택하여 보다 고난도의 데이터 세트를 준비하십시오. 의심스럽거나 올바르지 않은 케이스, 변수 및 데이터 값을 쉽게 식별할 수 있습니다. 누락된 데이터의 패턴을 열람하고, 변수 분포를 요약하여, 명목 속성에 맞게 설계된 알고리즘을 보다 정확하게 활용하십시오.

이 모듈은 온프레미스의 SPSS Professional Edition과 구독 플렌의 Base Edition에 포함되어 있습니다.

주목할 기능

변수 탭

데이터 검증 대화상자는 데이터의 유효성을 검증하는 데 사용됩니다. 변수 탭에는 파일의 변수가 표시됩니다. 원하는 변수를 선택한 다음 분석 변수 목록으로 이동하여 시작할 수 있습니다.

기본 검사

파일의 변수 및 사례에 적용할 기본 검사를 지정할 수 있습니다. 예를 들면, 결측된 값이나 비어 있는 사례의 비율이 높은 변수를 파악하는 보고서를 얻을 수 있습니다.

표준 및 사용자 정의 규칙

유효하지 않은 값, 즉 유효한 범위 밖의 값 또는 누락된 값을 식별하는 개별 변수에 규칙을 적용합니다. 고유 규칙 또는 교차 변수 규칙을 만들거나 사전 정의된 규칙을 적용할 수도 있습니다.

조언

자동화된 데이터 준비를 위한 권장사항이 제공되므로 사용자는 해당 권장사항을 상세히 분석하고 검토할 수 있습니다.

자동으로 한 번에 데이터 준비

수작업으로 이루어지는 데이터 준비 과정은 복잡하고 시간이 오래 걸립니다. 신속한 결과가 필요한 경우 ADP 프로시저를 사용하면 한 번에 효율적으로 품질 오류를 발견 및 수정하고 결측된 값을 대체할 수 있습니다. ADP 기능은 포괄적 권장사항과 시각적 효과가 포함되어 이해하기 쉬운 보고서를 제공하므로 분석에 사용할 올바른 데이터를 결정하는 데 도움이 됩니다.

데이터 준비를 위한 추가 옵션

자동으로 데이터 검사를 수행하고 데이터 검증 프로시저를 사용하여 시간이 오래 걸리고 번거로운 수작업을 없앨 수 있습니다. 이 프로시저를 통해 각 변수의 측정값 레벨 —범주형이든 연속형이든 관계없이 —에 따라 데이터 검사를 수행하도록 규칙을 적용할 수 있습니다. 그런 다음 분석하기 전에 데이터 유효성을 판별하고 사용자의 판단에 따라 의심 사례를 제거하거나 정정합니다.

다양한 기능에 액세스

SPSS Data Preparation에는 데이터 유효성 검증, 자동화된 데이터 준비, 최적화된 비닝 및 특이한 케이스 식별과 같은 기능이 포함되어 있습니다.

척도 변수 저장 또는 잘라내기 지점 설정

최적의 비닝 작업을 통해, Naive Bayes및 logit 모델과 같은 명목 속성에 맞게 설계된 알고리즘을 보다 정확하게 사용할 수 있습니다. 최적의 비닝 작업을 통해 스케일 변수의 절단점을 설정할 수 있습니다.

세 가지 최적 비닝 유형 중에서 선택하기

모델 작성 전에 데이터의 사전 처리를 위해 다음의 최적 비닝 유형 중 하나를 선택하십시오.
1) 비지도형: 계수가 동일한 구간을 설정합니다.
2) 지도형: 대상 변수를 고려하여 절단점을 판별합니다. 이 방법은 비지도형보다 더 정확합니다. 그러나 보다 복잡한 계산을 요구합니다.
3) 하이브리드형: 비지도형과 지도형을 결합한 방식입니다. 이 방법은 많은 양의 개별 값이 있는 경우 특히 유용합니다.

제품 이미지

기술 요구사항

SPSS Data Preparation을 구매하는 방법

  • 온프레미스의 경우: Professional Edition 구매
  • 구독 플랜의 경우: Base Edition 구매

하드웨어 요구사항

  • 프로세서: 2GHz 이상
  • 디스플레이: 1024x768 이상
  • 메모리: 4GB RAM 필요, 8GB RAM 이상 권장
  • 디스크 공간: 2GB 이상

Next Steps

SPSS Statistics 무료 체험

지금 구매하고 오늘부터 시작하기