데이터 검증

데이터 검증 대화 상자를 사용하여 활성 데이터 세트에서 의심이 되는 유효하지 않은 케이스, 변수 및 데이터 값을 식별할 수 있습니다.

예. 데이터 분석가는 월별 고객 만족 보고서를 클라이언트에게 제공해야 합니다. 분석가가 매월 받는 데이터는 불완전한 고객 ID, 범위를 벗어난 변수 값, 공통적으로 오류 상태로 입력된 변수 값의 조합에 대한 품질 확인이 수행되어야 합니다. 분석가는 데이터 검증 대화 상자를 사용하여 고객을 고유하게 식별하는 변수를 지정하고, 유효한 변수 범위에 대한 단일-변수 규칙을 정의하고, 불가능한 조합을 찾는 교차-변수 규칙을 정의할 수 있습니다. 이 프로시저는 문제 케이스 및 변수 보고서를 리턴합니다. 또한 데이터는 매월 동일한 데이터 요소를 가지고 있으므로 분석가는 다음 달에도 새 데이터 파일에 해당 규칙을 적용할 수 있습니다.

통계. 이 프로시저는 여러 확인에 실패한 변수, 케이스 및 데이터 값 목록, 단일-변수 및 교차-변수 규칙 위반 수, 분석 변수의 단순 기술통계 요약을 생성합니다.

가중치. 이 프로시저는 가중값 지정 사항을 무시하고 대신 이를 다른 분석 변수로 처리합니다.

데이터를 검증하려면 다음을 수행하십시오.

  1. 메뉴에서 다음을 선택합니다.

    데이터 > 유효성 검증 > 데이터 유효성 검증 ...

  2. 기본 변수 확인 또는 단일-변수 검증 규칙을 기준으로 검증할 하나 이상의 분석 변수를 선택하십시오.

    또는 다음을 수행할 수 있습니다.

  3. 교차-변수 규칙 탭을 클릭하고 하나 이상의 교차-변수 규칙을 적용하십시오.

선택적으로 다음을 수행할 수 있습니다.

  • 중복 또는 불완전 ID를 확인할 하나 이상의 케이스 식별 변수를 선택하십시오. 또한 케이스 ID 변수는 케이스별 결과의 레이블을 지정하는 데 사용됩니다. 두 개 이상의 케이스 ID 변수가 지정되면 해당 값의 조합이 케이스 식별자로 처리됩니다.

측정 수준을 알 수 없는 필드(F)

측정 수준 경고는 데이터 세트에서 하나 이상의 변수(필드)에 대해 측정 수준을 알 수 없을 때 표시됩니다. 측정 수준은 이 프로시저의 계산 결과에 영향을 미치기 때문에 모든 변수에 정의된 측정 수준이 있어야 합니다.

데이터 스캔. 활성 데이터 세트의 데이터를 읽고 현재 알 수 없는 측정 수준이 있는 필드에 기본 측정 수준을 할당합니다. 데이터 세트가 큰 경우 시간이 걸릴 수 있습니다.

수동으로 할당. 알 수 없는 측정 수준이 있는 필드를 모두 나열하는 대화 상자를 엽니다. 이 대화 상자에서 해당 필드에 측정 수준을 할당할 수 있습니다. 데이터 편집기의 변수 보기에서도 측정 수준을 할당할 수 있습니다.

이 프로시저에 대해 측정 수준이 중요하기 때문에 모든 필드에 정의된 측정 수준이 있을 때까지는 대화 상자에 액세스하여 이 프로시저를 실행할 수 없습니다.