학습서: SPSS Statistics를 사용한 분석

이 학습서는 IBM® SPSS® Statistics를 사용하여 Db2® 데이터베이스에 저장된 데이터를 분석하는 방법에 대해 설명합니다.

여기에서 이 학습서의 비디오 버전을 볼 수 있습니다.

이 학습서는 다음 태스크 수행 방법을 표시합니다.

  • SPSS Statistics에 데이터베이스 연결.
  • 분석 준비.
  • 데이터 분석.

필요 시간

5분

시나리오

당신은 운동 기구 제조업체에 근무하는 데이터 과학자입니다. 운동 기구 제조업체의 제품을 판매하는 상점의 위치를 알고 싶습니다. 이 시나리오에서는 이미 Db2 데이터베이스에 로드된 샘플 데이터를 사용합니다.

난이도

초급

대상

데이터 과학자

분석 준비

이 태스크 정보

데이터베이스 연결을 설정한 후 올바른 데이터를 식별하고 이를 구조화함으로써 분석 준비를 시작할 수 있습니다. 다음 단계에 따라 데이터 분석을 준비하십시오.

프로시저

  1. 데이터베이스 마법사에서 다음을 클릭하여 데이터베이스에서 테이블 목록을 표시하십시오.
  2. 다음 단계에 따라 각 소매 사이트에 대해 별도의 항목을 확보하십시오.
    1. 사용 가능 테이블 목록에서 GOSALESRT.RETAILER_SITE를 선택하십시오.
    2. GOSALESRT.RETAILER_SITE를 펼치십시오.
    3. RETAILER_SITE_CODE를 선택하십시오.
    4. 오른쪽 화살표가 있는 단추를 클릭하여 RETAILER_SITE_CODE이 순서로 필드 검색 목록으로 이동하십시오.
  3. 다음 단계에 따라 소매점이 있는 국가를 찾으십시오.
    1. 사용 가능 테이블 목록에서 GOSALES.COUNTRY를 선택하십시오.
    2. GOSALES.COUNTRY를 펼치십시오.
    3. COUNTRY_EN을 선택하십시오.
    4. 오른쪽 화살표가 있는 단추를 클릭하여 COUNTRY_EN이 순서로 필드 검색 목록으로 이동하십시오.
  4. 다음 단계에 따라 공통점이 있는 컬럼에서 GOSALESRT.RETAILER_SITE와 GOSALES.COUNTRY를 조인하십시오.
    1. 데이터베이스 마법사에서 다음을 클릭하여 관계 지정 페이지를 여십시오.
    2. GOSALES.COUNTRY 목록에서 국가 코드를 선택하십시오.
    3. GOSALESRT.RETAILER_SITE 목록에서 소매 국가 코드를 선택하십시오.
    4. 조인 유형 목록에서 내부를 선택하십시오.
    5. 조인을 클릭하십시오.
  5. 각 소매 사이트와 소매 사이트가 있는 국가에 대해 별도의 항목이 있는 테이블을 작성하려면 완료를 클릭하십시오.

데이터 분석

마지막으로 데이터를 분석하고 분석 결과를 시각화합니다. 다음 단계를 수행하십시오.

프로시저

  1. IBM SPSS 통계 데이터 편집기에서 분석 > 기술 통계 > 빈도를 클릭하여 빈도 창을 여십시오.
  2. 빈도 창에서 COUNTRY_EN을 선택하여 각 국가에 있는 소매 사이트의 수를 계산하십시오.
  3. 오른쪽 화살표가 있는 단추를 클릭하여 COUNTRY_EN변수 목록으로 이동하십시오.
  4. 차트를 클릭하여 빈도: 차트 창을 여십시오.
  5. 빈도: 차트 창의 차트 유형 섹션에서 막대형 차트를 클릭하여 막대형 차트로 결과를 시각화하십시오.
  6. 계속을 클릭하여 선택을 확인하십시오.
  7. 빈도 창에서 확인을 클릭하여 데이터를 분석하십시오.

    분석 결과는 IBM SPSS 통계 표시기 창에 표시됩니다. IBM SPSS 통계 표시기 창에는 여러 국가에서 소매 사이트의 분포를 표시하는 테이블이 있습니다. 이 테이블은 총계와 백분율을 표시합니다.

    표 1. 출력 테이블
      (국가) 빈도 퍼센트 유효 퍼센트 누적 퍼센트
    유효 오스트레일리아 20 2.5 2.5 2.4
      오스트리아 25 3.0 3.0 5.3
      벨기에 20 2.4 2.4 7.7
      브라질 16 1.9 1.9 9.6
      캐나다 56 6.6 6.6 16.2
      중국 35 4.1 4.1 20.3
      덴마크 17 2.0 2.0 22.3
      핀란드 19 2.2 2.2 24.6
      프랑스 64 7.6 7.6 32.1
      독일 61 7.2 7.2 39.3
      이탈리아 30 3.5 3.5 42.9
      일본 66 7.8 7.8 50.6
      한국 20 2.4 2.4 53.0
      멕시코 17 2.0 2.0 55.0
      네덜란드 33 3.9 3.9 58.9
      싱가포르 28 3.3 3.3 62.2
      스페인 21 2.5 2.5 64.7
      스웨덴 26 3.1 3.1 67.8
      스위스 35 4.1 4.1 71.9
      영국 57 6.7 6.7 78.6
      미국 181 21.4 21.4 100
      총계 847 100 100  
    참고: 실제 SPSS 출력 테이블의 레이아웃은 여기에 표시된 내용과 약간 다릅니다. 여기에 표시되는 출력은 읽기 쉽도록 하기 위해 형식을 다시 지정한 것입니다.

    IBM SPSS 통계 표시기 창에는 결과를 시각화하는 막대형 차트도 들어 있습니다. 이 막대형 차트는 이제까지 미국에 대부분의 소매 사이트가 있음을 표시합니다.

    결과 막대형 차트

학습서 요약

데이터베이스 마법사에 ODBC 연결을 추가하여SPSS Statistics에 데이터베이스를 연결하십시오. Db2 연결 정보 페이지의 ODBC DSN(data source name) 설정 섹션에는 ODBC 연결을 설정하는 데 필요한 정보가 들어 있습니다. 분석을 준비하려면 데이터베이스 마법사사용 가능 테이블 목록에서 필요한 정보가 들어 있는 테이블과 컬럼을 선택하십시오. 관계 지정 페이지를 사용하여 분석의 기본이 되는 테이블을 작성하십시오. 예를 들어 공통 컬럼에서 테이블을 조인할 수 있습니다. 특정 기준에 맞는 항목 수를 세고 결과를 시각화하려면 빈도 창을 사용하십시오.