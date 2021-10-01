ELT는 추출, 로드 및 변환의 세 가지 기본 단계로 구성됩니다. 각 단계는 아래에 자세히 설명되어 있습니다.

추출

데이터를 추출하는 동안 데이터는 소스 위치에서 스테이징 영역으로 복사되거나 내보내집니다. 데이터 세트는 많은 데이터 유형으로 구성될 수 있으며 다음을 포함하되 이에 국한되지 않는 거의 모든 정형 또는 비정형 소스에서 가져올 수 있습니다.

SQL 또는 NoSQL 서버

CRM 및 ERP 시스템

텍스트 및 문서 파일

이메일

웹페이지

즉, 비정형 데이터와 함께 더 일반적으로 사용됩니다.

로드

이 단계에서 변환된 데이터는 스테이징 영역에서 데이터 웨어하우스 또는 데이터 레이크와 같은 데이터 스토리지 영역으로 이동됩니다.

대부분의 조직에서 데이터 로딩 프로세스는 자동화되고 잘 정의되었으며 지속적이고 일괄 처리 중심입니다. 일반적으로 ELT는 소스 시스템 및 데이터 웨어하우스의 트래픽이 최고조에 달하고 소비자가 분석 등을 위해 데이터를 사용하려고 기다리는 업무 시간 동안 발생합니다.

변환

이 단계에서는 분석 전에 SQL을 사용하여 데이터에 스키마를 적용하거나 데이터를 변환하는 쓰기 스키마(schema-on-write) 접근 방식이 사용됩니다. 이 단계에는 다음과 같은 사항이 포함될 수 있습니다.