PCA의 함수
PCA 알고리즘은 PCA 및 PROJECT_PCA 스토어드 프로시저에서 구현됩니다. PCA 모델을 출력하려면 PRINT_MODEL 스토어드 프로시저를 사용하십시오.
PCA 알고리즘은 행에 관측, 컬럼에 예측변수를 포함하는 입력 테이블을 행렬 A로 변환합니다. 행렬 A의 고유 벡터를 찾기 위해, 행렬 A는 특이값 분해(SVD) 또는 고유값 분해를 사용하여 분해됩니다. 이러한 고유 벡터는 해당 PCA 모델에 저장됩니다.
행렬 A가 특이 행렬인 경우 등과 같이 행렬 A의 조건이 부적절한 경우에는 고유값 분해가 결과를 리턴하지 않습니다. 이 경우에는 대체 옵션으로서 계산에 SVD를 사용하는 것이 좋습니다.
모든 스토어드 프로시저는 <parameter>=<value> 항목의 쌍을 포함하는 필수 단일 문자열 매개변수로 구성됩니다. 이러한 항목은 쉼표로 구분됩니다. 매개변수의 데이터 유형은 VARCHAR(any)입니다.
유효한 <parameter>=<value> 항목은 각 스토어드 프로시저에 대한 매개변수 설명에 나열되어 있습니다.
NULL 값 처리 방법
NULL 값의 처리 방법은 NULL 값이 주성분 계산 중 어느 부분에서 발견되었는지에 따라 달라집니다.
입력 테이블의 NULL 값은 다음 목록에 설명되어 있는 바와 같이 처리됩니다.
- NULL 값이 id 컬럼에 포함되어 있습니다.
- NULL 값 및 중복에 대해 입력 테이블의 해당 id 컬럼이 스캔됩니다. NULL 값 또는 중복이 발견되면 알고리즘이 중지됩니다. 그런 다음 오류 메시지가 표시됩니다.
- 이 처리는 IDAX.PCA 스토어드 프로시저 및 IDAX.PROJECT_PCA 스토어드 프로시저에 적용됩니다.
- NULL 값이 임의의 입력 컬럼에 포함되어 있습니다.
- 임의의 입력 컬럼에 포함된 NULL 값은 유효하지 않습니다. 따라서 NULL 값을 포함하는 하나 이상의 입력 컬럼이 있는 입력 테이블의 행이 무시됩니다. 오류 메시지가 표시되지 않습니다.
- IDAX.PCA 스토어드 프로시저 및 IDAX.PROJECT_PCA 스토어드 프로시저의 경우 입력 데이터 세트의 모든 행이 NULL 값을 포함하면 해당 입력 테이블이 비어 있는 것으로 간주됩니다. 오류 메시지가 표시됩니다.