개요 (RBF 명령)

신경망은 데이터베이스에서 알 수 없는 패턴을 찾기 위한 데이터 마이닝 도구입니다. 신경망은 가격 및 기타 변수의 함수로 제품에 대한 수요를 예측하거나 구매 습관 및 인구 통계적 특성을 기반으로 고객을 분류하여 비즈니스 의사결정을 내리는 데 사용할 수 있습니다. RBF 프로시저는 방사형 기저함수 신경망에 적합하며, 이는 입력 레이어, 방사형 기저함수 레이어라고 하는 은닉층 및 출력 레이어가 있는 피드포워드, 감독 학습 네트워크입니다. 은닉층은 입력 벡터들을 방사상 기저 함수들로 변환한다. MLP (다중 레이어 퍼셉트론) 프로시저와 마찬가지로 RBF 프로시저는 예측 및 분류를 수행합니다.

RBF 프로시저는 다음 두 단계로 네트워크를 훈련합니다.

이 프로시저는 군집 방법을 사용하여 방사형 기저함수를 결정합니다. 각각의 방사형 기저함수의 중심 및 폭이 결정된다.
이 프로시저는 방사형 기저함수가 제공된 경우 시냅스 가중치를 추정합니다. 결과 레이어에 대한 항등 활성화 함수가 있는 제곱합 오차 함수는 예측 및 분류 모두에 사용됩니다. 일반 최소 제곱법 회귀분석은 제곱합 오차를 최소화하는 데 사용됩니다.

이 2단계훈련 접근법으로 인해 RBF 네트워크는 일반적으로 MLP보다 훨씬 빠르게 훈련됩니다.

옵션

예측 또는 분류. 하나 이상의 종속변수를 지정할 수 있으며 척도, 범주형 또는 조합일 수 있습니다. 종속변수에 척도 측정 수준이 있는 경우 신경망은 입력 데이터의 일부 연속형 함수의 "참" 값에 가까운 연속형 값을 예측합니다. 종속변수가 범주형인 경우 신경망을 사용하여 입력 예측변수를 기준으로 케이스를 " 최적 범주로 분류합니다.

조정. RBF 선택적으로 신경망을 훈련하기 전에 공변량 (척도 측정 수준이 있는 예측변수) 또는 척도 종속변수를 척도 조정합니다. 표준화, 정규화 및 조정된 정규화의 세 가지 척도 조정 옵션이 있습니다.

훈련, 검정 및 검증용 데이터. RBF 는 선택적으로 데이터 세트를 훈련, 검정 및 검증용 데이터로 나눕니다. 신경망은 훈련 데이터를 사용하여 훈련됩니다. 테스트 데이터를 사용하여 네트워크에 대한 "최적" 의 숨겨진 단위 수를 판별할 수 있습니다. 검증 데이터는 훈련 프로세스에서 완전히 제외되며 최종 네트워크의 독립적인 평가에 사용됩니다.

아키텍처 선택사항. RBF 프로시저는 하나의 은닉층이 있는 신경망을 작성하고 자동 아키텍처 선택을 수행하여 "최적의 숨겨진 단위 수" 를 찾을 수 있습니다. 기본적으로 프로시저는 적절한 범위를 자동으로 계산하고 범위 내에서 " 최적의 숫자를 찾습니다. 그러나 사용자 고유의 범위 또는 특정 수의 숨겨진 단위를 제공하여 이러한 계산을 대체할 수 있습니다.

활성화 함수. 은닉층의 단위는 정규화 방사형 기저함수 또는 일반 방사형 기저함수를 사용할 수 있습니다.

결측값. RBF 프로시저에는 범주형 변수의 사용자 결측값을 유효한 값으로 처리하는 옵션이 있습니다. 척도변수의 사용자 결측값은 항상 유효하지 않은 것으로 처리됩니다.

출력. RBF 은 피벗표 결과를 표시하지만 대부분의 해당 결과를 표시하지 않는 옵션을 제공합니다. 그래픽 출력에는 네트워크 다이어그램 (기본값) 및 여러 선택적 차트가 포함됩니다. 예를 들어, 관측값에 의한 예측, 예측값에 의한 잔차, ROC (Receiver Operating Characteristic) 곡선, 누적 이득, 리프트 및 독립 변수 중요도입니다. 또한 이 프로시저는 선택적으로 예측값을 활성 데이터 세트에 저장합니다. 숨겨진 단위 중심 및 너비 벡터와 시냅스 가중치 추정값을 XML 파일에 저장할 수 있습니다.

기본 스펙

기본 지정 사항은 RBF 명령 다음에 하나 이상의 종속변수, BY 키워드 및 하나 이상의 요인, WITH 키워드 및 하나 이상의 공변량입니다.

기본적으로 RBF 프로시저는 공변량 및 척도 종속변수를 표준화하고 신경망을 훈련하기 전에 훈련 표본을 선택합니다. 자동 아키텍처 선택은 " 최상의 신경망 아키텍처를 찾는 데 사용됩니다. 사용자 결측값은 제외되고 기본 피벗표 결과가 표시됩니다.

주: 측정 수준은 결과에 영향을 줄 수 있습니다. 변수 (필드) 에 알 수 없는 측정 수준이 있는 경우 데이터 전달을 수행하여 분석을 시작하기 전에 측정 수준을 판별합니다. 판별 기준에 대한 정보는 SET SCALEMIN을 참조하십시오.

구문 규칙

모든 하위 명령은 선택사항입니다.
하위 명령은 임의의 순서로 지정할 수 있습니다.
각 하위 명령의 단일 인스턴스만 허용됩니다.
하위 명령 내에서 키워드가 두 번 이상 지정되면 오류가 발생합니다.
구문 차트에 표시된 괄호, 등호 및 슬래시가 필요합니다.
명령 이름, 하위 명령 이름 및 키워드의 전체 철자를 입력해야 합니다.
비어 있는 하위 명령은 허용되지 않습니다.
SPLIT FILE 명령에 정의된 분할변수는 종속변수, 요인, 공변량 또는 분할변수로 사용할 수 없습니다.

제한사항

WEIGHT 명령에 지정된 빈도 가중치는 RBF 프로시저에서 경고와 함께 무시됩니다.

범주형 변수

RBF 프로시저는 프로시저 기간 동안c 코딩 중 하나를 사용하여 범주형 예측변수 및 종속변수를 임시로 코딩변경합니다. 변수의 c 범주가 있는 경우 변수는 c 벡터로 저장되며 첫 번째 범주는 (1,0, ..., 0), 다음 범주는 (0,1,0, ..., 0), ..., 및 최종 범주, (0,0, ..., 0, 1).

c 코딩 중 하나로 인해 입력 단위의 총 수는 척도 예측변수 수에 모든 범주형 예측변수의 범주 수를 더한 값입니다. 그러나 다중 레이어 퍼셉트론 (MLP) 과 달리, 이 코딩 방식은 범주형 예측변수에 대한 구문 가중치의 수를 증가시키지 않으므로 훈련 시간을 유의하게 증가시키지 않아야 합니다.

검정 또는 검증용 표본이 정의된 경우에도 모든c 코딩 중 하나는 훈련 데이터를 기반으로 합니다 ( PARTITION 하위 명령 (RBF 명령) 참조). 따라서 검정 또는 검증용 표본에 훈련 데이터에 없는 예측변수 범주가 있는 케이스가 포함된 경우 이러한 케이스는 프로시저 또는 스코어링에서 사용되지 않습니다. 훈련 데이터에 없는 종속 변수 범주가 포함된 케이스가 검정 또는 검증용 표본에 있는 경우, 이러한 케이스는 프로시저에서 사용되지 않지만 스코어링될 수는 있습니다.

결과 복제

RBF 프로시저는 파티션의 무작위 지정 중에 난수 생성을 사용합니다. 나중에 동일한 무작위 결과를 다시 생성하려면 RBF 프로시저를 각각 실행하기 전에 SET 명령을 사용하여 난수 생성기의 초기화 값을 설정하십시오.

RBF 방사형 기저함수를 결정하는 데 2단계 군집 알고리즘이 사용되므로 결과는 데이터 순서에도 종속됩니다. 데이터 순서 영향을 최소화하려면 RBF 프로시저를 실행하기 전에 케이스를 무작위로 정렬하십시오. 주어진 해법의 안정성을 확인하기 위해 케이스를 각기 다른 무작위 순서로 정렬하여 서로 다른 여러 가지 해법을 구할 수도 있습니다. 파일 크기가 너무 큰 경우에는 케이스를 각기 다른 무작위 순서로 정렬한 표본을 사용하여 여러 번 실행할 수도 있습니다.

요약하면, RBF 결과를 나중에 정확하게 복제하려면 동일한 RBF 프로시저 설정을 사용하는 것 외에도 난수 생성기에 대해 동일한 초기화 값과 동일한 데이터 순서를 사용하십시오.