autoclassifiernode 특성

자동 분류기 노드 아이콘자동 분류자 노드는 이분형 결과(예 또는 아니오, 이탈 또는 이탈 안함 등)에 대해 다수의 여러 모델을 작성하고 비교하여 주어진 분석을 위한 최상의 접근 방식을 선택할 수 있게 합니다. 많은 모델링 알고리즘이 지원되어 사용할 방법, 각각에 대한 특정 옵션, 결과 비교 기준을 선택할 수 있습니다. 이 노드는 지정된 옵션을 기반으로 모델 세트를 생성하고 사용자가 지정하는 기준에 따라 최상의 후보를 순위화합니다.

node = stream.create("autoclassifier", "My node")
node.setPropertyValue("ranking_measure", "Accuracy")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_accuracy_limit", True)
node.setPropertyValue("accuracy_limit", 0.9)
node.setPropertyValue("calculate_variable_importance", True)
node.setPropertyValue("use_costs", True)
node.setPropertyValue("svm", False)
표 1. 자동분류기 노드 속성
autoclassifiernode 특성 특성 설명
target 필드 플래그 대상의 경우, 자동 분류자 노드는 하나의 대상과 하나 이상의 입력 필드가 필요합니다. 가중치 및 빈도 필드도 지정할 수 있습니다. 자세한 내용은 공통 모델링 노드 속성을 참조하십시오.
ranking_measure Accuracy
Area_under_curve
Profit
Lift
Num_variables
 
ranking_dataset Training
Test
 
number_of_models 정수 모델 너깃에 포함할 모델 수입니다. 1과 100 사이의 정수를 지정하십시오.
calculate_variable_importance 플래그  
enable_accuracy_limit 플래그  
accuracy_limit 정수 0과 100 사이의 정수입니다.
enable_area_under_curve_limit 플래그  
area_under_curve_limit Number 0.0과 1.0 사이의 실수입니다.
enable_profit_limit 플래그  
profit_limit Number 0보다 큰 정수입니다.
enable_lift_limit 플래그  
lift_limit Number 1.0보다 큰 실수입니다.
enable_number_of_variables_limit 플래그  
number_of_variables_limit Number 0보다 큰 정수입니다.
use_fixed_cost 플래그  
fixed_cost Number 0.0보다 큰 실수입니다.
variable_cost 필드  
use_fixed_revenue 플래그  
fixed_revenue Number 0.0보다 큰 실수입니다.
variable_revenue 필드  
use_fixed_weight 플래그  
fixed_weight Number 0.0보다 큰 실수입니다.
variable_weight 필드  
lift_percentile Number 0과 100 사이의 정수입니다.
enable_model_build_time_limit 플래그  
model_build_time_limit Number 각 개별 모델을 작성하는 데 걸리는 시간을 제한하기 위해 분 단위로 설정하는 정수입니다.
enable_stop_after_time_limit 플래그  
stop_after_time_limit Number 자동 분류자 실행에 대한 전체 경과 시간을 제한하기 위해 시간 수로 설정되는 실수입니다.
enable_stop_after_valid_model_produced 플래그  
use_costs 플래그  
<algorithm> 플래그 특정 알고리즘의 사용을 사용 또는 사용 안합니다.
<algorithm>.<property> string 특정 알고리즘의 특성 값을 설정합니다. 자세한 내용은 알고리즘 속성 설정을 참조하십시오.
use_cross_validation 필드 이 목록에 추가되는 필드에 모델에서 생성되는 규칙의 예측 역할 또는 조건이 사용될 수 있습니다. 이는 규칙 기준에 의한 규칙이므로, 필드는 한 규칙의 조건이면서 다른 규칙의 예측이 될 수 있습니다.
number_of_folds 정수 교차 검증을 위한 N 중첩 모수이며, 범위는 3 - 10입니다.
set_random_seed 부울 난수 시드를 설정하면 분석을 복제할 수 있습니다. 정수를 지정하거나, 생성을 클릭하여 1과 2147483647 사이(1과 2147483647 포함)의 유사 난수 정수를 작성합니다. 기본적으로, 분석은 시드 229176228로 복제됩니다.
random_seed 정수 난수 시드
stop_if_valid_model 부울
filter_individual_model_output 부울 앙상블 노드에 반영되는 개별 모델이 생성한 모든 추가 필드의 출력에서 제거합니다. 모든 입력 모델의 결합된 점수에만 관심이 있는 경우 이 옵션을 선택하십시오. 예를 들어 분석 노드 또는 평가 노드를 사용하여 결합된 점수의 정확도를 각 개별 입력 모델의 정확도와 비교하려는 경우 이 옵션이 선택 취소되었는지 확인하십시오.
set_ensemble_method "Voting"
"ConfidenceWeightedVoting"
"HighestConfidence"
목표를 설정하기 위한 앙상블 메소드입니다.
set_voting_tie_selection "Random"
"HighestConfidence"
투표가 연결된 경우, 무작위로 값을 선택하거나 가장 높은 신뢰도를 사용하십시오.
flag_ensemble_method "Voting"
"ConfidenceWeightedVoting"
"RawPropensityWeightedVoting"
"HighestConfidence"
"AverageRawPropensity"
플래그 목표에 대한 앙상블 메소드.
flag_voting_tie_selection "Random"
"HighestConfidence"
"RawPropensity"
투표가 연결된 경우 신뢰도가 가장 높거나 원시 성향이 있는 무작위로 값을 선택하십시오.