autoclassifiernode 특성

자동 분류기 노드 아이콘 자동 분류자 노드는 이분형 결과(예 또는 아니오, 이탈 또는 이탈 안함 등)에 대해 다수의 여러 모델을 작성하고 비교하여 주어진 분석을 위한 최상의 접근 방식을 선택할 수 있게 합니다. 많은 모델링 알고리즘이 지원되어 사용할 방법, 각각에 대한 특정 옵션, 결과 비교 기준을 선택할 수 있습니다. 이 노드는 지정된 옵션을 기반으로 모델 세트를 생성하고 사용자가 지정하는 기준에 따라 최상의 후보를 순위화합니다.

예

node = stream.create("autoclassifier", "My node")
node.setPropertyValue("ranking_measure", "Accuracy")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_accuracy_limit", True)
node.setPropertyValue("accuracy_limit", 0.9)
node.setPropertyValue("calculate_variable_importance", True)
node.setPropertyValue("use_costs", True)
node.setPropertyValue("svm", False)

표 1. 자동분류기 노드 속성
`autoclassifiernode` 특성	값	특성 설명
`target`	필드	플래그 대상의 경우, 자동 분류자 노드는 하나의 대상과 하나 이상의 입력 필드가 필요합니다. 가중치 및 빈도 필드도 지정할 수 있습니다. 자세한 내용은 공통 모델링 노드 속성을 참조하십시오.
`ranking_measure`	`Accuracy` `Area_under_curve` `Profit` `Lift` `Num_variables`
`ranking_dataset`	`Training` `Test`
`number_of_models`	정수	모델 너깃에 포함할 모델 수입니다. 1과 100 사이의 정수를 지정하십시오.
`calculate_variable_importance`	플래그
`enable_accuracy_limit`	플래그
`accuracy_limit`	정수	0과 100 사이의 정수입니다.
`enable_area_under_curve_limit`	플래그
`area_under_curve_limit`	Number	0.0과 1.0 사이의 실수입니다.
`enable_profit_limit`	플래그
`profit_limit`	Number	0보다 큰 정수입니다.
`enable_lift_limit`	플래그
`lift_limit`	Number	1.0보다 큰 실수입니다.
`enable_number_of_variables_limit`	플래그
`number_of_variables_limit`	Number	0보다 큰 정수입니다.
`use_fixed_cost`	플래그
`fixed_cost`	Number	0.0보다 큰 실수입니다.
`variable_cost`	필드
`use_fixed_revenue`	플래그
`fixed_revenue`	Number	0.0보다 큰 실수입니다.
`variable_revenue`	필드
`use_fixed_weight`	플래그
`fixed_weight`	Number	0.0보다 큰 실수입니다.
`variable_weight`	필드
`lift_percentile`	Number	0과 100 사이의 정수입니다.
`enable_model_build_time_limit`	플래그
`model_build_time_limit`	Number	각 개별 모델을 작성하는 데 걸리는 시간을 제한하기 위해 분 단위로 설정하는 정수입니다.
`enable_stop_after_time_limit`	플래그
`stop_after_time_limit`	Number	자동 분류자 실행에 대한 전체 경과 시간을 제한하기 위해 시간 수로 설정되는 실수입니다.
`enable_stop_after_valid_model_produced`	플래그
`use_costs`	플래그
`<algorithm>`	플래그	특정 알고리즘의 사용을 사용 또는 사용 안합니다.
`<algorithm>.<property>`	string	특정 알고리즘의 특성 값을 설정합니다. 자세한 내용은 알고리즘 속성 설정을 참조하십시오.
`use_cross_validation`	필드	이 목록에 추가되는 필드에 모델에서 생성되는 규칙의 예측 역할 또는 조건이 사용될 수 있습니다. 이는 규칙 기준에 의한 규칙이므로, 필드는 한 규칙의 조건이면서 다른 규칙의 예측이 될 수 있습니다.
`number_of_folds`	정수	교차 검증을 위한 N 중첩 모수이며, 범위는 3 - 10입니다.
`set_random_seed`	부울	난수 시드를 설정하면 분석을 복제할 수 있습니다. 정수를 지정하거나, 생성을 클릭하여 1과 2147483647 사이(1과 2147483647 포함)의 유사 난수 정수를 작성합니다. 기본적으로, 분석은 시드 229176228로 복제됩니다.
`random_seed`	정수	난수 시드
`stop_if_valid_model`	부울
`filter_individual_model_output`	부울	앙상블 노드에 반영되는 개별 모델이 생성한 모든 추가 필드의 출력에서 제거합니다. 모든 입력 모델의 결합된 점수에만 관심이 있는 경우 이 옵션을 선택하십시오. 예를 들어 분석 노드 또는 평가 노드를 사용하여 결합된 점수의 정확도를 각 개별 입력 모델의 정확도와 비교하려는 경우 이 옵션이 선택 취소되었는지 확인하십시오.
`set_ensemble_method`	`"Voting" "ConfidenceWeightedVoting" "HighestConfidence"`	목표를 설정하기 위한 앙상블 메소드입니다.
`set_voting_tie_selection`	`"Random" "HighestConfidence"`	투표가 연결된 경우, 무작위로 값을 선택하거나 가장 높은 신뢰도를 사용하십시오.
`flag_ensemble_method`	`"Voting" "ConfidenceWeightedVoting" "RawPropensityWeightedVoting" "HighestConfidence" "AverageRawPropensity"`	플래그 목표에 대한 앙상블 메소드.
`flag_voting_tie_selection`	`"Random" "HighestConfidence" "RawPropensity"`	투표가 연결된 경우 신뢰도가 가장 높거나 원시 성향이 있는 무작위로 값을 선택하십시오.