propriedades do nó de partição
O nó Partition gera um campo de partição, que divide os dados em subconjuntos separados para os estágios de treinamento, teste e validação da construção do modelo.
Exemplo
node = stream.create("partition", "My node")
node.setPropertyValue("create_validation", True)
node.setPropertyValue("training_size", 33)
node.setPropertyValue("testing_size", 33)
node.setPropertyValue("validation_size", 33)
node.setPropertyValue("set_random_seed", True)
node.setPropertyValue("random_seed", 123)
node.setPropertyValue("value_mode", "System")
partitionnode properties |
Tipo de dados | Descrição da propriedade |
|---|---|---|
new_name |
sequência | Nome do campo de partição gerado pelo nó. |
create_validation |
sinalização | Especifica se uma partição de validação deve ser criada. |
training_size |
número inteiro | Porcentagem de registros (0-100) a serem alocados para a partição de treinamento. |
testing_size |
número inteiro | Porcentagem de registros (0-100) a ser alocada para a partição de teste. |
validation_size |
número inteiro | Porcentagem de registros (0-100) a serem alocados para a partição de validação. Ignorado se uma partição de validação não for criada. |
training_label |
sequência | Rótulo da partição de treinamento. |
testing_label |
sequência | Rótulo da partição de teste. |
validation_label |
sequência | Rótulo da partição de validação. Ignorado se uma partição de validação não for criada. |
value_mode |
System SystemAndLabel Label |
Especifica os valores usados para representar cada partição nos dados. Por exemplo, a amostra de treinamento pode ser representada pelo número inteiro do sistema 1, pelo rótulo Training, ou por uma combinação dos dois, 1_Training. |
set_random_seed |
Booleano | Especifica se deve ser usada uma semente aleatória especificada pelo usuário. |
random_seed |
número inteiro | Um valor de semente aleatório especificado pelo usuário. Para que esse valor seja usado, set_random_seed deve ser definido como True. |
enable_sql_generation |
Booleano | Especifica se deve ser usado o pushback do SQL para atribuir registros a partições. |
unique_field |
Especifica o campo de entrada usado para garantir que os registros sejam atribuídos às partições de forma aleatória, mas repetível. Para que esse valor seja usado, enable_sql_generation deve ser definido como True. |