propriedades do nó de partição

Ícone do nó da partiçãoO nó Partition gera um campo de partição, que divide os dados em subconjuntos separados para os estágios de treinamento, teste e validação da construção do modelo.

Exemplo

node = stream.create("partition", "My node")
node.setPropertyValue("create_validation", True)
node.setPropertyValue("training_size", 33)
node.setPropertyValue("testing_size", 33)
node.setPropertyValue("validation_size", 33)
node.setPropertyValue("set_random_seed", True)
node.setPropertyValue("random_seed", 123)
node.setPropertyValue("value_mode", "System")
Tabela 1. propriedades partitionnode
partitionnode properties Tipo de dados Descrição da propriedade
new_name sequência Nome do campo de partição gerado pelo nó.
create_validation sinalização Especifica se uma partição de validação deve ser criada.
training_size número inteiro Porcentagem de registros (0-100) a serem alocados para a partição de treinamento.
testing_size número inteiro Porcentagem de registros (0-100) a ser alocada para a partição de teste.
validation_size número inteiro Porcentagem de registros (0-100) a serem alocados para a partição de validação. Ignorado se uma partição de validação não for criada.
training_label sequência Rótulo da partição de treinamento.
testing_label sequência Rótulo da partição de teste.
validation_label sequência Rótulo da partição de validação. Ignorado se uma partição de validação não for criada.
value_mode System SystemAndLabel Label Especifica os valores usados para representar cada partição nos dados. Por exemplo, a amostra de treinamento pode ser representada pelo número inteiro do sistema 1, pelo rótulo Training, ou por uma combinação dos dois, 1_Training.
set_random_seed Booleano Especifica se deve ser usada uma semente aleatória especificada pelo usuário.
random_seed número inteiro Um valor de semente aleatório especificado pelo usuário. Para que esse valor seja usado, set_random_seed deve ser definido como True.
enable_sql_generation Booleano Especifica se deve ser usado o pushback do SQL para atribuir registros a partições.
unique_field   Especifica o campo de entrada usado para garantir que os registros sejam atribuídos às partições de forma aleatória, mas repetível. Para que esse valor seja usado, enable_sql_generation deve ser definido como True.