Automatize a modelagem para um alvo contínuo
Este tutorial usa o nó Auto Numeric para criar e comparar automaticamente diferentes modelos para resultados contínuos (intervalo numérico), como a previsão do valor tributável de uma propriedade. Com um único nó, é possível estimar e comparar um conjunto de modelos candidatos e gerar um subconjunto de modelos para análise posterior. O nó funciona da mesma maneira que o nó Auto Classifier, mas para alvos contínuos em vez de sinalizadores ou nominais.
O nó combina o melhor dos modelos candidatos em um único nugget do modelo agregado (Ensembled). Essa abordagem combina a facilidade de automação com os benefícios de combinar múltiplos modelos, que muitas vezes geram previsões mais precisas do que podem ser obtidas com qualquer modelo.
Este exemplo se concentra em um município fictício responsável por ajustar e avaliar os impostos imobiliários. Para atingir esse objetivo com mais precisão, você cria um modelo que prevê os valores dos imóveis com base no tipo de construção, vizinhança, tamanho e outros fatores conhecidos.
Visualizando o tutorial
Assista a este vídeo para visualizar as etapas deste tutorial. Pode haver pequenas diferenças na interface do usuário mostrada no vídeo. O vídeo deve ser um complemento do tutorial escrito. Este vídeo oferece um método visual para aprender os conceitos e as tarefas desta documentação.
Experimente o tutorial
Neste tutorial, você concluirá estas tarefas:
Exemplo de fluxo de modelador e conjunto de dados
Este tutorial usa o fluxo " Modelagem automatizada para um alvo contínuo no projeto de amostra. O arquivo de dados usado é property_values_train.csv. A imagem a seguir mostra o fluxo do modelador de amostra.

O arquivo de dados inclui um campo denominado " taxable_value
, que é o campo de destino ou valor que você deseja prever. Os outros campos contêm informações como vizinhança, tipo de edifício e volume interno, e podem ser usados como preditores.
Nome do campo | Rótulo |
---|---|
property_id |
ID da propriedade |
neighborhood |
Área dentro da cidade |
building_type |
Tipo de edifício |
year_built |
Ano de construção |
volume_interior |
Volume do interior |
volume_other |
Volume de garagem e edifícios extras |
lot_size |
Tamanho do lote |
taxable_value |
Valor tributável |

Tarefa 1: Abrir o projeto de amostra
O projeto de amostra contém vários conjuntos de dados e fluxos de modelador de amostra. Se você ainda não tiver o projeto de amostra, consulte o tópico Tutoriais para criar o projeto de amostra. Em seguida, siga estas etapas para abrir o projeto de amostra:
- Em watsonx, no menu de navegação
, escolha Projects > View all Projects.
- Clique em SPSS Modeler Project.
- Clique na guia Assets (Ativos ) para ver os conjuntos de dados e os fluxos do modelador.
Verifique seu progresso
A imagem a seguir mostra a guia Assets (Ativos) do projeto. Agora você está pronto para trabalhar com o fluxo do modelador de amostra associado a este tutorial.
Tarefa 2: Examinar os nós Data Asset e Type
A modelagem automatizada para um alvo contínuo inclui vários nós. Siga estas etapas para examinar os nós Data Asset e Type:
- Na guia Assets (Ativos ), abra o fluxo do modelador Automated Modeling for a Continuous Target (Modelagem automatizada para um alvo contínuo ) e aguarde o carregamento da tela.
- Clique duas vezes no nó property_values_train.csv. Esse nó é um nó de ativo de dados que aponta para o arquivo property_values_train.csv no projeto.
- Revise as propriedades do formato do arquivo.
- Opcional: Clique em Preview data (Visualizar dados) para ver o conjunto completo de dados.
- Clique duas vezes no nó Type.
- Para o campo taxable_value, defina a função como Target. Outros campos são usados como preditores.
Figura 3. Definir o nível e a função de medição - Opcional: Clique em Preview data (Visualizar dados) para ver o conjunto de dados filtrados.
Verifique seu progresso
A imagem a seguir mostra o nó Type. Agora você está pronto para configurar o nó de modelagem.

Tarefa 3: Configurar o nó de modelagem
Este exemplo usa um nó de modelagem numérica automática que estima e compara modelos para experimentar várias abordagens para um intervalo numérico contínuo. Siga estas etapas para configurar o nó de modelagem:
- Clique duas vezes no nó taxable-value (valor tributável ) para ver suas propriedades.
- Expanda a seção Basics (Noções básicas ) e defina as seguintes propriedades:
- No campo Classificar modelos por, selecione Correlação.
- No campo Número de modelos a serem usados, digite "
3
. Isso significa que os três melhores modelos serão construídos ao executar o nó.
Figura 4. Seção Noções básicas do nó numérico automático - Expanda a seção Especialista. Há seis algoritmos selecionados, o que faz com que o nó estime um único modelo para cada algoritmo, em um total de seis modelos. (Como alternativa, é possível modificar essas configurações para comparar várias variantes para cada tipo de modelo.) Como você definiu a propriedade Number of models to use como "
3
na seção Basics, o nó calcula a precisão dos seis algoritmos e cria um único nugget de modelo contendo os três mais precisos.Figura 5. Seção Especialista em nó numérico automático - Expanda a seção Ensemble para visualizar as configurações padrão. Como você usa um alvo contínuo neste exemplo, a pontuação do conjunto é gerada pela média das pontuações dos modelos individuais.
Figura 6. Nó numérico automático Seção Ensemble
Verifique seu progresso
A imagem a seguir mostra o nó Modelagem. Agora você está pronto para comparar os modelos.

Tarefa 4: Comparar os modelos
Agora que você especificou os três modelos a serem criados, siga estas etapas para gerar e comparar os modelos:
- Passe o mouse sobre o nó taxable_value e clique no ícone Run (Executar )
.
- No painel Outputs and models (Saídas e modelos ), clique nos resultados com o nome taxable_value (valor tributável ) para visualizar os resultados.
Você verá detalhes sobre cada um dos modelos criados durante a execução. (Em uma situação real, na qual centenas de modelos são estimados em um grande conjunto de dados, a execução do fluxo pode levar muitas horas) A tabela contém um conjunto de modelos que são gerados pelo nó Modelagem.
- Para explorar ainda mais qualquer um dos modelos individuais, clique em um nome de modelo na coluna Estimador para ver os resultados do modelo individual.
- Exibir a página Informações do modelo. Essa tabela contém informações sobre o tipo de modelo que é ajustado, identifica o campo de destino, o número de recursos de entrada, as funções de ativação e o tamanho da rede resultante.
- Exibir outras páginas do modelo.
- Feche os detalhes do modelo.
Por padrão, os modelos são classificados por precisão (correlação) porque você selecionou a correlação como a medida nas propriedades do nó Auto Numeric. Para fins de classificação, é usado o valor absoluto da precisão, com valores mais próximos de 1 indicando uma relação mais forte.
É possível classificar em uma coluna diferente clicando no cabeçalho dessa coluna.
Com base nesses resultados, você decide usar todos os três desses modelos mais precisos. Ao combinar as previsões de vários modelos, as limitações dos modelos individuais podem ser evitadas, resultando em uma maior precisão geral.
- Verifique se todos os três modelos estão selecionados na coluna Use.
- Feche a janela View Model: taxable_value.
Verifique seu progresso
A imagem a seguir mostra a tabela de comparação de modelos. Agora você está pronto para executar a análise do modelo.

Tarefa 5: Executar o nó de análise
Agora que você visualizou uma comparação dos três modelos, pode seguir estas etapas para executar uma análise dos modelos:
- Passe o mouse sobre o nó Analysis (Análise ) e clique no ícone Run (Executar )
.
- No painel Outputs and models (Saídas e modelos ), clique nos resultados de saída com o nome Analysis (Análise ) para visualizar os resultados.
A pontuação média gerada pelo modelo combinado é adicionada em um campo denominado '
$XR-taxable_value
, com uma correlação de 0.934, que é maior do que as pontuações dos três modelos individuais. As pontuações do conjunto também mostram um erro absoluto médio baixo e podem ter um desempenho melhor do que qualquer um dos modelos individuais quando aplicados a outros conjuntos de dados.
Verifique seu progresso
A imagem a seguir mostra a comparação de modelos do nó Análise.

Resumo
Com esse exemplo de fluxo " Modelagem automatizada para um alvo de bandeira, você usou o nó " Numérico automático para comparar vários modelos diferentes, selecionou os três modelos mais precisos e os adicionou ao fluxo dentro de um nugget de modelo Auto Numeric combinado.
O modelo combinado apresentou um desempenho melhor do que dois dos modelos individuais e pode ter um desempenho melhor quando aplicado a outros conjuntos de dados. Se sua meta é automatizar o processo o máximo possível, essa abordagem ajuda a obter um modelo robusto na maioria das circunstâncias, sem precisar se aprofundar nas especificidades de cada modelo.
Próximas etapas
Agora você está pronto para experimentar outros tutoriais do SPSS® Modeler.