Prever a rotatividade nas telecomunicações

Este tutorial cria um modelo de regressão logística, que é uma técnica estatística para classificar registros com base nos valores dos campos de entrada. É análogo à regressão linear, mas utiliza um campo-alvo categórico em vez de um campo numérico.

Por exemplo, suponha que uma operadora de telecomunicações esteja preocupada com o número de clientes que está perdendo para os concorrentes. Se os dados de uso do serviço puderem ser usados para prever quais clientes estão sujeitos a transferência para outro provedor, as ofertas poderão ser customizadas para reter o maior número possível de clientes possível..

Visualizar o tutorial

Assista ao vídeo Assista a este vídeo para ver uma prévia das etapas deste tutorial. Pode haver pequenas diferenças na interface do usuário mostrada no vídeo. O vídeo destina-se a ser um complemento ao tutorial escrito. Este vídeo fornece um método visual para aprender os conceitos e tarefas desta documentação.

Experimente o tutorial

Neste tutorial, você realizará as seguintes tarefas:

Exemplo de fluxo do modelador e conjunto de dados

Este tutorial utiliza o fluxo Telecommunications Churn no projeto de exemplo. O arquivo de dados utilizado é telco.csv. A imagem a seguir mostra o fluxo do modelador de amostras.

Figura 1. Exemplo de fluxo do modelador
Exemplo de fluxo do modelador

Este exemplo foca no uso de dados de uso para prever a perda do cliente (perda de clientes). Como o destino possui duas categorias distintas, um modelo binomial é usado Se o alvo tiver várias categorias, pode-se criar um modelo multinomial.

A imagem a seguir mostra o conjunto de dados usado com este fluxo do modelador.

Figura 2 Conjunto de dados de amostra
Conjunto de dados de amostra

Tarefa 1: Abra o projeto de exemplo

O projeto de exemplo contém vários conjuntos de dados e fluxos de modelador de exemplo. Se você ainda não tem o projeto de exemplo, consulte o tópico Tutoriais para criar o projeto de exemplo. Em seguida, siga estas etapas para abrir o projeto de exemplo:

  1. No menu watsonxNavegação, Menu de navegaçãoselecione Projetos > Todos os projetos.
  2. Clique em Projeto “ SPSS Modeler ”.
  3. Clique na guia Ativos para ver os conjuntos de dados e os fluxos do modelador.

Ícone do ponto de verificação Verifique seu progresso

A imagem a seguir mostra a guia Ativos do projeto. Agora você está pronto para trabalhar com o fluxo do modelador de amostra associado a este tutorial.

Projeto de amostra

Voltar ao topo

Tarefa 2: Examine o nó Ativo de dados e Tipo

A rotatividade nas telecomunicações inclui vários nós. Siga estas etapas para examinar os nós Data Asset (Recurso de dados) e Type (Tipo):

  1. Na guia Ativos, abra o fluxo do modelador de rotatividade de telecomunicações e aguarde o carregamento da tela.
  2. Clique duas vezes no telco.csv nó. Este nó é um nó de ativo de dados que aponta para o telco.csv arquivo no projeto.
  3. Revise as propriedades do formato do arquivo.
  4. Opcional: clique em Visualizar dados para ver o conjunto de dados completo.
  5. Clique duas vezes no nó Tipo. Este nó especifica as propriedades do campo, como o nível de medição (o tipo de dados que o campo contém) e a função de cada campo como destino ou entrada na modelagem. Certifique-se de que todos os níveis de medição estejam configurados corretamente. Por exemplo, a maioria dos campos com valores de 0.0 e 1.0 pode ser considerada como sinalizadores, mas certos campos, como gênero, são mais precisamente vistos como um campo nominal com dois valores.
    Figura 3. Níveis de medição
    Níveis de medição

    Observe que churn está definido como um sinalizador com uma função de destino. A função para todos os outros campos está definida como Entrada.
  6. Clique duas vezes no nó de modelagem churn (Seleção de recursos) para ver suas propriedades. Você pode usar um nó Seleção de recursos para remover preditores ou dados que não adicionam nenhuma informação útil sobre a relação preditor/alvo.
  7. Passe o mouse sobre o nó churn (Seleção de recursos) e clique no ícone Ícone ExecutarExecutar.
  8. No painel Saídas e modelos, clique no primeiro modelo da lista com o nome churn para visualizar os detalhes do modelo.

Ícone do ponto de verificação Verifique seu progresso

A imagem a seguir mostra os detalhes do modelo. Agora você está pronto para verificar o nó Filtro.

Modelo de visualização: rotatividade

Voltar ao topo

Tarefa 3: Verifique o nó Filtro

Apenas alguns dos dados no arquivo telco.csv de dados são úteis para prever a rotatividade. Você pode usar o filtro para selecionar apenas os dados considerados importantes para uso como preditor (os campos marcados como Importantes no modelo gerado na tarefa anterior). Siga estas etapas para visualizar e verificar o nó Filtro :

  1. Clique duas vezes no nó Recursos importantes (filtro) para ver suas propriedades.
    1. Observe que este nó filtra apenas os campos selecionados: tenure, age, address, income, ed, employ, e mais. Outros campos estão excluídos desta análise.
      Figura 4. Nó de filtro Características importantes
      Nó de filtro Características importantes
    2. Clique em Cancelar.
  2. Clique duas vezes no nó de saída 28 campos (auditoria de dados) após o nó Filtro.
    1. Passe o cursor sobre o nó Auditoria de dados e clique no ícone Ícone ExecutarExecutar.
    2. No painel Saídas e modelos, clique nos resultados com o nome Auditoria de dados para visualizar a saída.
    3. Observe a coluna % Concluído, que pode ser usada para identificar quaisquer campos com grandes quantidades de dados ausentes. Nesse caso, o único campo que você precisa alterar é logtoll, que está menos de 50% completo.
      Figura 5. Saída de 28 campos
      28 Campos de saída
    4. Feche a saída.
  3. Clique duas vezes no supernó Imputação de valores ausentes.
    1. Clique em Exibir supernó.
    2. Clique duas vezes no nó Preencher logtoll (Preenchedor).

      Os nós de preenchimento são usados para substituir valores de campo e alterar o armazenamento. Você pode optar por substituir valores com base em uma condição CLEM especificada, como @BLANK(FIELD). Como alternativa, você pode optar por substituir todos os espaços em branco ou valores nulos por um valor específico. Os nós de preenchimento são frequentemente usados com o nó Tipo para substituir valores ausentes.

      Na seção Preencher campos, você pode especificar os campos do conjunto de dados cujos valores deseja examinar e substituir. Nesse caso, a logtoll coluna é especificada juntamente com uma opção de valores em branco e nulos na seção Substituir.

      Figura 6. Supernó de imputação de valores ausentes com propriedades de preenchimento
      Supernó de imputação de valores ausentes com propriedades de preenchimento
    3. Clique em Voltar ao fluxo anterior.

Ícone do ponto de verificação Verifique seu progresso

A imagem a seguir mostra o fluxo. Agora você está pronto para construir o modelo.

Propriedades do Super Nó

Voltar ao topo

Tarefa 4: Construir o modelo

Você cria um modelo que usa o nó Logístico. Siga estas etapas para construir o modelo:

  1. Clique duas vezes no nó churn (Logística), após o supernó Imputação de valores ausentes, para visualizar suas propriedades.
  2. Na seção Configurações do modelo, selecione o procedimento Binomial.
    • Um modelo binomial é usado quando o campo de destino é um campo de sinalizador ou nominal com dois valores discretos.
    • Um modelo multinomial é utilizado quando o campo de destino é um campo nominal com mais de dois valores.
  3. Em seguida, selecione o método Forward Stepwise.
  4. Na seção Opções avançadas, selecione o modo Avançado.
  5. Clique em Saída. Selecione Em cada etapa, Histórico de iterações e Estimativas de parâmetros e clique em OK.
    Figura 7. Opções de nós logísticos
    Opções de nós logísticos

Ícone do ponto de verificação Verifique seu progresso

A imagem a seguir mostra o fluxo. Agora você está pronto para gerar o modelo.

Nó logístico

Voltar ao topo

Tarefa 5: Gerar o modelo

Siga estas etapas para gerar um nugget de modelo a partir do nó Logístico :

  1. Passe o cursor sobre o nó churn (Logística) e clique no ícone Ícone ExecutarExecutar.
  2. No painel Resultados e modelos, clique no modelo de rotatividade para visualizar os resultados.

A página Variáveis na equação mostra a meta (rotatividade) e as entradas (campos preditores) utilizadas pelo modelo. Esses campos são escolhidos com base no método Forwards Stepwise, e não na lista completa enviada para consideração.

Para avaliar o grau de adequação do modelo aos seus dados, vários diagnósticos estão disponíveis nas configurações do nó especialista quando você está criando o fluxo.

Observe também que esses resultados se baseiam apenas nos dados de treinamento. Para avaliar o desempenho do modelo em outros dados do mundo real, use um nó Partição para separar um subconjunto de registros para fins de teste e validação.

Ícone do ponto de verificação Verifique seu progresso

A imagem a seguir mostra os resultados do modelo.

Figura 8. Variáveis do modelo na tabela de equações
Variáveis do modelo na tabela de equações

Voltar ao topo

Resumo

Este exemplo mostrou como usar dados de uso para prever a perda de clientes (churn) criando um modelo binomial, pois o alvo tem duas categorias distintas.

Próximas etapas

Agora você está pronto para experimentar outros SPSS® Modeler tutoriais.