Criando uma variável categórica a partir de uma variável de escala
Várias variáveis categóricas no arquivo de dados demo.sav são, na verdade, derivadas de variáveis de escala nesse arquivo de dados. Por exemplo, a variável inccat é simplesmente receita agrupada em quatro categorias. Esta variável categórica usa os valores inteiros 1–4 para representar as seguintes categorias de receita (em milhares): menos de $25, $25–$49, $50–$74 e $75 ou mais.
Para criar a variável categórica inccat:
- Nos menus na janela Editor de Dados, escolha:
Na caixa de diálogo Categorização Visual inicial, você seleciona a escala e/ou as variáveis ordinais para as quais deseja criar variáveis novas e categorizadas. Categorização significa escolher dois ou mais valores contíguos e agrupá-los na mesma categoria.
Como Categorização Visual depende de valores reais no arquivo de dados para ajudá-lo a fazer boas escolhas de categorização, é necessário ler o arquivo de dados primeiro. Como isso pode levar algum tempo se seu arquivo de dados contiver um grande número de casos, esta caixa de diálogo inicial também permite limitar o número de casos para leitura ("varredura"). Isso não é necessário para nosso arquivo de dados de amostra. Mesmo que ele contenha mais de 6.000 casos, não demora muito para varrer esse número de casos.
- Arraste e solte Receita
doméstica em milhares [receita] na lista Variáveis na lista
Variáveis a Categorizar e, em seguida, clique em Continuar.
Figura 1. Caixa de diálogo Categorização Visual Principal 
- Na caixa de diálogo Categorização Visual
principal, selecione Receita doméstica em milhares
[receita] na Lista de Variáveis Varridas.
Um histograma exibe a distribuição da variável selecionada (que, neste caso, é altamente defasada).
- Insira inccat2 para o novo nome de variável categorizada e Categoria da receita [em milhares] para o rótulo de variáveis.
- Clique em Fazer Pontos de Corte.
- Selecione Intervalos de Largura Iguais.
- Insira 25 para o primeiro local do ponto de corte, 3 para o número de pontos de corte e 25 para a largura.
O número de categorias de agrupamento é um maior do que o número de pontos de corte. Portanto, neste exemplo, a nova variável categorizada terá quatro categorias, endo que cada uma das primeiras três categorias contém faixas de 25 (mil) e a última contendo todos os valores acima do valor de ponto de corte mais alto de 75 (mil).
- Clique em Aplicar.
Os valores agora exibidos na grade representam os pontos de corte definidos, que são os terminais superiores de cada categoria. As linhas verticais no histograma também indicam os locais dos pontos de corte.
Por padrão, esses valores de ponto de corte são incluídos nas categorias correspondentes. Por exemplo, o primeiro valor de 25 pode incluir todos os valores menores ou iguais a 25. Mas, neste exemplo, queremos categorias que correspondam a menos de 25, 25–49, 50–74 e 75 ou mais.
- No grupo Terminais Superiores, selecione Excluído (<).
- Em seguida, clique em Fazer
Rótulos.
Figura 2. Rótulos de valores gerados automaticamente 
Isso gera automaticamente rótulos de valores descritivos para cada categoria. Como os valores reais designados à nova variável categorizada são simplesmente números inteiros sequenciais começando com 1, os rótulos de valores podem ser muito úteis.
Você também pode inserir manualmente ou alterar pontos de corte e rótulos na grade, alterar locais de pontos de corte arrastando e soltando as linhas dos pontos de corte no histograma e excluir pontos de corte arrastando as linhas de pontos de corte para fora do histograma.
- Clique em OK para criar a variável nova e categorizada.
A nova variável é exibida no Editor de Dados. Como a variável é incluída no final do arquivo, ela é exibida na coluna à extrema direita na Visualização de Dados e na última linha na Visualização de Variável.