O que é regressão linear?
Gere previsões usando uma fórmula matemática facilmente interpretada
Explore SPSS Statistics
Ilustração mostrando a relação entre tendências, análise de dados e predição em regressão linear
O que é regressão linear?

A análise de regressão linear é usada para prever o valor de uma variável com base no valor de outra variável. A variável que você deseja prever é chamada de variável dependente. A variável que você está usando para prever o valor da outra variável é chamada de variável independente.

Esta forma de análise estima os coeficientes da equação linear, envolvendo uma ou mais variáveis independentes que melhor preveem o valor da variável dependente. A regressão linear ajusta uma linha reta ou superfície que minimiza as discrepâncias entre os valores de saída previstos e reais. Existem calculadoras de regressão linear simples que utilizam o método dos "mínimos quadrados" para descobrir a linha de melhor ajuste para um conjunto de dados em pares. Em seguida, você estima o valor de X (variável dependente) de Y (variável independente).

Estatísticas SPSS para regressão linear

O IBM SPSS Statistics permite calcular o impacto de um grupo de pontos de dados em um resultado específico e modelar tanto relacionamentos lineares quanto não lineares.

Gere previsões com mais facilidade

É possível executar a regressão linear no Microsoft Excel ou usar pacotes de software estatísticos, como o IBM SPSS Statistics, que simplificam muito o processo de uso de equações de regressão linear, modelos de regressão linear e fórmulas de regressão linear. O SPSS Statistics pode ser utilizado em técnicas como regressão linear simples e regressão linear múltipla.

Você pode executar o método de regressão linear em uma variedade de programas e ambientes, incluindo:

  • Regressão linear R
  • Regressão linear do MATLAB
  • Regressão linear do Sklearn
  • Regressão linear Python
  • Regressão linear do Excel
Por que a regressão linear é importante

Os modelos de regressão linear são relativamente simples e fornecem uma fórmula matemática fácil de interpretar que pode gerar previsões. A regressão linear pode ser aplicada em diversas áreas nos negócios e nos estudos acadêmicos.

Você encontrará que a regressão linear é usada em uma variedade de áreas, desde ciências biológicas, comportamentais, ambientais e sociais até negócios. Os modelos de regressão linear tornaram-se uma maneira comprovada de prever o futuro de forma científica e confiável. Devido à regressão linear ser um procedimento estatístico consolidado, as propriedades dos modelos de regressão linear são bem compreendidas e podem ser treinadas rapidamente.

Uma forma comprovada de prever o futuro de forma científica e confiável

Os líderes empresariais e organizacionais podem tomar decisões melhores usando técnicas de regressão linear. As organizações coletam enormes quantidades de dados, e a regressão linear ajuda a usar esses dados para melhorar o gerenciamento da realidade, em vez de depender apenas de experiência e intuição. Você pode transformar grandes quantidades de dados brutos em informações acionáveis.

Você também pode usar a regressão linear para fornecer insights melhores, descobrindo padrões e relacionamentos que seus colegas de negócios talvez não tenham percebido anteriormente ou pensado que já entendiam. Por exemplo, realizar uma análise de dados de vendas e compras pode ajudar a descobrir padrões específicos de compra em determinados dias ou em certos horários. Os insights coletados da análise de regressão podem ajudar os líderes empresariais a antecipar os momentos em que os produtos de sua empresa estarão em alta demanda.

Saiba mais sobre regressão linear no IBM Knowledge Center
Principais premissas da regressão linear efetiva

Suposições a serem consideradas para o sucesso da análise de regressão linear:

  • Para cada variável: Considere o número de casos válidos, média e desvio padrão. 
  • Para cada modelo: avaliar os coeficientes de regressão, a matriz de correlação, as correlações parciais, R múltiplo, R², R² ajustado, mudança em R², erro padrão da estimativa, tabela de análise de variância, valores previstos e resíduos. Além disso, considere intervalos de confiança de 95% para cada coeficiente de regressão, matriz de variância e covariância, fator de inflação de variância, tolerância, teste de Durbin-Watson, medidas de distância (valores de Mahalanobis, Cook e alavancagem), DfBeta, DfFit, intervalos de previsão e informações diagnósticas caso a caso. 
  • Gráficos: considere gráficos de dispersão, gráficos parciais, histogramas e gráficos de probabilidade normal.
  • Dados: variáveis dependentes e independentes devem ser quantitativas. É necessário recodificar variáveis categóricas, como religião, campo principal de estudo ou região de residência, em variáveis binárias (dummy) ou outros tipos de variáveis de contraste.  
  • Outras premissas: para cada valor da variável independente, a distribuição da variável dependente deve ser normal. A variância da distribuição da variável dependente deve permanecer constante para todos os valores da variável independente. A relação entre a variável dependente e cada variável independente deve ser linear, e todas as observações devem ser independentes.
Experimente o SPSS Statistics sem custo
Certifique-se de que seus dados atendam às suposições da regressão linear.

Antes de tentar realizar uma regressão linear, é necessário garantir que seus dados possam ser analisados utilizando este procedimento. Seus dados devem passar por certas suposições obrigatórias.

Veja como você pode verificar essas suposições:

  1. As variáveis devem ser medidas em um nível contínuo. Exemplos de variáveis contínuas são pontuações de tempo, vendas, peso e teste. 
  2. Use um gráfico de dispersão para descobrir rapidamente se há uma relação linear entre essas duas variáveis.
  3. As observações devem ser independentes umas das outras (isto é, não deve haver dependência).
  4. Seus dados não devem ter valores discrepantes significativos. 
  5. Verifique a homocedasticidade, um conceito estatístico no qual as variâncias ao longo da linha de regressão linear ajustada permanecem semelhantes em toda essa linha.
  6. Os resíduos (erros) da linha de regressão de melhor ajuste seguem a distribuição normal.
Use este tutorial prático para saber mais sobre suposições de dados de regressão linear
Exemplos de sucesso na regressão linear
Avaliando tendências e estimativas de vendas

Você também pode usar a análise de regressão linear para tentar prever as vendas totais anuais de um vendedor (a variável dependente) a partir de variáveis independentes como idade, educação e anos de experiência.

Analisar elasticidade de preços

As mudanças nos preços frequentemente afetam o comportamento do consumidor, e a regressão linear pode ajudar a analisar esse impacto. Por exemplo, se o preço de um produto específico continua mudando, você pode usar análise de regressão para ver se o consumo diminui à medida que o preço aumenta. E se o consumo não cair significativamente à medida que o preço aumenta? Em que ponto de preço os compradores param de comprar o produto? Essas informações seriam muito úteis para líderes em um negócio de varejo.

Avaliar riscos em uma seguradora

Técnicas de regressão linear podem ser usadas para analisar riscos. Por exemplo, uma companhia de seguros pode ter recursos limitados para investigar reclamações de seguro residencial; com a regressão linear, a equipe da empresa pode construir um modelo para estimar os custos das reclamações. A análise pode ajudar os líderes da empresa a tomar decisões importantes sobre quais riscos assumir.

Análise de esportes

A regressão linear nem sempre envolve negócios. Também é importante nos esportes. Por exemplo, você pode se perguntar se o número de jogos ganhos por um time de basquete em uma temporada está relacionado ao número médio de pontos que o time marca por jogo. Um gráfico de dispersão indica que essas variáveis estão linearmente relacionadas. O número de jogos ganhos e a média de pontos marcados pelo oponente também estão linearmente relacionados. Essas variáveis têm uma relação negativa. Conforme o número de jogos vencidos aumenta, a média de pontos marcados pelo adversário diminui. Com a regressão linear, você pode modelar a relação dessas variáveis. Um bom modelo pode ser usado para prever quantos jogos as equipes vão ganhar.

Soluções relacionadas
Software IBM SPSS Statistics

Impulsione a pesquisa e a análise com essa solução rápida e avançada.

Conheça o SPSS Statistics
IBM SPSS Statistics Grad Pack e Faculty Packs

Estudantes, professores e pesquisadores têm acesso acessível a software de análise preditiva.

Explore o SPSS Statistics Grad Pack e Faculty Packs Experimente o SPSS Statistics sem custo
Análise de dados do IBM Cognos

Esta solução analítica comprovada e de autoatendimento ajuda a misturar e combinar seus dados e criar visualizações envolventes.

Explore o Cognos Software
Recursos Os detalhes da regressão linear no IBM Knowledge Center Um exemplo simples de regressão linear em um tutorial gratuito Como usar a regressão linear para modelar vendas de veículos Modelos de regressão variável de seleção de método Sobre a regra do conjunto de regressão linear Estatísticas de regressão linear Gráficos de regressão linear Métodos de seleção de variáveis de regressão linear Salvar novas variáveis, valores previstos, resíduos e outras estatísticas Regressão linear a partir do zero

Descubra como transformar matemática em código e depois executar o código em um conjunto de dados para obter previsões sobre novos dados.

Dê o próximo passo

O IBM SPSS Statistics oferece análise estatística avançada, uma vasta biblioteca de algoritmos de aprendizado de máquina, análise de texto, extensibilidade de código aberto, integração com big data e implementação fácil em aplicativos.

Conheça o SPSS Statistics Experimente sem custo por 30 dias