My IBM Accedi Iscriviti

Cos'è la regressione lineare?

Cos'è la regressione lineare?

L'analisi della regressione lineare viene utilizzata per prevedere il valore di una variabile in base al valore di un'altra variabile. La variabile che si desidera prevedere è chiamata variabile dipendente. La variabile che si utilizza per prevedere il valore dell'altra variabile è chiamata variabile indipendente.

Questa forma di analisi stima i coefficienti dell'equazione lineare, coinvolgendo una o più variabili indipendenti che meglio prevedono il valore della variabile dipendente. La regressione lineare si inserisce su una linea retta o una superficie che riduce al minimo le discrepanze tra i valori di output previsti e quelli effettivi. Esistono semplici calcolatori di regressione lineare che utilizzano un metodo dei "minimi quadrati" per scoprire la linea più adatta per un insieme di dati abbinati. Quindi si stima il valore di X (variabile dipendente) da Y (variabile indipendente).

Design 3D di palline che rotolano su una pista

Le ultime notizie e insight sull'AI 


Scopri notizie e insight selezionati da esperti in materia di AI, cloud e molto altro nella newsletter settimanale Think. 

Genera previsioni con più facilità

È possibile eseguire la regressione lineare in Microsoft Excel o utilizzare pacchetti software statistici come IBM SPSS Statistics che semplificano notevolmente il processo di utilizzo delle equazioni di regressione lineare, dei modelli di regressione lineare e delle formule di regressione lineare. SPSS Statistics può essere utilizzato in tecniche come la regressione lineare semplice e la regressione lineare multipla.

È possibile eseguire il metodo di regressione lineare in una varietà di programmi e ambienti, tra cui:

  • Regressione lineare R.
  • Regressione lineare MATLAB.
  • Regressione lineare Sklearn.
  • Regressione lineare Python.
  • Regressione lineare Excel.
Mixture of Experts | Podcast

Decoding AI: Weekly News Roundup

Unisciti al nostro gruppo di livello mondiale di ingegneri, ricercatori, leader di prodotto e molti altri mentre si fanno strada nell'enorme quantità di informazioni sull'AI per darti le ultime notizie e gli ultimi insight sull'argomento.

Perché la regressione lineare è importante

I modelli di regressione lineare sono relativamente semplici e forniscono una formula matematica di facile interpretazione in grado di generare previsioni. La regressione lineare può essere applicata a varie aree del business e degli studi accademici.

Scoprirai che la regressione lineare viene utilizzata in tutti i campi, dalle scienze biologiche, comportamentali, ambientali e sociali al business. I modelli di regressione lineare sono diventati un metodo collaudato per prevedere il futuro in modo scientifico e affidabile. Poiché la regressione lineare è una procedura statistica consolidata da tempo, le proprietà dei modelli di regressione lineare sono ben comprese e possono essere addestrate molto rapidamente.

Un modo comprovato per prevedere il futuro in modo scientifico e affidabile

I leader aziendali e delle organizzazioni possono prendere decisioni migliori utilizzando le tecniche di regressione lineare. Le organizzazioni raccolgono grandi quantità di dati e la regressione lineare le aiuta a utilizzarli per gestire meglio la realtà, invece di affidarsi all'esperienza e all'intuizione. Puoi prendere grandi quantità di dati non elaborati e trasformarli in informazioni utilizzabili.

Puoi anche utilizzare la regressione lineare per fornire insight migliori scoprendo modelli e relazioni che i tuoi colleghi di lavoro potrebbero aver visto in precedenza e pensato di aver già compreso. Ad esempio, l'esecuzione di un'analisi dei dati di vendita e acquisto può aiutarti a scoprire modelli di acquisto specifici in giorni o orari specifici. Gli insight raccolti dall'analisi di regressione possono aiutare i leader aziendali a prevedere i momenti in cui i prodotti della loro azienda saranno molto richiesti.

Presupposti chiave di una regressione lineare efficace

Presupposti da considerare per il successo dell'analisi della regressione lineare:

  • Per ciascuna variabile: considerare il numero di casi validi, la media e la deviazione standard. 
  • Per ciascun modello: considerare i coefficienti di regressione, matrice di correlazione, correlazioni di parte e parziali, multiplo R, R2, R2 regolato, modifica in R2, errore standard della stima, tabella analisi varianza, valori previsti e residui. Inoltre, considerare intervalli di confidenza del 95% per ogni coefficiente di regressione, la matrice di varianza-covarianza, il fattore di inflazione della varianza, la tolleranza, il test di Durbin-Watson, le misure di distanza (Mahalanobis, Cook e valori di influenza), DfBeta, DfFit, intervalli di previsione e informazioni di diagnostica casewise. 
  • Grafici: considerare i grafici a dispersione, i grafici parziali, gli istogrammi e i grafici di probabilità normale.
  • Dati: le variabili dipendenti e indipendenti devono essere quantitative. Le variabili categoriali, come religione, campo di studio principale o regione di residenza, devono essere ricodificate in variabili binarie (variabili fittizie) o in altri tipi di variabili di contrasto.
  • Altre ipotesi: per ogni valore della variabile indipendente, la distribuzione della variabile dipendente deve essere normale.La varianza della distribuzione della variabile dipendente deve essere costante per tutti i valori della variabile indipendente. La relazione tra la variabile dipendente e ogni variabile indipendente deve essere lineare e tutte le osservazioni devono essere indipendenti.

Assicurati che i tuoi dati soddisfino i presupposti della regressione lineare

Prima di tentare di eseguire la regressione lineare, è necessario assicurarsi che i dati possano essere analizzati utilizzando questa procedura. I tuoi dati devono superare l'esame per quanto riguarda alcuni presupposti obbligatori.

Ecco come verificare la presenza di questi presupposti:

  1. Le variabili devono essere misurate a livello continuo. Esempi di variabili continue sono il tempo, le vendite, il peso e i punteggi di test. 
  2. Utilizzare un grafico a dispersione per scoprire rapidamente se esiste una relazione lineare tra quelle due variabili.
  3. Le osservazioni dovrebbero essere indipendenti una dall'altra (ovvero non dovrebbe esserci alcuna dipendenza).
  4. I tuoi dati non dovrebbero avere degli outlier significativi. 
  5. Controllare l'omoschedasticità — un concetto statistico secondo cui le varianze lungo la linea di regressione lineare ottimale rimangono simili per tutta la linea.
  6. I residui (errori) della linea di regressione ottimale seguono la distribuzione normale.

Esempi di esito positivo della regressione lineare

Valutare le tendenze e le stime di vendita

Si può anche utilizzare l'analisi di regressione lineare per cercare di prevedere le vendite totali annue di un/a addetto/a alle vendite (la variabile dipendente) da variabili indipendenti quali l'età, la formazione e gli anni di esperienza.

Analizzare l'elasticità dei prezzi

Variazioni nei prezzi spesso incidono sul comportamento dei consumatori, e la regressione lineare può aiutare ad analizzare come. Ad esempio, se il prezzo di un determinato prodotto continua a cambiare, puoi utilizzare l'analisi di regressione per vedere se il consumo diminuisce all'aumentare del prezzo. Cosa succede se il consumo non diminuisce in modo significativo con l'aumento del prezzo? A che punto di prezzo gli acquirenti smettono di acquistare il prodotto? Queste informazioni sarebbero molto utili per i leader di un'azienda di vendita al dettaglio.

Valutare il rischio in una compagnia di assicurazioni

Le tecniche di regressione lineare possono essere utilizzate per analizzare il rischio. Ad esempio, una compagnia di assicurazioni potrebbe avere risorse limitate con le quali indagare sulle richieste di risarcimento assicurativo da parte dei proprietari di case; con la regressione lineare, il team della compagnia può costruire un modello per la stima dei costi delle richieste di risarcimento. L'analisi potrebbe aiutare i leader aziendali a prendere importanti decisioni di business su quali rischi correre.

Analisi dello sport

La regressione lineare non è sempre una questione di business. È importante anche nello sport. Ad esempio, potresti chiederti se il numero di partite vinte da una squadra di basket in una stagione è collegato al numero medio di punti che la squadra mette a segno in ogni partita. Un grafico a dispersione indica che queste variabili sono correlate linearmente. Anche il numero di partite vinte e il numero medio di punti segnati dall'avversario sono correlati linearmente. Queste variabili hanno una relazione negativa. Quando il numero di partite vinte aumenta, il numero medio di punti segnati dall'avversario diminuisce. Con la regressione lineare, è possibile creare un modello della relazione tra queste variabili. Un modello valido potrà essere utilizzato per prevedere quante partite saranno vinte dai vari team.

Soluzioni correlate

Soluzioni correlate

IBM watsonx.ai

Addestra, convalida, adatta e implementa le funzionalità di AI generativa, foundation model e machine learning con IBM watsonx.ai, uno studio aziendale di nuova generazione per builder AI. Crea applicazioni AI in tempi ridotti e con una minima quantità di dati.

Scopri watsonx.ai
Soluzioni di intelligenza artificiale

Metti l'AI al servizio della tua azienda grazie all'esperienza leader di settore e alla gamma di soluzioni di IBM nel campo dell'AI.

Esplora le soluzioni AI
Consulenza e servizi sull'AI

Reinventa i flussi di lavoro e le operazioni critiche aggiungendo l'AI per massimizzare le esperienze, il processo decisionale in tempo reale e il valore di business.

Esplora i servizi AI
Fai il passo successivo

Ottieni l'accesso completo a funzionalità che coprono l'intero ciclo di vita dello sviluppo dell'AI. Crea soluzioni AI all'avanguardia con interfacce intuitive, workflow e accesso alle API e agli SDK standard di settore.

Esplora watsonx.ai Prenota una demo live