Mein IBM Anmelden Abonnieren

Was ist lineare Regression?

Was ist lineare Regression?

Die lineare Regressionsanalyse ist ein mathematisches Verfahren, mit dem Sie den Wert einer Variable basierend auf dem Wert einer anderen Variable vorhersagen können. Die Variable, die Sie vorhersagen möchten, wird dabei als abhängige Variable bezeichnet, während die Variable, die Sie verwenden, um den Wert der anderen Variable vorherzusagen, als unabhängige Variable bezeichnet wird.

Bei dieser Form der Analyse werden die Koeffizienten (also die Werte, mit denen die Variablen multipliziert werden) der linearen Gleichung geschätzt, wobei eine oder mehrere unabhängige Variablen einbezogen werden, die den Wert der abhängigen Variable am besten vorhersagen. Bei der linearen Regression wird eine gerade Linie oder Oberfläche erzeugt, die die Diskrepanzen zwischen vorhergesagten und tatsächlichen Ausgabewerten minimiert. Dafür können einfache Rechenvorgänge für die lineare Regression genutzt werden, die die sogenannte „Methode der kleinsten Quadrate“ anwenden, um die am besten passende Linie für einen Satz von gepaarten Daten zu ermitteln. Diese Linie können Sie im Anschluss verwenden, um ganz einfach den Wert von X (abhängige Variable) aus Y (unabhängige Variable) zu schätzen.

3D-Design aus Kugeln, die auf einer Schiene rollen

Die neuesten Erkenntnisse und Insights zu KI

Entdecken Sie von Experten kuratierte Erkenntnisse und Neuigkeiten zu KI, Cloud und mehr im wöchentlichen Newsletter Think. 

Vorhersagen einfacher generieren

Sie können lineare Regression in Microsoft Excel durchführen oder statistische Softwarepakete wie IBM® SPSS Statistics verwenden, die den Prozess der Verwendung von linearen Regressionsgleichungen, linearen Regressionsmodellen sowie linearen Regressionsformeln deutlich vereinfachen. SPSS Statistics eignet sich beispielsweise perfekt für Techniken wie die einfache lineare Regression und die multiple lineare Regression.

Sie können die lineare Regressionsmethode in einer Vielzahl von Programmen und Umgebungen ausführen, darunter:

  • R
  • MATLAB
  • Sklearn
  • Python
  • Excel
Mixture of Experts | Podcast

KI entschlüsseln: Wöchentlicher Nachrichtenüberblick

Schließen Sie sich unserer erstklassigen Expertenrunde aus Ingenieuren, Forschern, Produktführern und anderen an, die sich durch das KI-Rauschen kämpfen, um Ihnen die neuesten KI-Nachrichten und Erkenntnisse zu liefern.

Warum lineare Regression wichtig ist

Lineare Regressionsmodelle sind verhältnismäßig simpel und erzeugen eine leicht zu interpretierende mathematische Formel, mit der im Handumdrehen Vorhersagen generiert werden können. Dabei ist die lineare Regression vielseitig einsetzbar und kann auf zahlreiche Bereiche angewendet werden, beispielsweise in der Wirtschaft und im akademischen Bereich.

Die lineare Regression wird in praktisch allen Bereichen eingesetzt, von der Biologie über die Verhaltens-, Umwelt- und Sozialwissenschaften bis hin zur Wirtschaft und darüber hinaus. Lineare Regressionsmodelle haben sich zu einer bewährten Möglichkeit entwickelt, zuverlässige und auf wissenschaftlichen Erkenntnissen basierende Zukunftsvorhersagen zu treffen. Da lineare Regression bereits seit langer Zeit als statistisches Verfahren eingesetzt wird, existiert ein umfassendes Wissen über die Eigenschaften linearer Regressionsmodelle, sodass diese sehr schnell erlernt werden können.

Eine bewährte Möglichkeit, die Zukunft wissenschaftlich und zuverlässig vorherzusagen

Führungskräfte von Unternehmen und Organisationen können mithilfe linearer Regressionstechniken bessere und fundiertere Entscheidungen treffen. Unternehmen sammeln massenhaft Daten – und die lineare Regression hilft ihnen, diese Daten zu nutzen, um besser auf die Realität vorbereitet zu sein, anstatt sich auf Erfahrung und Intuition zu verlassen. Auf diese Weise lassen sich große Mengen an Rohdaten in umsetzbare Informationen umwandeln.

Manchmal kann es vorkommen, dass Geschäftskollegen gewisse Muster und Beziehungen aufdecken und davon ausgehen, dass sie diese bereits genauestens verstehen – obwohl sich mithilfe der linearen Regression noch präzisere und umfassendere Erkenntnisse aus ihnen gewinnen ließen. Wenn Sie beispielsweise Verkaufs- und Kaufdaten analysieren, können Sie bestimmte Kaufmuster an bestimmten Tagen oder zu bestimmten Zeiten identifizieren. Dieses Wissen ist bereits überaus wertvoll, doch mit der Regressionsanalyse lassen sich noch tiefgreifendere, umsetzbare Erkenntnisse gewinnen. So könnte sie beispielsweise Führungskräften dabei helfen, die Zeiten vorauszusehen, in denen die Produkte ihres Unternehmens besonders gefragt sein werden. Dieser Blick in die Zukunft hilft Unternehmen langfristig bei der Planung ihrer Strategien und schöpft so das Potenzial der gesammelten Daten vollständig aus.

Wichtige Annahmen einer effektiven linearen Regression

Um den Erfolg der linearen Regressionsanalyse zu gewährleisten, sollte eine Reihe von Annahmen berücksichtigt werden. Bei einigen davon handelt es sich um wichtige Konzepte, die auch für grundlegende Analysen von großer Relevanz sind, andere hingegen sind eher für komplexe, fortgeschrittene Analysen notwendig. Der Vollständigkeit halber finden Sie hier eine Liste der Konzepte, die bei der linearen Regressionsanalyse von Bedeutung sein können:

  • Für jede Variable: Berücksichtigen Sie die Anzahl der gültigen Fälle, Mittelwerte und Standardabweichungen. 
  • Für jedes Modell: Berücksichtigen Sie Regressionskoeffizienten, Korrelationsmatrix, Teil- und Teilkorrelationen, multiple R, R², korrigiertes R², Änderung in R², Standardfehler der Schätzung, Varianzanalysetabelle, vorhergesagte Werte und Residuen. Berücksichtigen Sie außerdem Konfidenzintervalle von 95 % für jeden Regressionskoeffizienten, Varianz-Kovarianz-Matrix, Varianz-Inflationsfaktor, Toleranz, Durbin-Watson-Test, Distanzmesswerte (Mahalanobis-, Cook- und Hebelwerte), DfBeta, DfFit, Vorhersage-Intervalle und fallspezifische Diagnoseinformationen. 
  • Diagramme: Betrachten Sie Streudiagramme, Teildiagramme, Histogramme und Normal-Wahrscheinlichkeitsdiagramme.
  • Daten: Abhängige und unabhängige Variablen sollten quantitativ sein. Kategoriale Variablen wie Religion, Studienschwerpunkt oder Wohnregion müssen in binäre (Schein-)Variablen oder andere Arten von Kontrastvariablen umkodiert werden.
  • Andere Annahmen: Für jeden Wert der unabhängigen Variable muss die Verteilung der abhängigen Variable normal sein. Die Abweichung der Verteilung der abhängigen Variable sollte für alle Werte der unabhängigen Variable konstant sein. Die Beziehungen zwischen der abhängigen Variable und jeder unabhängigen Variable sollten linear und alle Beobachtungen unabhängig sein.

So stellen Sie sicher, dass Ihre Daten die Annahmen der linearen Regression erfüllen

Bevor Sie versuchen, eine lineare Regressionsanalyse durchzuführen, müssen Sie sicherstellen, dass Ihre Daten mit diesem Verfahren analysiert werden können. Dafür sollten Ihre Daten bestimmte erforderliche Annahmen erfüllen.

So können Sie diese Annahmen überprüfen:

  1. Die Variablen sollten auf kontinuierlicher Ebene gemessen werden. Beispiele für kontinuierliche Variablen sind Zeit, Umsatz, Gewicht und Testergebnisse. 
  2. Verwenden Sie ein Streudiagramm, um schnell herauszufinden, ob eine lineare Beziehung zwischen diesen beiden Variablen besteht.
  3. Die Beobachtungen sollten unabhängig voneinander auftreten (d. h. es sollte keine Abhängigkeit geben).
  4. Ihre Daten sollten keine signifikanten Ausreißer aufweisen. 
  5. Prüfen Sie, ob eine sogenannte Homoskedastizität vorliegt. Dabei handelt es sich um ein statistisches Konzept, bei dem die Varianzen entlang der linearen Regressionslinie mit der besten Anpassung über die gesamte Linie hinweg ähnlich bleiben.
  6. Die Residuen (Fehler) der am besten angepassten Regressionsgeraden sollten der Normalverteilung folgen.

Beispiele für erfolgreiche lineare Regressionsanalysen

Bewertung von Trends und Umsatzschätzungen

Sie können mithilfe der linearen Regressionsanalyse versuchen, den jährlichen Gesamtumsatz eines Vertriebsteams (als abhängige Variable) anhand unabhängiger Variablen wie Teamgröße, genutzter Software und der addierten Berufserfahrung der Teammitglieder vorherzusagen. Diese Daten helfen Führungskräften dabei, die Arbeitsweise ihrer Teams zu optimieren und wichtige Entscheidungen zu treffen, für mehr Effizienz und einen höheren Umsatz sorgen.

Analyse der Preiselastizität

Preisänderungen wirken sich häufig auf das Verbraucherverhalten aus – und die lineare Regression kann Ihnen dabei helfen, diesen Effekt zu analysieren. Wenn sich beispielsweise der Preis für ein bestimmtes Produkt ständig ändert, können Sie mithilfe der Regressionsanalyse feststellen, ob der Absatz mit steigendem Preis sinkt. Was ist, wenn er mit steigendem Preis nicht signifikant sinkt? Ab welchem Preis hören Käufer auf, das Produkt zu kaufen? Derartige Informationen sind für Führungskräfte in einem Einzelhandelsunternehmen überaus hilfreich, um die optimale Balance zwischen Preis und Nachfrage zu ermitteln, sind aber nur ein eines von vielen Beispielen, wie Unternehmen im Einzelhandel von linearen Regressionsanalysen profitieren können.

Risikobewertung in einer Versicherungsgesellschaft

Lineare Regressionstechniken können zur Risikoanalyse verwendet werden. Beispielsweise könnte eine Versicherungsgesellschaft nur über begrenzte Ressourcen verfügen, um die Versicherungsansprüche von Hausbesitzern zu untersuchen. Mit der linearen Regression kann das Team des Unternehmens ein Modell zur Schätzung der Schadenkosten erstellen. Die Analyse könnte Unternehmensleitern dabei helfen, wichtige Geschäftsentscheidungen darüber zu treffen, welche Risiken eingegangen werden sollen.

Sportanalyse

Bei der linearen Regression geht es nicht immer ums Geschäft – auch in Bereichen wie dem Sport spielt sie eine wichtige Rolle. Sie könnten sich zum Beispiel fragen, ob die Anzahl der Spiele, die eine Fußballmannschaft in einer Saison gewinnt, mit der durchschnittlichen Anzahl der Tore zusammenhängt, die das Team pro Spiel erzielt. Ein Streudiagramm zeigt an, dass diese Variablen linear zusammenhängen. Die Anzahl der gewonnenen Spiele und die durchschnittliche Anzahl der Tore des gegnerischen Teams hängen ebenfalls linear zusammen. Diese Variablen haben eine negative Beziehung zueinander. Mit zunehmender Anzahl gewonnener Spiele sinkt die durchschnittliche Punktzahl des Gegners. Mithilfe der linearen Regressionsanalyse können Sie die Beziehung dieser Variablen modellieren. Mithilfe eines guten Modells lässt sich vorhersagen, wie viele Spiele die Teams statistisch gewinnen werden.

Weiterführende Lösungen

Weiterführende Lösungen

IBM watsonx.ai

Trainieren, validieren, optimieren und implementieren Sie generative KI, Foundation Models und maschinelle Lernfunktionen mit IBM watsonx.ai, einem Studio der nächsten Generation für AI Builder in Unternehmen. Erstellen Sie KI-Anwendungen mit einem Bruchteil der Zeit und Daten.

Entdecken sie watsonx.ai
Lösungen im Bereich künstlicher Intelligenz

Setzen Sie KI in Ihrem Unternehmen ein – mit branchenführendem Fachwissen im Bereich KI und dem Lösungsportfolio von IBM an Ihrer Seite.

Erkunden Sie KI-Lösungen
KI-Beratung und -Services

Erfinden Sie kritische Workflows und Abläufe neu, indem Sie KI einsetzen, um Erfahrungen, Entscheidungsfindung in Echtzeit und den geschäftlichen Nutzen zu maximieren.

KI-Services entdecken
Machen Sie den nächsten Schritt

Profitieren Sie von einem einheitlichen Zugriff auf Funktionen, die den gesamten Lebenszyklus der KI-Entwicklung abdecken. Erstellen Sie leistungsstarke KI-Lösungen mit benutzerfreundlichen Oberflächen, Workflows und Zugriff auf branchenübliche APIs und SDKs.

watsonx.ai erkunden Live-Demo buchen